欢迎您访问广州瞬速信息科技有限公司
网络新闻采集
适合于大批量、高精度的网络新闻内容采集,可以快速配置多级新闻分类,可实时跟进某个或某些网站的最新更新的新闻内容,使用方式简单,无需复杂的配置
  • 支持智能识别新闻网页的正文内容
  • 支持自动识别新闻内容中的相关图片
  • 支持分布于多页的新闻内容自动重组
  • 支持自动识别新闻内容的发表时间
  • 支持自动识别新闻内容的原始作者
  • 支持自动识别新闻内容的发表来源
  • 支持通过关键字在搜索引擎上搜集相关新闻
  • 支持相关的图片文件下载到本地文件夹
  • 支持保留新闻内容的文字风格等
  • 支持繁体新闻转换为简体新闻
  • 支持外文新闻翻译为简体中文


网络新闻采集示例

定制表单数据分类采集
支持用户自定义数据表单,并按自定义的表单结果配置相应的采集网站,从而可以快速达到对目标网站的网页内容进行结构化的信息存储,并可以对采集的数据进行多级分类管理
  • 支持对采集的数据作无限级的分类采集
  • 支持通过前后标识符的形式对数据进行抽取
  • 支持数据分布在列表页面上的信息进行抽取
  • 支持通过正则表达式的形式对信息进行抽取
  • 支持通过网页元素选择的形式对信息设置抽取
  • 支持对字段内的内容设置是否下载相关的附件
  • 支持对采集的数据作全库多字段组合查重
  • 支持对目标网站的数据作增量的形式采集
  • 支持通过网页元素选择的形式对信息设置抽取
  • 支持多线程并发的形式也可以支持缓慢的形式采集


学术期刊信息采集示例


机票价格信息采集示例-—某合作单位的数据采集


酒店房型信息采集示例-早期某酒店网站运营


游戏点卡信息采集示例-某游戏运营商


期刊引用信息采集示例-某期刊分析机构

  • 地址: 广州市天河区员村四横路石东商务中心918
  • 电话: 020-2903 9615
  • 手机: 13533909695
  • QQ: 747484429
  • 邮箱: 747484429@qq.com
广州瞬速信息科技有限公司 版权所有 粤ICP备10220963号 站点地图 Copyright © 2017 SunShotTech. All Rights Reserved
13533909695
020-29039615