《瞬速网络信息采集系统》是一款功能强大、简单实用的互联网信息采集软件。互联网上信息种类繁多,瞬间万变,扩大了我们获取信息来源的同时,也带来了利用互联网上的信息麻烦。我们需不断地手工刷新目标网站的信息,而且对于一些网站信息变化速度快的网站,我们经常得不到感兴趣的信息,就需要通过目标网站提供的站内搜索或互联网搜索引擎去获取。
《瞬速网络信息采集系统》基于VC语言编写客户端的模式搭建,无需WEB或.net等臃肿的架构,且占用系统资源少。独创的阅读模板技术,可以使用采集后的内容马上可以阅读展现,真正实现了所采即所得的。
点击“频道导航”下的“新闻采集”频道,右键弹出菜单,点击菜弹中的“新建频道”
选择刚新加的频道“测试新闻采集”, 点击右键,在弹出的菜单中选择“添加采集任务”
点击刚才新建的频道“测试新闻采集”,右键点击,弹出菜单我们选择“扫描采集任务”
智能识别是瞬速软件经过多年的潜心研究的核心技术
正则表达式是处理字符串匹配的一种简便方法,能实现快速字符串的模糊匹配
软件中预设了多种特定值的提取规则,以供你选择使用
标识符可以是任意字符(如HTML标签、汉字、英文字母等),同时还可以设置是否包含前后标识符。
软件可以将采集到的内容存储在用户的数据库内,并且可以进行登录、打开、压缩、关闭等功能操作
信息采集表单等同于数据库中的表,而软件内的表单管理模块能让用户更轻松的对表单进行创建、修改、删除、浏览等功能操作
软件可以将采集到的内容通过不同的频道来浏览,并且可以进行修改、删除、隐藏、刷新、清空频道以及修改频道分类和频道内容过滤等功能操作
软件可以通过采集任务管理模块对站点、采集任务、搜索引擎、附件下载等进行多种管理操作,并且还有自动采集管理、备份所有站点以及恢复采集配置等功能
软件具有批量删除记录、查找表单记录、记录导入导出、浏览记录原文、记录附件管理等多种管理操作,让您轻松整理那些需要的或者已经不需要的采集内容
只需输入待采集目标网站的地址或某个主题页面地址,软件即会自动学习网站的风格,并自动提取网站的资讯,无需配置模板,目标网站风格发生变化,软件自动学习。
只要输入目标网站的网址就可以自动监测并采集目标网站上最新的资讯信息,自动过滤掉无关的信息(如广告信息、版权信息等)达到了所采即所得的效果。
只要输入一个起始地址,软件即会自动识别网站的组织结构,自动识别网站的编码;自动识别与资讯信息相关的图片、附件等感兴趣的媒体资源,并可根据设置自动采集到本地或是建立映射快照;鉴于互联网信息的知识产权的重要性,软件在采集资讯信息的同时会自动识别资讯信息的起始作者和来源等信息,解决了信息引用版权问题。
对于初次采集目标网站,软件支持完全采集;而对于已采集过的站点支持增量采集。自动检测站点是否发生更新,并不会遗漏任何一个重要的信息。
对于从多个目标站点采集的信息,可以设置自动查重,绝不会出现类似的信息。
软件支持需要登录与需要验证码的网站信息采集,采集过程完全仿人工。对于分置于多页的资讯信息,软件具有自动重组功能,省却了翻页的时间。
历经多次改造的《瞬速网络信息采集系统》底层模块运行稳定、采集速度快,占用系统资源少。可多线程并发运行,而不占有过多的系统资源。采集速度快到瞬间到位。软件完全可以实现7*24小时不间断无人值守的信息采集。更多细节功能有待于您在使用中去体验。
《瞬速网络信息采集系统》上线至今已经八年有余了,经历了多个版本的升级,不但增加了数种提高采集效率的功能,还删改了一些不必要的功能和几处BUG,以及对一些常用功能的效果增强,而且对于采集效率以及操作界面进行了数次优化。不仅使得软件的画面更加简洁明了,功能更加全面,使用起来也是更加的方便快捷。
《瞬速网络信息采集系统》支持需要登录与需要验证码的网站信息采集,采集过程完全仿人工。对于携带有图片或媒体文件如mp3等文件的信息,软件可以自动识别出相关的媒体文件,并根据设置进行 采集或建立链接映射。对于无关的信息(如广告信息、版权信息等),软件可以自动进行过滤,达到99%以上的采集数据都是有效数据。
配置简单、所见所得 | 支持多种语言:支持简体中文、繁体中文、英文、日文、韩文等多国语言 |
支持多种编码:GBK、BIG5、UNICODE、UTF8,软件会自动转换 | 支持多种站点类型:包括html与rss |
登录、验证后采集 | 支持附件采集,包括图片、文档、流媒体附件 |
增量采集与自动更新 | 支持关键字采集,直接输入关键字,一步设置 |
完全结构化抽取 | 采集结果自动排重 |
数据保存到本地,您可以随时查阅信息 | 信息导入导出随心所欲,可以导出到如Access、Excel、Sql server、Mysql、 Oracle等主流数据库 |
智能采集搜索引擎的搜索结果 | 内置强大的信息监控与站点管理工具 |
支持阅读模板 | 多线层、多任务 |
支持海量数据采集 | 软件运行稳定、采集速度快、占用系统资源少 |
软件实用、易用、功能强大 | 可移植、可扩展、可定制 |
功能列表 | 标准版 | 专业版 | 网页版 |
---|---|---|---|
采集模块 | |||
多种语言支持 | 简、英 | 简、繁、英 | 简、繁、英、日、韩、少数民族语言 |
支持多种格式的编码:GBK、BIG5、UNICODE、UTF8,软件自动转换 | |||
相关图片自动下载到本地 | |||
支持静态网页网站(.htm, .html, .shtml) | |||
支持动态网页网站(ASP,ASP.NET, PHP,JSP, CFM, CGI…) | |||
支持Web 2.0 AJAX 动态网站 | |||
支持采用了防盗链措施的网站 | |||
支持采用了HTTPS通信加密的网站 | |||
支持对查询次数限制作了限制的网站 | |||
支持用户名、密码、验证码、需回复的自动登陆 | |||
支持采集提取特殊链接地址的网站 | |||
支持从纯文本类的信息采集 | |||
支持海量信息采集,可下载各种类型文件 | |||
数据增量采集,支持自动、实时更新 | |||
支持每类采集信息的自定义来源和分类 | |||
支持智能采集功能,可以将内容中嵌入的所有无关部分如广告去除 | |||
支持多页面文章内容自动抽取与合并 | |||
支持记录唯一索引,避免相同信息重复入库 | |||
支持对RSS页面的解析 | |||
支持需要POST数据采集 | |||
支持按列表的分页采集 | |||
支持境外网站的采集 | |||
支持简体转繁体,繁体转简体 | |||
支持内外网数据同步存储 | |||
支持相关图片入库 | |||
支持图片先压缩再入库 | |||
支持自定义添加采集网站 | |||
支持自定义添加采集网站的采集深度 | 2 | 5 | 不限 |
支持按采集站点的重要级别调度采集站点 | |||
智能识别 | |||
支持一键式采集新闻网站(如只需输入新浪网汽车频道地址就可以采集) | |||
支持通过关键字搜集并采集(如在整个网络上搜集汽车的新闻并采集) | |||
支持定向搜集并采集相关的新闻(如在新浪网上搜集汽车的新闻并采集) | |||
支持分布于多页的新闻进行自动重组整合成一篇文章 | |||
自动识别文章正文中的图片并剥离掉无关的图片 | |||
支持自动识别文章作者、来源、发布日期等 | |||
支持动态升级全网搜索采集引擎 | |||
数据管理 | |||
支持数据导入/导出 | |||
支持大型数据库如(ORACLE/SQLSERVER/MYSQL/SYBASE等) | Access | 不限 | 不限 |
支持批量删除已过期或已阅读的数据 | |||
支持数据自行编辑 | |||
支持对数据的附件进行管理 | |||
支持自定义数据表单的字段数量 | 20个以内 | 30个以内 | 不限 |
支持多字段组合式查重 | 2个字段 | 5个字段 | 10个字段 |
其他功能 | |||
软件升级 | 1年 | 1年 | 1年 |
售后技术支持 |