- 运行环境:PC-windows操作系统
- 软件语言:简体中文|授权方式:绿色最新版
- 软件类型:国产软件 - 源码模版 - 插件辅助
- 软件大小:5.20 MB
- 下载星级:
- 软件官网:暂无
- 更新时间:2018/7/31 9:18:27
【软件截图】

【基本介绍】
一款轻量级采集软件, 用于快速采集、下载网页数据信息。 该软件很快。 、易于使用、免费。 支持智能采集(无规则)、可视化采集(无需查看源文件程序), 支持二次开发、分布式部署。 为用户的大数据分析、信息平台, 提供稳定stable的、连续、准确的数据资源。
特征
1、采集强度
支持JS解析、 POST分页、登录获取、跨层获取。 故障排除页面有成熟的解决处理方案。
2、快
就在支持多任务的同一个时间, 每个任务都可以能够布置设置为多线程, 以确保运营效率。
3、比例
支持任务多级分类、批量管理。 支持云服务器分布式部署, 管理员 (Administrator)团队协作。
4、进程
支持定时采集, 任务定时全自动启动。 可以通过二次开发, 简化信息采集、信息处理。
5、稳定运行
系统system运行稳定, 有请求需要“0 bug”。 重新设计design登录页面后, 系统会自动通知管理员。
6、准确度
自已来定义任务后, 集合的准确性可以达到100%, 即一个不泄漏。
网络net神采新版改进:
更新日志
1、增加定期重新启动软件功能。
2、修复bug:定时采集启动任务时会进队列2次。
3、增加设置:特殊结果设置 -> 记录任务名称。
4、修复bug:Win7下启动服务IO异常。
5、按任务统计插件(应用程序接口程序)。
6、修复bug:文本查看器切换到空白单元格会出错。
7、如果不下载文件, 一定不要再生成子目录(即便选中设置)。
8、F9运行文件夹下所有任务后, 子文件夹的任务状态没有改变。
9、修复bug:访问休息间隔设置为“0-1秒”时失效。
10、处理JS中的相对地址时, 可识别“'”前面的转义符“\”。
11、发生 Worker Thread Error 的异常时, 可记录异常的详细内容。
12、读取网址时出错后, 可暂停任务。
13、发生 Worker Thread Error 的异常时, 任务可暂停;若暂停失败, 则停止stop任务。
14、修复bug:继续任务时, 如果任务进入任务队列, 则会重新现在开始任务。
15、停止任务, 同样要写日志。
16、改进了任务队列的查询算法。
17、改进了机器码的可读性。
18、Worker Thread Error: 引起类型为“System.OutOfMemoryException”的异常。 该异常发生后, 可暂停任务。
19、保存“提取网址”时如果出错, 可恢复。
20、增加设置:如果“使用插件处理采集结果数据行”失败(即返回“false”), 仍显示采集结果。
21、废弃设置:关闭软件时, 如果有软件正在运行, 强制停止所有任务。
22、改进“源文件查看器”用户体验3处:Cookie变化、粘贴POST参数时自动分离、菜单快捷键。
23、捕获地址时, 如果某个参数有变化, 文本框背景色则变红。
24、将检查“关键规则”调整到“采集结果筛选”之前。
25、更新插件接口(IBget 3.4), 更新内容:CheckSchedule、Create 新增参数:lastTaskState、lastPausingReason。
26、请求休息间隔, 支持随机数。
27、请求重试可以设置为无限次数, 同一时间内增加“重试休息间隔”、“重试错误范围”设置。
28、任务增加设置:动作失败后不暂停任务。
29、下载文件时, 只请求一次。
30、运行整个文件夹的任务时, 增加快捷键:F9。
31、修复bug:批量暂停正在启动的任务时, 会有“运行中”状态闪过。
32、解决:运行信息窗口资源释放问题。
33、使用插件处理结果数据行后, 如果返回false, 则数据行不会再显示。
34、循环采集拆分字符串数组时, 保留空值。
35、修复内存bug一处。
36、修复bug:查看等待区出错:集合已修改;有可能再也不能够执行枚举操作。
37、修复bug:由于插件日志回调事件, 会引发异常:远程对象已断开。
38、修复bug:设置窗口如果不操作, 2分钟后会抛异常:远程对象已断开。
39、更新插件接口(IBget 3.3), 更新内容:ExtractResult 新增参数:rowIndex;Create 新增参数:supportAsyncCall。
40、建造插件时如果出错, 任务不再提示连载数据库(称数据集合)。
41、特殊结果 -》 记录当前网址, 如果有POST参数, 则包含在其中。
42、修复bug:任务完成后取消定时采集, 在选中“使用插件检查定时采集”时仍起作用。
43、修复bug:源文件查看器预览功能, 不能够预览框架页。
44、增加复制采集规则功能。
45、提取下一网址时, 如果与网址队列重复, 则提示:提取 n 条, 已去重.
46、连续提取下一层网址失败已达到 n 次后, 不再提取下一页网址, 不然下次请求时会重复提取。
47、修复几处内存溢出问题。
48、修复bug:文本查看器 html 方式查看, 关闭窗口后, 再打开出错“未将对象引用设置到实例”。
49、改进定时采集检查思路:取当前时间并缓存, 这样就没有了定时偏差。