数码资源网·下载

展开

火车采集器

大小:33.10M语言:33.10M 类别:网络辅助系统:WinXP,WinAll
简介|文章|评论
版本:(LocoySpider) v8.3 绿色免费版 for WinXP,WinAll时间:2020-04-02
软件介绍

选一款功能强大的网络数据信息挖掘工具是很重要滴,相信火车采集(LocoySpider)就是你最好的选择了,本款网页采集器有着灵活的配置,可以轻松抓取网页图片、文字和文件。火车采集器还支持远程下载图片文件、探测文件真实地址、放到连接采集、网站登陆后信息采集,火车采集器的功能太多了,需要的用户下载来体验吧。

火车采集器

火车采集器特点:

稳定、高效
五年磨一剑,软件不断更新进步,采集速度快,性能稳定,占用资源少

通用性强
无论新闻、论坛、视频、黄页、图片、下载类网站,只要通过浏览器能看到的结构化的内容,通过指定匹配规则,都能采集到您所需要的内容

扩展性强、适用范围广
自定义web发布,自定义主流的数据库的保存和发布,自定义本地php及.net外部编程接口处理数据,让数据都能为你所用

火车采集器功能:

结果替换,可以将采集的结果根据规则替换成你定义的内容
采集范围限制,可以根据采集的深度和网址的标识来限制采集的范围
规则自定义,通过采集规则的定义,可以搜索所有网站采集几乎任何类型的信息
多任务,多线程,可以同时进行多个信息采集任务,每个任务可以使用多个线程
断点续采,信息采集任务可以在停止后从断点开始继续采集,从此你用不再担心你的采集任务意外中断了
网站登录,支持网站Cookie,支持网站可视化登录,即使登录时需要验证码的网站也能采集
计划任务,通过这个功能可以让你的采集任务定时、定量或者一直循环执行
预留编程接口,定义多个编程接口,用户可以在事件中利用PHP,C#语言进行编程,扩充采集功能
过滤重复内容,软件可根据用户设置和实际情况对重复内容和重复网址自动删除重复内容
特殊链接识别,运用此功能可以将用JavaScript动态生成的链接或其他更古怪的连接识别出来
文件下载,可以将采集到的二进制文件(诸如:图片、音乐、软件、文档等等)下载到本地磁盘或者采集结果数据库中
条件保存,可以根据某个条件来决定那些信息保存,那些信息过滤目标发布媒体包括:数据库(access, sql server,my sql,oracle) ,静态htm文件
所见即所得,任务采集过程所见即所得,过程中遍历的链接信息、采集信息、错误信息等都会及时的反映在软件界面中
数据保存,数据边采集边自动保存到关系数据库中,并且数据结构能够自动适应,软件可以根据采集规则自动创建数据库,以及其中的表和字段,也可以通过导库方式灵活的将数据保存到客户已有的数据库结构中
数据发布,可以通过自定义接口,将已采集的结果数据发布到任意的内容管理系统和指定数据库中。现在已支持的
本地编辑,本地可视化编辑已采集的数据
支持所有网站编码,完美支持采集所有编码格式的网页,程序还可以自动识别网页编码
采集测试,这是其它任何同类采集软件所不能比的,程序支持直接查看采集结果并测试发布
管理方便,使用站点+任务方式管理采集节点,任务支持批量操作,再多的数据管理也很轻松
全自动,无人值守工作,配置好程序后,程序将依据您的设置自动运行,完全无需人工干预
多种发布方式,支持目前所有主流和非主流的CMS,BBS等网站程序,通过系统的发布模块能实现采集器和网站程序间的完美结合

火车采集器更新内容:

增加任务规则异常报警功能
修复高dpi下采集器登录界面错位的问题
修复中文分词存在的问题
修复任务完成后不能关机的问题
修复文件下载中存在的一些问题
修复边采集发布为excel 无内容的bug
修复二级代理 Session中url的组合错误
升级插件内核心,增加伪原创等插件
生成Word和Excel可选2007和2003格式
添加了批量关闭已完成任务窗口功能

加载全部内容

相关应用
热门推荐
相关教程
相关合集
本类排行