数码资源网·下载

展开

web数据采集软件(Octoparse)

大小:62M语言:62M 类别:网络辅助系统:WinXP/Win7/Win10
简介|文章|评论
版本:v8.1.10 for WinXP/Win7/Win10时间:2020-06-23
软件介绍

web数据采集软件(Octoparse)是一款专业且优秀的数据采集软件,该软件拥有先进的网页抓取功能,无需编码就能快速手机web数据,而且只要单击一下就能将网页转化为结构化电子表格,非常智能快捷!

【功能特点】

视觉点和点击界面

WebHarvy是一个可视化的网页提取工具。其实完全没有必要编写任何脚本或代码用来提取数据。使用WebHarvy的内置浏览器浏览网页。您可以选择用鼠标点击来提取数据。它是那么容易!

智能识别模式

自动识别网页中出现的数据模式。所以,如果你需要从一个网页刮项目(姓名,地址,电子邮件,价格等)的列表,你不需要做任何额外的配置。如果数据重复,WebHarvy会自动刮。

导出捕获的数据

可以保存从各种格式的网页中提取的数据。 WebHarvy网站刮板的当前版本允许你导出的刮数据作为XML,CSV,JSON或TSV文件。您还可以刮下数据导出到一个SQL数据库。

从多个页面提取

通常网页显示数据,如在多个页面中的产品目录。 WebHarvy可以自动抓取并从多个网页中提取数据。只是指出了“链接到下一页'和WebHarvy网站刮板将自动刮从所有页面的数据。

基于关键字的提取

基于关键字的提取可让您捕捉从搜索结果页面输入关键字的列表数据。您创建的配置将被自动重复所有给定输入关键字,而挖掘的数据。可以指定任意数量的输入关键字

通过代{过}{滤}理服务器提取

提取匿名和防止提取网络软件被封锁的Web服务器,您必须通过代{过}{滤}理服务器访问目标网站的选项。可以使用一个单一的代{过}{滤}理服务器地址或代{过}{滤}理服务器的地址列表。

提取分类

WebHarvy网站刮板允许您从一个链接列表,从而导致一个网站内的相似页面抽取数据。这使您可以使用一个单一的配置刮网站内的类别或小节。

使用正则表达式提取

WebHarvy可以应用正则表达式(正则表达式)在文本或网页的HTML源代码,并提取去匹配的部分。这种强大的技术为您提供了更多的灵活性,同时拼抢的数据。

【软件特色】

先进的网页抓取功能

你所需要的一切,以自动化你的网络刮擦。

使用方便

用简单的点和点击刮取所有数据。

无需编码。

处理所有网站

搜刮网站,无限滚动。

登录、下拉、AJAX...

下载结果

以CSV、Excel、API的形式下载搜刮的数据。

或保存到数据库中。

云端服务

在八爪鱼云平台上24小时不间断地搜刮和访问数据。

刮痧

安排任务在任何特定时间刮。

每小时、每天、每周...

IP轮换

自动旋转IP,防止IP

从被封锁。

【常见问题答疑】

如何输入关键字列表并抓取搜索结果?

使用Octoparse,您可以轻松地在搜索框中添加 要搜索的关键字列表,然后从搜索结果中捕获数据 。无需一一手动输入关键字进行搜索。

常规工作流包括两个主要部分:

1)搜索关键字列表 。

2)提取搜索结果。

【更新日志】

1、主要更新

-更好的体验:全新的软件设计,更稳定、更流畅的数据采集体验。卡滞、慢的问题会得到改善。

-改进的网站兼容性:核心渲染浏览器已经从Firefox升级到Chrome,具有更好的兼容性。

-更快的提取速度:显著提高了本地运行的速度。

-更加简洁的UI交互:界面更加简洁,工作流逻辑更加清晰。

2、笔记

-您可以在设备上同时安装8.1版和7版。

-支持Windows 7及更高版本(仅支持x64位系统)。如果您使用的是Windows XP或x32位系统,请下载7.3.0版。

-云服务器仍在版本7之下。版本8.1中配置的某些任务可能无法在云中正常运行。

3、删除的功能

-向导模式(即将合并为“高级模式”)

4、即将推出的功能

-数据导出为JSON格式

-XPath工具

加载全部内容

相关应用
热门推荐
相关教程
猜你喜欢
网络工具

网络工具

网络工具即是一个控制网络的操作系统。LNS基于客户/服务器结...
进入专区>>
站长工具

站长工具

站长建站时用于对网站质量查询与制作帮助的一些工具,简称站长工...
进入专区>>
相关合集
本类排行