极光下载站 - 打造齐全的绿色软件家园

极光下载站

当前位置:极光下载站 > 网络软件 > 下载工具 > 爬山虎采集器 v3.0.3.9 官方版
爬山虎采集器

爬山虎采集器

v3.0.3.9 官方版
  • 软件大小:60.4 MB
  • 软件语言:简体中文
  • 更新时间:2022-11-01
  • 软件类型:国产软件 / 下载工具
  • 运行环境:WinXP, Win7, Win8, Win10, WinAll
  • 软件授权:免费软件
  • 官方主页:https://www.51pashanhu.com/docs/export/
  • 软件等级 :
  • 介绍说明
  • 下载地址
  • 精品推荐
  • 相关软件
  • 网友评论

  爬山虎采集器是一款数据采集软件,可以帮助用户自动采集网络上的资源,将资源地址复制到软件就可以按照步骤采集数据,最后将采集的数据下载到电脑上保存使用,例如可以直接对京东商品列表采集,可以对京东商品评论采集,也可以采集新闻,支持采集博客园新闻、采集新浪新闻采集,让用户可以轻松获取指定网站上的内容,批量采集数据到电脑继续使用,这款软件使用还是比较简单的,启动软件就可以新建采集任务,输入采集地址就可以按照步骤执行下一步,操作过程还是很简单的,按照引导步骤就可以执行采集任务,需要就下载吧!

软件功能

  1、使用点击式界面,在几分钟内从任何网站抓取数据。

  2、适用于各种网站,能够采集互联网99%的网站,包括单页应用、Ajax加载等等动态类型网站

  3、支持各种结构的网页数据,并且保存到Txt、excel以及数据库中。

  4、它能够采集互联网上的大部分网站数据,并且将数据导出为各种格式的文件或者数据库,比如csv、excel、mysql、sqlserver、sqlite、access,甚至可以通过指定接口发布到你的网站。

  5、快速高效,内置一套高速浏览器内核,加上HTTP引擎模式,实现快速采集数据

  6、自动识别列表数据,通过智能算法,一键提取数据。

  7、自动识别分页技术,通过算法智能识别、采集分页数据

  8、混合浏览器引擎和HTTP引擎,兼顾了易用性和效率。

软件特色

  1、爬山虎采集器可以轻松采集网页上的数据,在软件新建任务就可以开始采集

  2、可以对多个站点内容采集,直接在软件输入多个地址一次采集

  3、支持查看采集的页面,软件自动读取网页上的内容,将可采集的内容显示在列表

  4、可以设置过滤方式,删除不需要采集的内容

  5、大部分网站都可以采集。可以采集需要登录的网站

  6、支持多个页面识别,如果你输入的地址有多个页面就可以自动识别分页内容

  7、可以在软件选择对页面上的图像下载,可以选择对数据处理

  8、支持文本替换、正则匹配、清除HTML标签、添加前后缀、字符转码、执行JavaScript等数据处理功能

  9、支持执行C#代码、正文提取、字符映射、HTTP请求等数据处理功能

  10、支持过滤设置:修改名称、删除字段、选择元素、添动加新元素、手动设置XPatl、设置取值属性

  11、支持文件下载、使用自定义值、增量更新、取值属性、浏览器引擎和HTTP引|擎、POST请求等功能

  12、支持自定义数据、批量生成起始网址、来集前执行脚本、JSON数据来集

使用说明

  1、将爬山虎采集器直接安装到电脑,等待软件安装结束

  2、可以选择简易采集,可以选择自定义采集

  3、进入简易采集界面,这里是软件的其他功能界面,如果有需要就可以点击使用

  4、点击新建任务就可以进入地址设置界面,将需要采集的地址输入到软件,点击下一步

  5、这里是数据抓取的界面,自动识别当前的网页内容,如果识别到数据就在软件底部列表显示,点击下一步

  6、设置一些采集的参数,支持浏览器设置,支持代理服务器设置,支持自动采集计划任务设置

  7、开始采集,软件自动分区页面上可以采集的数据,等待采集结束就可以导出数据

  8、淘宝商品搜索

  按照输入的关键词,采集淘宝商品搜索的结果数据。包含商品标题、链接、价格、付款人数店铺名称、位置字段。

  9、如果对软件不了解可以点击帮助文档查看官方提供的教程,从而学习各种功能的操作方式

  10、任务运行时不显示窗口、任务完成之后关闭窗口、任务运行窗口最大化

  任务并行数量15

  网页超时设置30(秒)

  运行日志保存最近3(天)

  11、记住软件窗口大小

  跳过已下载文件

  支持https tls 1.2协议

  文件下载线程数:8

官方教程

  数据导出

  爬山虎采集器支持多个格式的数据导出(发布),包括TXT、CSV、Excel、Access、MySQL、SQLServer、SQLite以及发布到网站接口(Api)。

  导出方式有2种:

  手动导出,通过右击任务-> 导出任务,或者是在查看数据中导出。

  自动导出,在编辑任务的第三步中设置导出。

  在数据导出后,会被标记为已导出,在下次导出时,不会再导出。 如果想要导出全部数据,而不区分已导出,可以在查看数据中选择导出全部。

  导出到Excel、CSV、TXT

  可以将数据导出到Excel、CSV、TXT文件中,每次导出将会生成新的文件。 软件支持对导出的文件名设置变量,目前有2种格式变量,按照任务名和日期格式。

  导出TXT目前支持一条记录保存为一个文件。可以根据字段值来定义文件名称,导出的内容格式也可以自定义模板

爬山虎采集器(1)

下载地址

  • Pc版

爬山虎采集器 v3.0.3.9 官方版

查看所有评论+

网友评论

网友
您的评论需要经过审核才能显示

本类排名

本类推荐

相关资讯