懒人采集器提供网页资源采集功能,方便用户从网络上采集自己需要的各种数据,软件界面显示简单采集引导模式,显示自定义配置模式,可以按照自己的需求配置采集任务,结合软件的浏览器功能可以直接在采集页面查看网页内容,直接打开原始网页内容,轻松添加自己需要采集的内容并下载,软件不需要分析网页源代码,不需要设置复杂的变量数据,按照软件的采集任务制作步骤导入网址就可以执行采集,为用户采集网络数据提供帮助,需要就下载吧!
1、懒人采集器提供数据采集功能,可以通过这款软件快速采集网络数据
2、可以在软件自定义采集范围,输入网址就可以执行采集
3、支持批量导入网址,直接从TXT文本导入预先准备的网址
4、支持范围设置功能,如果是连续的网址也可以在软件上设置数字范围
5、支持登录功能,添加的网址都可以在软件查看,如果网站需要登录才能范围,可以直接在软件登录
6、支持列表查看功能,采集的列表会在软件界面显示,方便用户删除不需要的内容
7、可以通过设置字段规则的方式删除一些不需要采集的内容,也可以过滤重复的内容
8、支持变量设置功能,如果你会设置变量规则就可以在软件添加
9、支持HTTP Header设置:使用HTTP引擎或JSON引擎请求数据时将引用以下Header
10、支持IP切换功能,采集的时候可以选择拨号切换IP地址
11、开启广告屏蔽:使用系统屏蔽规则、自定义屏蔽规则,可屏蔽任意不想加载的js、css、图片等文件
1.软件操作简单,可通过鼠标点击的方式轻松选取要抓取的内容;
2.支持三种高速引擎:浏览器引擎、HTTP引擎、JSON引擎,内置优化后的火狐浏览器,加上独创的内存优化使浏览器采集也可以高速运行,甚至可以快速转换为HTTP方式运行,享受更高的采集速度!而在抓取JSON数据时,同样可以使用浏览器可视化方式,通过鼠标点选需要抓取的内容,完全不需要去分析JSON数据结构,使非网页专业设计人士也可以轻松抓取需要的数据;
3.不用分析网页请求和源代码,却支持更多的网页采集;
4.先进的智能算法,可以一键生成目标元素XPATH、自动识别网页列表、自动识别分页中的下一页按钮……
5.支持丰富的数据导出方式,可以导出为txt文件、html文件、csv文件、excel文件,也可以导出到已有的数据库,如sqlite数据库、access数据库、sqlserver数据库、mysql数据库,通过向导的方式简单映射字段,即可轻松导出到目标网站数据库中。
1、将软件直接安装到d:懒人采集器Chrome版
2、显示软件的安装进度条,等等主程序安装结束吧
3、如图所示,进入软件可以打开官方的案例教程,查看如何采集新闻
4、进入任务配置界面,第一步添加网址内容,将需要采集的网址复制到软件,一行一个
5、配置界面,可以在这里登录你需要采集的网址,随后读取采集的内容
6、变量设置功能,如果你会编辑变量参数就可以直接在软件添加
7、其他设置内容:禁止弹窗、禁用图片、禁用JS、禁用Flash、禁用框架
8、HTTP记录界面,可以在这里显示全部请求的地址,可以保存当前的任务
9、您可以阅读官方的帮助文档,可以阅读视频教程,轻松学习采集方式
10、激活软件,登陆懒人采集官方网站,进入“用户中心-授权机器”,在机器码文本框里粘贴并提交
3.2.8.0(2023-02-26)
新增运行日志列表管理
修复部分文本框控件右键菜单复制粘贴问题
优化http或json引擎数据请求功能,修复某些网页请求提示“协议冲突”错误
3.2.8.0(2022-05-14)
可选择预执行功能适用于第一页还是所有分页
更改json引擎默认编码为UTF-8,修复首次切换至json引擎不加载数据问题
新增post模式下快速粘贴和编辑Headers按钮
其他一些bug修复
信息管理 /
下载信息管理 /
下载信息管理 /
下载信息管理 /
下载信息管理 /
下载信息管理 /
下载信息管理 /
下载信息管理 /
下载信息管理 /
下载信息管理 /
下载
网友评论