后羿采集器官方版是提供网页数据采集的应用工具,功能十分强大,界面设计也比较简单。提供丰富的采集功能,可以只需输入网址就能智能识别数据,还支持多种数据导出方式,更支持全操作系统,无缝切换,操作简单又便捷。
后羿采集器是杭州快忆科技有限公司旗下的一款采集软件,本产品由前谷歌搜索技术团队基于人工智能技术研发,功能强大,操作简单,可谓是居家旅行随身神器。
1、功能强大,提供企业级服务
后羿采集器提供丰富的采集功能,无论是采集稳定性或是采集效率,都能够满足个人、团队和企业级采集需求。
丰富的功能: 定时采集,自动导出,文件下载,加速引擎,按组启动和导出,Webhook,RESTful API,智能识别SKU和大图等。
2、智能识别数据,小白神器
自动识别:列表、表格、链接、图片、价格等
智能模式:基于人工智能算法,只需输入网址就能智能识别列表数据、表格数据和分页按钮,不需要配置任何采集规则,一键采集。
3、可视化点击,简单上手
流程图模式:只需根据软件提示在页面中进行点击操作,完全符合人为浏览网页的思维方式,简单几步即可生成复杂的采集规则,结合智能识别算法,任何网页的数据都能轻松采集。
可模拟操作: 输入文本、点击、移动鼠标、下拉框、滚动页面、等待加载、循环操作和判断条件等。
4、云端账号,方便快捷
创建后羿采集器账号并登录,您的所有采集任务设置都将自动加密保存到后羿的云端服务器,无需担心采集任务丢失,任务运行及采集的数据均在您本地,而且非常安全,只有您自己在本地登录客户端后才能查看。后羿采集器对账号没有终端绑定限制,您切换终端时采集任务也会同步更新,任务管理方便快捷。
5、全平台支持,无缝切换
同时支持Windows、Mac和Linux全操作系统的采集软件,各平台版本完全相同,无缝切换。
6、支持多种数据导出方式
采集结果可以导出到本地,支持TXT、excel、CSV和HTML文件格式,也可以直接发布到数据库(mysql、MongoDB、sql server、PostgreSQL)供您使用。
1、在极光下载站下载后羿采集器安装包并解压,找到安装程序双击安装
2、阅读并同意许可协议,点击下一步
3、选择安装存储位置,点击安装
4、等待安装,安装完成即可打开使用
步骤1:创建采集任务
1-启动后羿采集器,进入主界面,点击创建任务按钮创建 &向导采集任务&
2-输入百度搜索的URL,包括三种方式
1、手动输入:在输入框中直接输入URL,多个URL时须要换行分割
2、点击从文件中读取方式:用户选择一个存放URL的文件,文件中可以有多个URL地址,地址须要换行分割。
3、批量添加方式:通过添加并调整地址参数生成多个有规律的地址
步骤2:定制采集过程
1-点击创建后自动打开第一个URL进而进入向导设置,此处选择列表页,点击下一步
2-填写搜索关键字和选择输入关键字的输入框,点击下一步。进入第一个关键字搜索结果页面后,点击设置搜索按钮,点击下一步
3-点选列表块中第一块元素。再点击结果列表块中另外一块元素,此时自动选中列表块。点击下一步
4-选择下一页按钮,选中选择下一页选项,然后点击页面中的下一页按钮填充第一个输入框,第二个数据框可以调节采集运行中点击下一页按钮的次数。理论上次数越多,采集到的数据越多。点击下一步
5-选择要采集的字段:在焦点框中点选要抽取的元素后点击下一步。选择不进入详情页。点击保存或保存并运行
步骤3:数据采集及导出
1-采集任务运行中。采集完成后,选择“导出数据”可以把数据都导出到本地文件
2-选择“导出方式”,将采集好的数据导出,这里可以选择excel作为导出为格式
3-采集数据导出
数据备份 /
下载数据备份 /
下载数据备份 /
下载数据备份 /
下载数据备份 /
下载数据备份 /
下载数据备份 /
下载数据备份 /
下载
网友评论