蓝天采集器(SkyCAIji)网页爬虫系统,采用php+MySQL开发已经过5年迭代更新,成熟稳定可部署在云端服务器和虚拟主机中,可视化操作使用浏览器即可采集数据,功能包括数据挖掘、分析、清洗、处理、发布等。软件免费无限制使用,可二次开发,自定义规则和插件自由度高,简单易操作。
数据采集支持无限制多级、多页、分页和RPA流程采集,自定义采集规则(支持正则、XPATH、JSON等)精准匹配任意信息流,几乎能采集所有类型的网页,支持模拟浏览器点击、滚动等操作抓取页面渲染后的内容。数据采集助力垂直大模型AIGC内容创作,可解决大模型应用缺少训练数据的问题。
内容发布无缝对接各类CMS建站程序,实现免登录导入数据,支持自定义数据发布插件,也可以直接导入数据库、存储为Excel文件、远程api发布等。
云部署及自动化该软件类似CMS程序,完全跨平台,任何系统中都能安装,在虚拟主机中也能良好运行。实现定时定量全自动采集发布,简单操作即可持续采集。
采集对接插件下载
采集对接数据
接口地址: (接口开启插件后就在插件设置里显示的)
请求方式:POST
数据编码:utf-8
发送数据:Title=标题、Content=正文、Alias=别名(默认空)、PostTIMe=日期(默认当前时间)、Intro=摘要(默认空)、CateID=分类(默认空,填入分类名称或id)、Tag=标签(默认空,多个用,号分隔)、Template=模板(默认空)、Status=状态(默认0,可填入 0 公开、1 草稿、2 审核)、IsTop=置顶(默认0,可填入 0 无、1 全局、2 首页、4 分类)、IsLock=禁止评论(默认0,可填入 1 是、0 否)
蓝天采集后台对接
第一:发布设置
发布方式选择调用接口,接口就是采集对接数据中的接口地址,复制进去即可;
第二:发送数据
发送数据需要自行添加,如标题、内容、分类、标签等重要数据,发送数据中名称就是采集对接数据中发送数据,如标题则是Title,值就是自己写的采集规则,点击字段就能看到自己的规则有哪些!
第三:响应状态
这个响应状态没有什么要注意的,名称是啥就复制啥在输入框中即可。
本文标签: 蓝天采集器 采集 网站采集
一枚小杰克 https://bbs.ikunwl.com/
虫洞联盟是一款国内优秀的中文互联网联盟平台及年轻人都喜欢玩的互联网社区,提供虫洞传送、万站同盟、流量互传、娱乐活动、休闲游戏、IT互联网教程分享等服务 | ikun之家
- Jack导航主题适配蓝天采集器(提供某站采集规则案例)
- 蓝天采集器 Z-BlogPHP 采集发布接口/对接插件分享
- 网站使用APlayer+MetingJS实现音乐播放 刷新页面保持音乐播放进度
- 主站与二级目录站都是ZBLOG时伪静态共存Nginx规则
- ZBLOGPHP文章页统计文章正文字数
- ZBLOGPHP侧边日期更新文章日变红色教程
- ZBLOGPHP分享原创声明与转载来源信息显示代码
- ZBLOGPHP侧边栏多彩标签设置方法代码
- ZBLOGPHP判断用户是否已登录代码案例
- ZBPDK插件妙用之禁止zblog输出程序运行信息
- ZBLOG网站页面打开慢 TTFB加载时间长的排查方法
- ZBLOG调用最新文章 最热文章 最多评论 教程 仅供参考
本文已有1位网友发表了点评 - 欢迎您


