spider php 采集,长腿蜘蛛 WP-CTspider 自动采集发布插件及配置教程

   日期:2024-12-27    作者:aehzp 移动:http://ljhr2012.riyuangf.com/mobile/quote/70539.html

WordPress自动采集发布插件CTspider插件可以采集来自于任何网站的内容并全自动更新你的WordPress站点。最新WP-CTspider插件版本提高插件的兼容性,和抓取速度,最新版本不在兼容PHP7.0以下环境,它使用非常简单,无需复杂设置,并且足够强大和稳定,支持wordpress所有特性。全自动采集更新无需人工干预,只需几分钟,便可以立即更新到网站,完全自动。多线程任务执行,多线程,多任务同时执行,每个任务互不干扰,提高了近40%的执行速度。CSS选择器精确采集,只需要简单设置规则便可以精确采集标题,正文及其他任何HTML内容。

spider php 采集,长腿蜘蛛 WP-CTspider 自动采集发布插件及配置教程

支持WordPress全功能,完美支持WordPress各种功能、标签,摘要,特色图片,自定义栏目等。定时自动采集,只需要设置好每个任务,要多久执行一次任务,便可以定时执行采集任务。支持各种语言伪原创,支持百度翻译引擎(完全免费),共支持29种语言相互翻译,轻松获取原创文章,SEO,支持SEO全功能优化,支持内容过滤,甚至可以在文章任意位置添加上自定义内容,也可以自定义文章样式。附件下载,支持多种格式附件下载,包括自定义采集缩略图,并且可以选择图片添加水印。

一、如何新建一个采集任务

1、首先打开插件,选择第一个选项:CT Spider,然后点击新建任务然后输入采集名称点击提交后,新的采集任务就已经创建完成了。

二、如何设置文章列表采集

1、首先点击刚才新建的采集任务进行设置。

2、第一项一般不用设置,如果设置的话一般只设置字符编码和随机IP就好。

3、进入采集设置,输入你要采集的网址

关于怎么获取 文章网址 css 选择器

1、首先进入列表页,右键鼠标,检查元素/审查元素 ,找到列表页文章的标签, 然后选中文章的上一个div ,看看当前div是否选中了全部的文章,记住class样式或者id样式,打开其中一篇文章的标签,找到标题所在的 a 标签的位置,如下图

2、然后从外到内依次填入css样式选择器中,中间用空格分开。

3、然后点击测试,就可以看到采集到的文章列表。

三、如何设置文章内容采集

1、点击其中一篇文章进入详情页面,然后继续检查/审查元素。

2、跟列表页的选择器一样,找到content或list之类的选择器,选择器要包含文章的标题和内容。

3、然后找到标题的选择器,以及正文的选择器

5、点击测试抓取,就可以看到被抓取的文章了

四、如何设置发布采集的文章

发布文章就相对简单了,选择需要发布的文章分类 > 选择发布状态 > 选择是否保存图片 即可,其他选项可以默认或者根据自己的需求调整即可

五、如何过滤采集的数据

过滤数据的定义:如果采集的文章中有不合适的数据,如文章的导航,广告等,就可以将其过滤掉,使用方法和采集设置一样,获取到需要过滤的数据的css样式,填入即可。

六、如何替换采集的数据

替换数据的定义:如果采集的数据中有原作者的版权信息、昵称等数据时,就可以使用替换功能,将其替换成你的即可

七、如何使用自定义文章样式

可以给任意HTML元素增加 class 或 style 属性

例如 style属性演示 : 让

标签文本变成红色:

[HTML标签 或 CSS选择器]:p 索引:0 属性:style 值:color:red;

例如 class属性演示 : WordPress自带图片居中class属性 让 标签 图片居中:

[HTML标签 或 CSS选择器]:img 索引:0 属性:class 值:aligncenter


特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


举报收藏 0评论 0
0相关评论
相关最新动态
推荐最新动态
点击排行
{
网站首页  |  关于我们  |  联系方式  |  使用协议  |  隐私政策  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号