CTspider(长腿蜘蛛)
「长腿蜘蛛-CTspider」是一个全自动采集插件几乎可采集任何网站,设置轻而易举,只需要设置定向采集网址,通过CSS选择器精准识别采集区域,包括(内容,摘要,TAG,缩略图,自定义字段等…)然后自动检测抓取网页内容,文章去重,更新发布,这个过程全自动完成,无需人工干预。
版本简介
「长腿蜘蛛-CTspider」从V2.0版本发生了翻天覆地的变化,重构了底层,优化了业务逻辑,全新的UI一目了然,功能模块设置更为清晰,让新手也可以轻松上手。
支持版本
WordPress支持4.0+ 到最新版本
CTspider V2.0 只支持PHP7.0+以上版本, 由于部分代码加密对PHP 7.2 的适配会有问题,尽量使用PHP7.0-7.1
如何安装
使用WordPress插件上传页安装即可。
如FTP上传,请使用二进制上传。
插件特色
CTspider共有8个功能模块
基本设置
项目名称
更新时间
字符集选择
随机IP(减少ip被封的几率)
多线程任务
多线程任务数量设置
列表设置
多任务URL采集
区域选择器(定位更准确)
列表缩略图采集
自定义缩略图采集属性
自定义添加来源网址字段
文章设置
CSS精准的标题匹配规则
CSS多规则内容匹配(包括:TAG,摘要,特色图片,发布时间,内容自定义属性)
定向测试URL规则
正文分页采集(v2.2新增)
全功能发布设置
支持多分类选择
支持作者选择
支持发布状态选择
支持图片附件下载选择
支持TAG标签选择 或 WordPress标签库智能匹配
支持TAG属性设定
支持摘要自动选择
支持文章图片自动生成特色图索引选择
强大的内容过滤模块
支持内容CSS选择器定向删除和索引删除
支持HTML标签定向过滤和索引过滤
支持HTML属性过滤(让内容更加纯净)
支持特例标签设置 (v2.1新增)
内容替换模块
支持标题关键字替换
支持内容关键字替换
支持标题或内容前后插入自定义文本
自定义样式style
支持给任意HTML元素添加 class 或 style 属性
支持定向或索引选择
翻译伪原创模块
支持百度翻译 [支持28种语言实时互译,每月享200万字符免费服务](v2.3新增)
登录长腿蜘蛛-CTspider官网注册账号(PS:注册账号需要邮箱验证激活码,请认真填写邮箱账号)。
点击用户中心->添加授权域名(PS:目前每位用户可以授权3个域名)。
得到授权码后,点击CTspider插件->系统配置->授权码配置->填入授权码->保存配置->验证授权
官网地址 https://www.ctspider.com/
https://www.ctspider.com/?action=ctdownload&id=9
最新评论
还有个问题就是:如果没有了Redis Object Cache这个插件的支持,那么如何手动清理Redis产生的缓存文件呢,每次修改过网站模板或者一些设置文件后,不清理缓存的话还是无法搞清楚是否生效啊
感谢博主分享,以前一直是只能使用redis或memcached其中之一,今天看到博主的教程,切换到了Nginx openresty然后跟着教程操作完,检查总是显示bypass绕过或miss,不知道哪里不对,每一步都是跟博主教程一样的操作。博主有qq或微信吗,想请教下~
。。。。。。
错别字,重新提交一下问题-小白提问,我所有的操作和流程和教程完全一致,没有出现任何意外情况,直到群晖桌面生成图标,鼠标放上图标显示已启动,点击打开图标显示此站点连接不安全,然后我把浏览器安全级别降到最低,还是一样,请问大佬可能是哪里出问题了呢
小白提问,我所有的操作和流程和教程完全一致,没有出现任何意外情况,知道群晖桌面生成图标,鼠标放上图标现在已启动,点击打开显示此站点连接不安全,然后我把浏览器安全级别降到最低,还是一样,请问大佬可能是哪里出问题了呢。
这个办法好,找了半天都没找到能完整使用redis+memcached的办法,还是在这里找到了。 感谢博主的方法,试了一下,挺好的。但是我发现,套了cloudflare之后,即使不开页面规则(即不对网站进行全站缓存),F12查看网站依旧会发现cf cache命中,查看x-cache提示bypass绕过,那这个方法是不是只有cf没有缓存的时候才有效呢? 不过不管cf有没有作用,实际感受上,网站响应速度快了很多。
请问一下,重启之后缓存会被删除啊,这个怎么解决呢
没听懂链路聚合什么意思