迎接清晨
痛苦中自省

最新关关采集编写教程和关关采集正则

最新关关采集编写教程和关关采集正则,关关采集器,主要使用正则采集,以下是正则的一些表达
\d*    表示数字
\s*     表示空格+换行
.+?    表示字符(不能为空)
.*      表示字符(可以为空)
()      表示我们需要的部分
((.|\n)*)  章节的内容部分,包括了换行。
=====杰奇对应=====
!!!!  相当于  ([^><]*)
~~~~  相当于  ([^><'"]*)
^^^^  相当于  ([^><\d]*)
$$$$  相当于  ([\d]*)
****  相当于  (.*)
=====其他基本=====
.  匹配任何单个字符。例如正则表达式r.t匹配这些字符串:rat、rut、r t,但是不匹配root。
$  匹配行结束符。例如正则表达式weasel$ 能够匹配字符串"He's a weasel"的末尾,但是不能匹配字符串"They are a bunch of weasels."。
^  匹配一行的开始。例如正则表达式^When in能够匹配字符串"When in the course of human events"的开始,但是不能匹配"What and When
in the"。
* 匹配0或多个正好在它之前的那个字符。例如正则表达式.*意味着能够匹配任意数量的任何字符。
\  这是引用府,用来将这里列出的这些元字符当作普通的字符来进行匹配。例如正则表达式\$被用来匹配美元符号,而不是行尾,类似的,正则
表达式\.用来匹配点字符,而不是任何字符的通配符。
万能图片规则<[^<]*((?<=<(?:img|IMG)[^>]*(?:(?:src|SRC)(?:\s*=\s*(?:["']?))))(?:[^\s"'>]*)\.(?:jpg|gif|jpeg|bmp|png|GIF|JPG))
[^>]*>

实例

(.+?)  获取内容

.+?   通配不需要的内容

NovelIntro 小说简介

PubVolumeContent   关键目录获取 意思是获取目录的开始到结束 章节内容作为通配

PubVolumeName  章节名

PubChapterName  章节名

赞(0) 赞赏博主
未经允许不得转载:牧野狂歌 » 最新关关采集编写教程和关关采集正则

相关推荐

  • 暂无文章

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

觉得文章有用,打赏一下下吧。

非常感谢你的打赏,我们将继续给力更多优质内容,让我们一起创建更加美好的网络世界!

微信扫一扫打赏