本方法是一次采集一個(gè)分類(lèi)里面所有小說(shuō)及其章節(jié),數(shù)據(jù)量有點(diǎn)大,電腦不好的會(huì)卡,自己可以一本書(shū)一本書(shū)采集,最主要的是要采集到的數(shù)據(jù)以及web發(fā)布配置要跟手冊(cè)中的一樣。
注:采集數(shù)據(jù)以及web發(fā)布將導(dǎo)致你后期發(fā)布到網(wǎng)站的小說(shuō)章節(jié)及小說(shuō)會(huì)不會(huì)重復(fù)。請(qǐng)?jiān)趯?xiě)采集規(guī)則的時(shí)候,一定要把數(shù)據(jù)格式一樣,比如你采集章節(jié)是斗羅大陸 第1章
斗羅大陸,異界唐三(一),那么格式就是 斗羅大陸_第一章 斗羅大陸,異界唐三(一),其他網(wǎng)站采集的數(shù)據(jù)也是這樣,這樣就會(huì)防止重復(fù)發(fā)布。具體請(qǐng)導(dǎo)入插件自帶的小說(shuō)采集規(guī)則以及web配置詳細(xì)研究,可以自己轉(zhuǎn)化為一本書(shū)的采集規(guī)則。
第一步,導(dǎo)入采集任務(wù)
第二步,導(dǎo)入web配置

導(dǎo)入完成之后
進(jìn)行測(cè)試,這時(shí)候一定要注意web配置標(biāo)簽

data[0]代表小說(shuō)的書(shū)名等內(nèi)容,data[1]代表小說(shuō)的章節(jié)內(nèi)容
自己寫(xiě)采集規(guī)則時(shí)候,一定要嚴(yán)格按照這個(gè)數(shù)據(jù)格式進(jìn)行采集,這樣能有效減少文章內(nèi)容重復(fù)
