采集工具:火車采集器(可以百度搜索一下這個工具的下載)
采集模塊:新聞 News
第一步、編寫采集入庫腳本接口
新建:/api/caiji.php (應用于URL地址請求,大小寫隨意)
如果根目錄沒有api文件夾,就創(chuàng)建到 /public/api/caiji.php (應用于URL地址請求,大小寫隨意)
新建:./dayrui/My/Api/Caiji.php(首字母必須大寫,最終php文件命名與上面的名稱保持相同)
腳本文件中可以定義發(fā)布者等一些預定義字段默認值,如果你不會php的話可以保持默認
注意:本腳本的程序代碼只對內(nèi)容等字段入庫有效,由于采集目標網(wǎng)站的數(shù)據(jù)規(guī)范性無法做到統(tǒng)一;
如果開發(fā)者對其他字段(例如多文件上傳、復選框、聯(lián)動字段等等)需要開發(fā)者自己根據(jù)采集的實際情況來編寫入庫程序來組裝入庫的POST數(shù)據(jù),需要PHP開發(fā)技術(shù)基礎,下面來舉一些基礎例子。
1、多文件上傳字段
2、復選框字段
測試規(guī)則地址:
如果能顯示出來欄目信息,說明ok了
如果顯示api file is error,表示你./dayrui/My/Api/Caiji.php沒有創(chuàng)建正確。
第二步、火車采集器編寫web發(fā)布規(guī)則

第三步、新建一個在線發(fā)布模塊

第四步、填寫獲取欄目列表的參數(shù)

按照上面的格式寫就ok了
第五步、內(nèi)容發(fā)布規(guī)則參數(shù)

表單參數(shù):這里可以配置任意自定義字段的入庫,不知道入庫格式怎么辦?
查看數(shù)據(jù)庫儲存數(shù)據(jù)格式進行入庫處理,必要時需要在接口文件中重新編程
第六步、保存模塊

第七步、然后返回web發(fā)布配置里面

按照圖中的參數(shù)配置,點“獲取欄目”,如果可以獲取到就表示成功了一大半了
第八步、測試入庫發(fā)布

第九步、后臺查看采集內(nèi)容

火車頭采集器設置檢測標題重復,重復標題不能發(fā)布,怎么暫時關(guān)閉標題重復檢測。需要刪除那里面的函數(shù)代碼?
咱們這個程序可以批量導入文章嗎?或者有啥插件沒
強烈建議官方出來個采集插件~在站內(nèi)就能完美采集。
按照火車頭內(nèi)容采集范例這個教程第一步獲取欄目實現(xiàn)了,到第二部用用戶名和密碼登錄的時候出現(xiàn)錯誤是什么問題啊?
我按照教程制作的火車頭發(fā)布模塊,發(fā)布的時候,火車頭運行記錄那里出現(xiàn)紅色字樣,搞不懂是我哪里錯了嗎?我看發(fā)布是成功了。
官網(wǎng)的多網(wǎng)站系統(tǒng),使用火車頭采集器,無法獲取主站之外的其他站點的分類,無法發(fā)布到內(nèi)容。切換到其他站點后臺,看到有火車頭采集插件,然后拷貝了dayrui,My2個目錄,把插件也拷貝到了其他站點的站點目錄