迅睿數(shù)據(jù)入庫接口 http://www.apdwn.com/shop/app/579.html
火車頭不管是以前還是現(xiàn)在都是比較吃香的一個采集工具,有用了好久,覺得這個軟件還是沒有被淘汰,特別是對于那些喜歡做網(wǎng)站然而不喜歡發(fā)文章的seoer們,他們對于這個也是非常的熟悉,下面來看看具體的操作:
提示:采集不限網(wǎng)頁,不限內(nèi)容;分布式采集系統(tǒng),提高效率;支持PHP和C#插件擴展,方便修改處理數(shù)據(jù)。

直接找到下載地方進行下載
直接注冊一個賬號,在登陸
在程序主界面中,點擊“新建”下拉箭頭,從中選擇“任務(wù)”項。

在彈出的窗口中,輸入“任務(wù)名”,同時點擊“起始網(wǎng)址”欄目右側(cè)的“添加”按鈕。

接下來就極為重要的一步,就是對要進行采集的網(wǎng)站進行分板,對所采取的網(wǎng)站中各片文章的URL進行綜合分析并找出規(guī)律,最后按如圖進行填寫。

然后切換至“第二步:采集內(nèi)容規(guī)則”選項卡中,我們需要對網(wǎng)頁內(nèi)容進行分板。在此以“搜狗瀏覽器”為例,右擊要進行分析的網(wǎng)頁,從彈出的菜單中選擇“審查元素”項。

在“開發(fā)式模式”界面中,點擊“選擇頁面中的一個元素去透視”按鈕,接著點擊“標(biāo)題”內(nèi)容,此時就可以在“開發(fā)者”窗口中顯示標(biāo)題所對應(yīng)的標(biāo)簽,此例為“h2"。

接下來在”采集內(nèi)容規(guī)則“界面中,點擊“添加”按鈕來添加“標(biāo)題”項,或者直接雙擊“標(biāo)題”項進行修改。在彈出的界面中,勾選”前后截取“,將設(shè)置前后輟分別為

利用同樣的方法添加其它采集內(nèi)容的規(guī)則。
規(guī)則設(shè)置好之后,測試一下內(nèi)容是否獲取正常

接下來就是設(shè)置入庫方式了





