-
當(dāng)前位置:首頁 > 創(chuàng)意學(xué)院 > 營(yíng)銷推廣 > 專題列表 > 正文
火車頭采集規(guī)則怎么寫(火車頭采集規(guī)則怎么寫的)
大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關(guān)于火車頭采集規(guī)則怎么寫的問題,以下是小編對(duì)此問題的歸納整理,讓我們一起來看看吧。
開始之前先推薦一個(gè)非常厲害的Ai人工智能工具,一鍵生成原創(chuàng)文章、方案、文案、工作計(jì)劃、工作報(bào)告、論文、代碼、作文、做題和對(duì)話答疑等等
只需要輸入關(guān)鍵詞,就能返回你想要的內(nèi)容,有小程序、在線網(wǎng)頁版、PC客戶端和批量生成器
官網(wǎng):https://ai.de1919.com。
本文目錄:
火車頭如何采集還有縮略圖的文章呢
1、首先在采集列表頁的源碼中將帶有縮略圖的那部分源碼復(fù)制下來,如圖:
2、查看網(wǎng)站的源碼,找到這行代碼,如圖:
3、打開火車頭,進(jìn)入采集網(wǎng)址規(guī)則—添加多級(jí)網(wǎng)址采集規(guī)則,選中手動(dòng)填寫鏈接地址規(guī)則,并將第二步驟中選中的代碼粘貼進(jìn)去,如圖:
4、將代碼進(jìn)行如下修改:
5、改好后保存并進(jìn)行采集測(cè)試,如圖所示
6、然后再在采集內(nèi)容規(guī)則里進(jìn)行修改,選中“縮略圖”標(biāo)簽,打開,進(jìn)行內(nèi)容替換,如圖:
7、然后點(diǎn)擊文件下載,選中下載圖片,并填好縮略圖保存路徑及命名方式,如圖:
8、在“文件保存及部分高級(jí)設(shè)置”里設(shè)定縮略圖的保存盤符及其前綴,我設(shè)定為桌面,前綴為“./”,如圖:
9、我們保存后測(cè)試一下,一起順利,縮略圖順利采集下來了
是最近版本的嗎?
關(guān)于火車頭正則表達(dá)式采集數(shù)據(jù)
正確的正則:document\.write\('<a\s+href="(?<content>([^\/"]*\/)*[^"]*\.jpg)"\s+id="jqzoomMain"\s+class="jqlightbox">
你的正則的錯(cuò)誤在于:
1. (?<content>.*\/+.*\.jpg)中.*使用了貪婪匹配,匹配了所有的內(nèi)容,而不光是/前的內(nèi)容,正確的寫法是[^/"]所有非/非"的內(nèi)容。
2. (?<content>.*\/+.*\.jpg)中\/+加號(hào)修飾的是\/,而非.*\/也就是說只有斜杠可以重復(fù)N次,正確的寫法是([^/"]*\/)+追問
感謝您的回答,根據(jù)你寫的這個(gè)正則所匹配到的是整個(gè)路徑包括圖片名稱也在內(nèi)如a/b/c/d/123.jpg 而我只需要他的路徑即 a/b/c/d 我重寫了一個(gè)document\.write\('(.*\/)+).*\.jpg"\s+id="jqzoomMain"\s+class="jqlightbox"> 這個(gè)就可以匹配到a/b/c/d 多謝你的提醒!
如何寫火車頭采集器的采集規(guī)則,采集頁面上圖片內(nèi)的文字?
不得不說火車頭是有一定用處,但是個(gè)人覺得不怎么好用,光是寫那些采集規(guī)則,設(shè)定什么的就一大堆不明不白的東西。拿錢購(gòu)買嘛,一開始那客服還很熱情的為你解答,一交完錢買下來了,寫規(guī)則,好了,有問題要找客服解決,結(jié)果一拖再拖,弄了一個(gè)多月還沒弄好,整個(gè)網(wǎng)站的工作進(jìn)程全拖慢了,還不如自己辛苦點(diǎn)自己手動(dòng)寫文章,還采集啥啊~言歸正傳,火車頭使用:新建站點(diǎn)—>新建任務(wù)—>填寫你要采集的網(wǎng)站文章列表—>點(diǎn)下面的開始測(cè)試網(wǎng)址—>如果有采集到很多文章,看各個(gè)地址相同部分(如system/2012/03/07),點(diǎn)返回修改,把system/2012/03/07這部分加到“文章內(nèi)容必須包含”那里,再測(cè)試一下,就可以采集到3月7日的文章地址了—>前面準(zhǔn)備好網(wǎng)址后接下來就是第二步的采集內(nèi)容規(guī)則了,點(diǎn)第二步,設(shè)定標(biāo)簽,一般采集包括標(biāo)題<title></title>、關(guān)鍵字<meta name=keyword...>、內(nèi)容<div>...</div>,這些設(shè)置從你要采集的網(wǎng)站代碼上可以找到相應(yīng)的——>采集頁面上的圖片,在第四步,“文件保存及高級(jí)設(shè)置”,選擇所有文件本地保存文件夾(這里是從頁面下載圖片存放的位置),然后下面有個(gè)FTP同步文件上傳的,填好服務(wù)器、用戶名、密碼什么的,文件上傳根目錄就是你網(wǎng)站服務(wù)器放置圖片的文件夾位置,你可以在服務(wù)器新建一個(gè)文件夾試試看,OK!到此為止,不過有一些網(wǎng)站寫了反采集代碼,有可能會(huì)被封IP,整體來說,個(gè)人不提倡使用火車頭采集器,還不如個(gè)人手動(dòng)來得實(shí)在,就算一天少發(fā)點(diǎn)也行,只要保證每天更新量、偽原創(chuàng)和原創(chuàng),一樣有很大效果。
以上就是關(guān)于火車頭采集規(guī)則怎么寫相關(guān)問題的回答。希望能幫到你,如有更多相關(guān)問題,您也可以聯(lián)系我們的客服進(jìn)行咨詢,客服也會(huì)為您講解更多精彩的知識(shí)和內(nèi)容。
推薦閱讀:
杭州火車東站附近商場(chǎng)(杭州火車東站附近商場(chǎng)叫什么)
火車采集器簡(jiǎn)介作用500字(火車采集器簡(jiǎn)介作用500字怎么寫)
建德至杭州火車時(shí)刻表(建德至杭州火車時(shí)刻表和票價(jià))
濟(jì)南公司vi設(shè)計(jì)全套(濟(jì)南vi設(shè)計(jì)公司價(jià)格表)
夏河網(wǎng)店代運(yùn)營(yíng)公司哪家好(夏河網(wǎng)店代運(yùn)營(yíng)公司哪家好一點(diǎn))