-
當(dāng)前位置:首頁 > 創(chuàng)意學(xué)院 > 短視頻 > 專題列表 > 正文
網(wǎng)頁文字抓取工具(網(wǎng)頁文字抓取工具手機(jī)版)
大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關(guān)于網(wǎng)頁文字抓取工具的問題,以下是小編對(duì)此問題的歸納整理,讓我們一起來看看吧。
創(chuàng)意嶺作為行業(yè)內(nèi)優(yōu)秀的企業(yè),服務(wù)客戶遍布全球各地,相關(guān)業(yè)務(wù)請(qǐng)撥打電話:175-8598-2043,或添加微信:1454722008
本文目錄:
一、找一中文軟件工具:可以保存復(fù)制多個(gè)網(wǎng)頁信息,一次粘貼到WORD文檔
軟件太多了:
1. WebZip 7.03 中文語言包
WebZip 把一個(gè)網(wǎng)站下載并壓縮到一個(gè)單獨(dú)的 ZIP 文件中,可以幫您將某個(gè)站臺(tái)全部或部份之資料以ZIP格式壓縮起來,可供你日后快速瀏覽這個(gè)網(wǎng)站。且新一版的功能包括可排定時(shí)間來下載,亦加強(qiáng)相當(dāng)漂亮的立體界面及傳輸?shù)那€圖。
2. 網(wǎng)站全額下載器 2002
“網(wǎng)站全額下載器”是一個(gè)離線瀏覽的最佳工具。只要幾分鐘就可以將一個(gè)網(wǎng)站全部下載。包括網(wǎng)站內(nèi)的圖片、文字、程序、軟件.....等。所以這也是研究別人網(wǎng)站的最好幫手。
3. WebZip 7.0.3
WebZip 把一個(gè)網(wǎng)站下載并壓縮到一個(gè)單獨(dú)的 ZIP 文件中,可以幫您將某個(gè)站臺(tái)全部或部份之資料以ZIP格式壓縮起來,可供你日后快速瀏覽這個(gè)網(wǎng)站。且新一版的功能包括可排定時(shí)間來下載,亦加強(qiáng)相當(dāng)漂亮的立體界面及傳輸?shù)那€圖。
4. 離線瀏覽助理Webdup 0.93 Beta
Webdup能夠把您想要瀏覽的信息(如網(wǎng)頁和圖片等)預(yù)先下載下來,保存在本地硬盤,使您可以從本地進(jìn)行離線瀏覽,這樣不僅可以大大減少上網(wǎng)時(shí)間,降低上網(wǎng)費(fèi)用,還可以加快瀏覽速度;并且將來無須上網(wǎng)就可以很方便地查閱這些信息。不僅如此, Webdup更提供了備份歷次下載記錄和比較完善的管理功能,使您能夠方便地分類保存和管理有價(jià)值的下載信息。 Webdup的當(dāng)前版本實(shí)現(xiàn)了以下功能:1.支持HTTP和FTP下載,并支持HTTP和Socks5代理服務(wù)器;2.支持多線程下載;3.支持?jǐn)帱c(diǎn)續(xù)傳;4.可按URL和文件后綴名設(shè)置過濾,只下載所需文件;5.自動(dòng)識(shí)別下載過的文件是否更新過,減少重復(fù)下載;6.可設(shè)置定時(shí)下載和定時(shí)停止;7.支持自動(dòng)撥號(hào)和自動(dòng)掛斷;8.可導(dǎo)出和導(dǎo)入項(xiàng)目文件,方便用戶交換網(wǎng)上資源;9.提供與瀏覽器(IE)的整合,方便快速地創(chuàng)建項(xiàng)目;10.支持項(xiàng)目和類別的拖拽操作,方便用戶分類管理項(xiàng)目;11.能自動(dòng)識(shí)別操作系統(tǒng)的語言,按需顯示中文或英文。
5. WebZip 7.0.0.1025 漢化版
WebZip 是把一個(gè)網(wǎng)站下載并壓縮到一個(gè)單獨(dú)的 ZIP 文件中,可以幫您將某個(gè)網(wǎng)站全部或部份資料以ZIP格式壓縮起來,可供你日后快速瀏覽這個(gè)網(wǎng)站。且新一版的功能包括可預(yù)定時(shí)間來下載,亦加強(qiáng)相當(dāng)漂亮的立體界面及傳輸?shù)那€圖。 此版本是直接漢化程序文件,不同于漢化語言文件,漢化較徹底,但仍然有極個(gè)別字符沒能徹底漢化,但不影響使用。因?yàn)槭菨h化的程序文件,在漢化中對(duì)程序界面做了大量?jī)?yōu)化和美化工作。安裝中可選擇安裝中文版本或英文版本,并可以選擇是否注冊(cè)軟件。
6. 木馬專殺大師 2.6
本軟件采用了先進(jìn)的程序行為智能判斷技術(shù)。軟件通過分析每個(gè)程序的機(jī)理來判斷木馬,不需要木馬的特征碼,可查殺未知木馬。實(shí)時(shí)掃描內(nèi)存中的每個(gè)程序,一旦發(fā)現(xiàn)木馬,即時(shí)查殺。強(qiáng)力保障您的計(jì)算機(jī)、網(wǎng)絡(luò)游戲帳號(hào)、QQ和郵箱帳號(hào)等不被木馬侵害。 目前查殺病毒木馬的軟件基本都是采用了特征碼查殺技術(shù),也就是說用戶要不斷的下載和更新病毒木馬庫才能查殺最新的木馬。這種方法的弊端很明顯,因?yàn)槊刻於加行碌哪抉R出現(xiàn),一旦木馬庫更新不及時(shí),用戶就面臨著危險(xiǎn)。而且軟件的廠商也肯定不能把所有的病毒木馬庫找全。所以很多用戶雖然安裝了這些安全軟件,帳號(hào)還是經(jīng)常被木馬竊取。因此一款好的木馬查殺軟件必不可少。
7. Teleport Pro 1.40
Teleport Pro所能做的,不僅僅是離線瀏覽某個(gè)網(wǎng)頁(讓你離線快速瀏覽某個(gè)網(wǎng)頁的內(nèi)容當(dāng)然是它的一項(xiàng)重要功能),它可以從Internet的任何地方抓回你想要的任何文件,它可以在你指定的時(shí)間自動(dòng)登錄到你指定的網(wǎng)站下載你指定的內(nèi)容,你還可以用它來創(chuàng)建某個(gè)網(wǎng)站的完整的鏡象,作為創(chuàng)建你自己的網(wǎng)站的參考。
8. Weblinky 1.12簡(jiǎn)體中文版
WebSlinky可以把站點(diǎn)拷貝到你的計(jì)算機(jī)里,你可以在方便的時(shí)候離線讀取,不必等待下載的時(shí)間。此程序提供了一個(gè)簡(jiǎn)單的界面,使你能夠進(jìn)入你希望緩存到計(jì)算機(jī)中的站點(diǎn)地址(URL)中去。它還提供了WebSlinky保存站點(diǎn)文件的本地文件夾的路徑和名字以及用戶名和口令(如果站點(diǎn)要求).Name:CZY Code:1010107261
9. 網(wǎng)絡(luò)蜘蛛 1.0
網(wǎng)絡(luò)蜘蛛是一個(gè)自動(dòng)搜索 HTML 頁面并下載指定文件的軟件。最初設(shè)計(jì)它是為了下載網(wǎng)站上的圖片,想想看,面對(duì)那些動(dòng)輒擁有數(shù)百幅圖片的網(wǎng)站,你是否有耐心和時(shí)間一一點(diǎn)擊查看和下載?而且在目前上網(wǎng)費(fèi)用如此高昂的年代,在網(wǎng)站上慢慢地手工瀏覽和下載圖片是不是太過奢侈了一點(diǎn)?如果你是一個(gè)圖片收集愛好者得話,建議你試一試網(wǎng)絡(luò)蜘蛛這個(gè)軟件。它可以從你指定的地址開始,自動(dòng)搜索網(wǎng)站并下載圖片或其它軟件。聽起來似乎有點(diǎn)象離線瀏覽器或網(wǎng)站下載軟件是嗎?其實(shí)它們還是有些差別的,網(wǎng)絡(luò)蜘蛛的設(shè)計(jì)目標(biāo)主要是針對(duì)圖片等一些比較零碎的、尺寸不是很大的文件的下載,并高度強(qiáng)調(diào)自動(dòng)化工作和高可靠性。
10. WebCHM 2.07.7507
WebCHM(原WebSeizer測(cè)試版)是中國最強(qiáng)大的多線程離線瀏覽軟件,專業(yè)的下載大型網(wǎng)站的工具??梢韵螺d整個(gè)網(wǎng)站所有的文件,也可以只下載同一個(gè)目錄的文件,還可以下載指定的層次。主要特色是可以下載超大型的網(wǎng)站(容量>10GB,文件數(shù)目>100萬的網(wǎng)站),并且內(nèi)置了CHM壓縮引擎,可以靈活方便地將下載的網(wǎng)頁制作成CHM壓縮文檔。下載大型網(wǎng)站時(shí),可以邊下載邊壓縮到CHM文檔,以節(jié)省空間;下載幾百篇文章的小說時(shí),可以下載后再制作成可以在PDA上閱讀的CHM格式的電子書。支持?jǐn)帱c(diǎn)續(xù)傳、在線升級(jí)、分類管理等功能,操作方便,體貼用戶。
11. Offline Explorer 4.1.2347
相當(dāng)方便使用的離線瀏覽工具,可排定抓取時(shí)間、設(shè)定Proxy,也可選擇抓取的項(xiàng)目及大小,可自設(shè)下載的存放位置、及存放的空間限制。它內(nèi)置瀏覽程序、可直接瀏覽或是使用自己喜歡的瀏覽器來瀏覽、且更可直接以全瀏覽窗切換來作網(wǎng)上瀏覽,另它對(duì)于抓取的網(wǎng)站更有MAP的提供、可更清楚整個(gè)網(wǎng)站的連結(jié)及目錄結(jié)構(gòu)。
12. BlackWidow 5.00 Beta 19
一個(gè)非常簡(jiǎn)單易用的離線瀏覽器,它能列出你指定的站點(diǎn)的全部文件,你可以選擇需要的文件下載。
13. HTTrack 3.40
一個(gè)相當(dāng)容易使用的脫機(jī)閱覽軟件,能將網(wǎng)站傳送到計(jì)算機(jī)目錄里,并且會(huì)將所有相關(guān)鏈結(jié)重新組織,以方便更順利的脫機(jī)瀏覽。
14. Aeria Leech 4.3.3
Leech是一個(gè)不錯(cuò)的離線瀏覽器,能夠多線程下載多個(gè)文件。系統(tǒng)要求:IE4.0或更高版本。
15. CopyWebsite 2.43
離線瀏覽工具,僅僅需要輸入需要下載網(wǎng)站的URL,所有的網(wǎng)頁就可以被下載,包括圖像和zip文件。
16. 網(wǎng)頁抓手(FileCatch) 1.07
網(wǎng)頁抓手(FileCatch)是設(shè)計(jì)來取代IE的另存為菜單的軟件,能夠嵌入到IE的右鍵菜單中后臺(tái)形式保存網(wǎng)頁,不打斷瀏覽;此外,F(xiàn)ileCatch僅僅保存網(wǎng)頁而不包括圖象,解決了一存一大堆的現(xiàn)象;FileCatch提供了自動(dòng)生成一定意義名稱的功能,使你不需要為命名煩惱;FileCatch通過智能補(bǔ)完相對(duì)地址到網(wǎng)頁中,解決了保存的網(wǎng)頁超鏈接丟失的現(xiàn)象;FileCatch能夠?qū)⒕W(wǎng)頁依耐的CSS嵌入保存到html文件中,保持網(wǎng)頁的美觀,逼進(jìn)在線的效果;FileCatch支持對(duì)智能選項(xiàng)和代理服務(wù)器,使你方便的使用定制;FileCatch是免費(fèi)軟件,你可以自由的使用。
17. Offline Explorer Pro 4.1.2348
相當(dāng)方便使用的離線瀏覽工具,可排定抓取時(shí)間、設(shè)定Proxy,也可選擇抓取的項(xiàng)目及大小,可自設(shè)下載的存放位置、及存放的空間限制。它內(nèi)置瀏覽程序、可直接瀏覽或是使用自己喜歡的瀏覽器來瀏覽、且更可直接以全瀏覽窗切換來作網(wǎng)上瀏覽,另它對(duì)于抓取的網(wǎng)站更有MAP的提供、可更清楚整個(gè)網(wǎng)站的連結(jié)及目錄結(jié)構(gòu)。
18. Teleport Ultra 1.40 簡(jiǎn)體中文版
Teleport Ultra 所能做的,不僅僅是離線瀏覽某個(gè)網(wǎng)頁 (讓你離線快速瀏覽某個(gè)網(wǎng)頁的內(nèi)容當(dāng)然是它的一項(xiàng)重要功能),它可以從 Internet 的任何地方抓回你想要的任何文件,它可以在你指定的時(shí)間自動(dòng)登錄到你指定的網(wǎng)站下載你指定的內(nèi)容,你還可以用它來創(chuàng)建某個(gè)網(wǎng)站的完整的鏡象,作為創(chuàng)建你自己的網(wǎng)站的參考。如果你也和我一樣,曾想把整個(gè)網(wǎng)頁抓回來慢慢欣賞,如果你也曾像我一樣,費(fèi)盡千辛萬苦只為了重復(fù)抓取同一網(wǎng)站的文件而做一些機(jī)械性的動(dòng)作,Teleport Ultra 簡(jiǎn)直是我們的救星!它可以迅速、確實(shí)地將整個(gè)網(wǎng)站復(fù)制在你的硬盤中,為您節(jié)省大筆的上網(wǎng)費(fèi)用與時(shí)間。Teleport Ultra 是著名的離線瀏覽軟件 Teleport Pro 版本的增強(qiáng)版!
19. Teleport Ultra 1.40
Teleport Ultra所能做的,不僅僅是離線瀏覽某個(gè)網(wǎng)頁(讓你離線快速瀏覽某個(gè)網(wǎng)頁的內(nèi)容當(dāng)然是它的一項(xiàng)重要功能),它可以從Internet的任何地方抓回你想要的任何文件,它可以在你指定的時(shí)間自動(dòng)登錄到你指定的網(wǎng)站下載你指定的內(nèi)容,你還可以用它來創(chuàng)建某個(gè)網(wǎng)站的完整的鏡象,作為創(chuàng)建你自己的網(wǎng)站的參考。如果你也和我一樣,曾想把整個(gè)網(wǎng)頁捉回慢慢欣賞,如果你也曾像我一樣費(fèi)盡千辛萬苦,只為了重復(fù)捉取同一網(wǎng)站的檔案而做一些機(jī)械性的動(dòng)作Teleport Ultra 簡(jiǎn)直是我們的救星!它可迅速、確實(shí)地將整個(gè)網(wǎng)站復(fù)制在你的硬碟中,為您節(jié)省大筆的連線費(fèi)用與時(shí)間。Teleport Ultra 是著名的離線瀏覽軟件Teleport Pro版本的增強(qiáng)版!更新記錄:1.新增了一項(xiàng)功能,使得該軟件的Ultra, VLX, Exec, Exec/VLX版可以打開比較小的項(xiàng)目2.新增了可以在UNC卷上運(yùn)行項(xiàng)目的功能3.在Exec和Exec/VLX版本中新增了API命令4.更新了所有版本的文檔5.改進(jìn)了腳本,可以處理更多的腳本命令6.改進(jìn)了規(guī)則引擎7.修正了會(huì)取回一些不需要的URL的bug8.重新設(shè)置了Ultra版的試用期
20. Offline Explorer Enterprise 4.1.2348
相當(dāng)方便使用的離線瀏覽工具,可排定抓取時(shí)間、設(shè)定Proxy,也可選擇抓取的項(xiàng)目及大小,可自設(shè)下載的存放位置、及存放的空間限制。它內(nèi)置瀏覽程序、可直接瀏覽或是使用自己喜歡的瀏覽器來瀏覽、且更可直接以全瀏覽窗切換來作網(wǎng)上瀏覽,另它對(duì)于抓取的網(wǎng)站更有MAP的提供、可更清楚整個(gè)網(wǎng)站的連結(jié)及目錄結(jié)構(gòu)。
21. WebCopier 4.3
是一個(gè)強(qiáng)大的離線瀏覽器,可以同時(shí)對(duì)100個(gè)文件進(jìn)行下載。支持代理服務(wù)器。內(nèi)置了強(qiáng)大的搜索功能。
22. Offline Explorer Pro 2.2 漢化版
相當(dāng)方便使用的離線瀏覽工具,可排定抓取時(shí)間、設(shè)定Proxy,也可選擇抓取的項(xiàng)目及大小,可自設(shè)下載的存放位置、及存放的空間限制。它內(nèi)置瀏覽程序、可直接瀏覽或是使用自己喜歡的瀏覽器來瀏覽、且更可直接以全瀏覽窗切換來作網(wǎng)上瀏覽,另它對(duì)于抓取的網(wǎng)站更有MAP的提供、可更清楚整個(gè)網(wǎng)站的連結(jié)及目錄結(jié)構(gòu)。
23. Grab-a-Site 5.0
這是一個(gè)離線瀏覽工具。你可以把喜歡的網(wǎng)站抓到本地硬盤上細(xì)細(xì)的欣賞甚至包括那些有密碼保護(hù)的站點(diǎn)。還有過濾指定站點(diǎn)的功能。
24. Black Widows 4.37
可以讓您建立Web站臺(tái)的整個(gè)目錄結(jié)構(gòu)并將之儲(chǔ)存以便日后利用,當(dāng)您下載文件時(shí),依您的選擇進(jìn)行建立下一個(gè)網(wǎng)站結(jié)構(gòu)。您可以選擇下載整個(gè)或部份的文件,也提供續(xù)傳功能讓您下載中斷時(shí)使用。
25. HTTrack Website Copier for Windows 3.40 Beta 4
HTTrack是一個(gè)免費(fèi)并易于使用的線下瀏覽器工具,它能夠讓你從互聯(lián)網(wǎng)上下載整個(gè)網(wǎng)站進(jìn)行線下瀏覽。瀏覽線下站點(diǎn)和線上并沒有什么不同。HTTrack同樣可以進(jìn)行線下線上站點(diǎn)同步,支持?jǐn)帱c(diǎn)續(xù)傳。HTTrack是一個(gè)可全面配置并包括全面的幫助系統(tǒng)的工具。
26. WebCopier 官方中文語言包
是一個(gè)強(qiáng)大的離線瀏覽器,可以同時(shí)對(duì)100個(gè)文件進(jìn)行下載。支持代理服務(wù)器。內(nèi)置了強(qiáng)大的搜索功能。
27. BackStreet Browser 3.1
BackStreet Browser是個(gè)離線瀏覽的好幫手。它的特性是,同時(shí)多個(gè)執(zhí)行緒對(duì)目的網(wǎng)站做存取,充分利用頻寬,不必受到網(wǎng)絡(luò)traffic狀況的延遲而拖長(zhǎng)等待的時(shí)間。對(duì)于不想花費(fèi)時(shí)間在無謂的等待的人,BackStreetBrowser是不錯(cuò)的選擇。
28. SuperBot 4.5
SuperBot幫您將整個(gè)網(wǎng)站搬回家SuperBot是個(gè)全自動(dòng)的離線瀏覽軟件,您不需要做太多的設(shè)定,便可以將自己想看的網(wǎng)站給整個(gè)搬回家!SuperBot與一般的離線瀏覽軟件最大的不同處在于它的操作使用相當(dāng)簡(jiǎn)單,您只要設(shè)定好想要下載的網(wǎng)站路徑以及下載網(wǎng)頁存放的路徑,SuperBot便可以自動(dòng)為您進(jìn)行網(wǎng)頁下載的工作了,不過這坪要注意的是,如果您想要下載存放的網(wǎng)站相當(dāng)大的話,您可能要花相當(dāng)長(zhǎng)的時(shí)間等待。
29. SuperHTTP 1.0
SuperHTTP是一套離線瀏覽軟件,可以將整個(gè)網(wǎng)站按照目錄結(jié)構(gòu)順序、超連結(jié)等,完整下載到硬盤離線瀏覽,也可以選擇只下載圖形文件或者其他文件,包括html、txt、pdf、doc、jpg、bmp、gif、png、mpg、mp2、mp3、avi、wav、mid、exe、zip等等,只需在設(shè)定中打勾或取消即可,不用一個(gè)一個(gè)輸入文件類型,允許同時(shí)下載多個(gè)網(wǎng)站,以及顯示下載進(jìn)度功能。此外也提供搜尋引擎功能,可輸入關(guān)鍵字搜尋所下載的網(wǎng)站來找出所要的文件或資訊。
30. MemoWeb 3.3.05
離線網(wǎng)絡(luò)瀏覽器,以供使用者方便快速的直接在電腦中瀏覽這些網(wǎng)頁。你可以選擇是下載整個(gè)站點(diǎn)的所有的文件,還是下載首頁,或者是某一個(gè)部分。同時(shí)它還支持下載多媒體文件,例如圖片,聲音,和視頻動(dòng)畫。支持長(zhǎng)文件名,斷點(diǎn)續(xù)傳,支持代理服務(wù)器。
31. eCatch 3.0
簡(jiǎn)單實(shí)用的離線瀏覽器。由使用者設(shè)定所要觀看的網(wǎng)址及連結(jié)的層數(shù),而直接抓取并建立一個(gè)「可瀏覽的連結(jié)網(wǎng)頁」到使用者的電腦中,以供使用者方便快速的直接在電腦中瀏覽這些網(wǎng)頁,可以監(jiān)視及下載數(shù)以千計(jì)的網(wǎng)頁以供離線觀看??勺杂喗M態(tài)抓取網(wǎng)頁中的特殊文件,像是多媒體文件及自解壓縮文件等。
32. WebStripper 2.62
是一個(gè)離線瀏覽器,可以快速、準(zhǔn)確地將站點(diǎn)下載到你的硬盤中。它的使用非常簡(jiǎn)單,而且還提供了多個(gè)過濾條件,比如:圖像文件的大小等,另外,它還可以提取新的或是升級(jí)的頁面。
33. DISCo Pump 3.1
這是一個(gè)離線瀏覽器,具有交互性的界面,獨(dú)一無二的文件樹、瀏覽向?qū)D、頁面圖標(biāo)、預(yù)覽選項(xiàng)。通過它你可以速度地將網(wǎng)頁保存到本地,然后離線慢慢進(jìn)行瀏覽。
34. GetBot 3.04
GetBot儲(chǔ)存網(wǎng)頁、抓文件兩相宜用GetBot可以很快的將網(wǎng)頁中所有的MP3文件或者圖形文件。你只要將網(wǎng)址貼進(jìn)GetBot位址列中,GetBot就會(huì)完整的顯示出該網(wǎng)站的所有網(wǎng)頁以及文件。然后你只要選取要下載的網(wǎng)頁以及文件,按下get鈕,GetBot就會(huì)幫你將所有文件抓回來了。而且GetBot也有續(xù)傳的功能,不怕抓文件抓到一半斷線。GetBot的使用算是很方便,甚至不需要安裝,直接就可以執(zhí)行。
35. 帖子離線瀏覽器 1.2
1.非常靈活:帖子左邊的分類名稱和roomid是根據(jù)xml文件動(dòng)態(tài)給出的,您可以隨便更改該文件從而顯示不同的內(nèi)容,正因?yàn)檫@樣,所以他可以適應(yīng)CSDN的任何改版。2.良好的兼容性:除了CSDN帖子外,通過修改xml配置文件可以適應(yīng)任何的離線帖子和從網(wǎng)上收集的文章,同時(shí)導(dǎo)入選項(xiàng)也是xml個(gè)數(shù)的,非常方便擴(kuò)充。3.綠色軟件,不寫注冊(cè)表。4.強(qiáng)大的查找功能,可以查找任何一個(gè)論壇或子論壇,而且可以遞歸。
36. 精華瀏覽器(MixBrowser) 1.7 簡(jiǎn)體中文版
精華瀏覽器是一款精致的離線瀏覽軟件,她可以幫你保存網(wǎng)頁、圖片和flash動(dòng)畫,并以網(wǎng)頁的形式瀏覽整理它們,輕松擁有自己的精華區(qū)。有了她你就可以保留那些對(duì)自己工作和生活有益的文章、原創(chuàng),精美的圖片和有趣的flash動(dòng)畫在身邊,使自己從疲勞的搜索再搜索,或“我記得在哪看過一篇文章”的遺憾中解脫出來,只需鼠標(biāo)一點(diǎn)即刻保存。作為瀏覽器,她更擁有鼠標(biāo)動(dòng)作、安全瀏覽和集成搜索、關(guān)鍵字加亮等特色功能,讓你的瀏覽更輕松、更舒適。
37. Power Siphon 1.9.6.0
這是個(gè)高效能的網(wǎng)絡(luò)蜘蛛人,讓你下載網(wǎng)站,或任何明確的網(wǎng)頁。并儲(chǔ)存到硬盤以便瀏覽使用。簡(jiǎn)單的提供網(wǎng)頁的URL或任何其它開啟的頁面來下載整個(gè)網(wǎng)頁,你可以實(shí)時(shí)觀看下載進(jìn)度,并且從硬盤中存取所有離線頁面。此程序還提供了一個(gè)壓縮已下載網(wǎng)頁成為單一執(zhí)行檔案。嵌入的觀看器讓你看你已下載成功的頁面,還包含滾動(dòng)顯示模式。
38. WebCopy 99 1.7
是一個(gè)可以直接將WEB 網(wǎng)頁拷貝儲(chǔ)存的軟件,包括可以拷貝整個(gè)網(wǎng)頁、文字、圖像、聲音及電子郵件等等,這樣即可離線觀看網(wǎng)頁。
39. 網(wǎng)絡(luò)獵手 2.5
這是一個(gè)很好的網(wǎng)上資料收集工具,在瀏覽器中,你可以通過右鍵菜單很方便的收集資料,你可以部分選取保存,也可以全部整頁的保存,而且保存下來的頁面更原來的一樣。并且支持拖拉保存,使你可以將沒有右鍵菜單的頁面很好的進(jìn)行保存。而且還提供了頁面上一些文檔鏈接(**.zip)的下載功能.下載下來的頁面可以進(jìn)行分類保存和編輯,并最終可以生成eBook(CHM)和HTML文件。
40. Flash Favorite 1.4.8.5.8
FlashFavori 允許你瀏覽下載到 Internet 臨時(shí)目錄中或當(dāng)前打開的網(wǎng)頁尚的 FLASH 文件。
41. NewsVampire 1.4
本軟件的主要功能是將眾多網(wǎng)站服務(wù)器上的網(wǎng)頁快速下載到本地機(jī)硬盤上以供離線瀏覽。其特點(diǎn)是采用了多線程循環(huán)下載技術(shù),可自動(dòng)將數(shù)百個(gè)網(wǎng)頁連同圖片自動(dòng)快速下載并存盤;用戶可以一邊下載,一邊瀏覽已經(jīng)下載的網(wǎng)頁,從而最大限度地利用網(wǎng)絡(luò)資源。全中文顯示,支持HTTP代理服務(wù)器。
42. CatchTheWeb Express 1.2
CatchTheWeb Express不但是個(gè)網(wǎng)頁瀏覽器,而且它還可以讓使用者將網(wǎng)頁從Internet抓取到電腦之中,然后重新組織安排各個(gè)網(wǎng)頁的順序、添加注解,而讓這些網(wǎng)頁具有如展示簡(jiǎn)報(bào)般的用途。只能一次抓取一個(gè)單一網(wǎng)頁,所以單單在抓取網(wǎng)頁的功能方面,并沒有離線瀏覽程序那么好用,但是對(duì)于網(wǎng)頁資訊的利用方面,卻是一個(gè)不錯(cuò)的簡(jiǎn)報(bào)輔助軟件。
43. QuadSucker Web 3.1
QuadSucker Web 是一個(gè)功能強(qiáng)大的離線瀏覽工具,它可以幫助你完整的將指定的網(wǎng)站中的所有文件和圖片,壓縮包,多媒體視頻或者音頻文件統(tǒng)統(tǒng)下載下來,完全自動(dòng)化操作,不需要人為的干預(yù)就可以輕松完成所有的下載工作 ..
44. Website Extractor 9.30
該軟件可以下載某個(gè)網(wǎng)站中符合您指定條件,如關(guān)鍵字、文件類型、大小等的文件。
45. JOC Web Spider 3.72
離線瀏覽器, 支持 VBScript & JavaScript。
46. ImageSiteGrabber Pro 2.4.1
可以讓您直接指定要抓取的網(wǎng)頁以及網(wǎng)站位置,然后就可以輕輕松松的將這些圖形文件影像給全部帶回家。提供自動(dòng)更名的功能。
47. Offline Commander 2.2
Offline Commander是一個(gè)網(wǎng)頁抓取工具,支持FILE、HTTP、HTTPS、FTP協(xié)議和Proxy,還可以對(duì)抓取回來的網(wǎng)頁資料做關(guān)鍵字、網(wǎng)址、標(biāo)題、內(nèi)文、文件大小、格式、文件修改日期等檢索設(shè)置。
48. NetAttache Pro 2.61
可以設(shè)定所要下載的網(wǎng)頁以及要下載的時(shí)間,NetAttache pro 會(huì)自動(dòng)的撥接連接到該網(wǎng)站,將你需要的網(wǎng)頁抓回來,然后再自動(dòng)斷線.它會(huì)依照你所設(shè)定的網(wǎng)頁「層數(shù)」,將網(wǎng)頁文件抓取回來.當(dāng)網(wǎng)路擁塞時(shí),它還會(huì)自動(dòng)重試 10 次,并且以每次同時(shí)抓取20個(gè)文件的超快速度來下載網(wǎng)頁.在下載的文件類型方面,你可以選擇要不要下載影像文件、聲音文件、Java、ActiveX、Plugins等等,甚至你還可以依照副檔名,來設(shè)定所要下載的檔案文件。
49. RafaBot 1.5
Rafabot是一個(gè)可以協(xié)助你將某站臺(tái)復(fù)制到自己硬盤上的工具程序。它能以快速且多工的方式將一個(gè)大網(wǎng)站內(nèi)的資料復(fù)制到硬盤上。你可以對(duì)它直接指定起始URL位址甚至是網(wǎng)頁搜尋引擎的搜尋結(jié)果,也可以指定外部連結(jié)讓Rafabot程序去為你將整個(gè)站臺(tái)復(fù)制下來。就算你所想復(fù)制的資料范圍超過原本網(wǎng)頁的范圍而延伸到其他的網(wǎng)頁去,Rafabot一樣可以將這種狀況處理的很好。在網(wǎng)頁復(fù)制下來后,你可以用多種條件去過濾你所找到的資料,讓你從一大堆下載下來的網(wǎng)頁資料中快速找到你所想要的資料。網(wǎng)頁一但下載到你的硬盤后,你就可以在不連接Internet的情況下去讀取這些網(wǎng)頁資料了。
50. HMView 4.04
不錯(cuò)的離線瀏覽器.像是網(wǎng)頁中的Form, Frame, Image Maps等都可以被完整的抓回來.
51. NewsLook 2.01 build0320
新聞離線瀏覽器,是一個(gè)能將互聯(lián)網(wǎng)上的新聞內(nèi)容快速下載到本地硬盤上,并可進(jìn)行離線瀏覽的軟件.它不僅具有下載速度快,操作簡(jiǎn)便,節(jié)省上網(wǎng)時(shí)間等特點(diǎn),還具有個(gè)性化的新聞?dòng)嗛喓头奖愕男侣勈詹毓芾砉δ?她可根據(jù)個(gè)人的興趣愛好需要,訂閱自己喜歡的新聞下載類型,并可設(shè)立相應(yīng)的新聞收藏夾,用于管理新聞.而且它還是免費(fèi)軟件,無需注冊(cè)繳費(fèi)。
52. WebCopier Pro 4.3
是一個(gè)強(qiáng)大的離線瀏覽器,可以同時(shí)對(duì)100個(gè)文件進(jìn)行下載。支持代理服務(wù)器。內(nèi)置了強(qiáng)大的搜索功能。
53. WebRecorder 2.0a
專為下載大文件、網(wǎng)站的一部分或者是整個(gè)網(wǎng)站而設(shè)計(jì)的,它支持?jǐn)帱c(diǎn)續(xù)傳、時(shí)間調(diào)度等。
54. Personal Internet Engine 3.0.6
離線瀏覽器,可以下載指定網(wǎng)站,并用樹型結(jié)構(gòu)進(jìn)行顯示,支持進(jìn)行查找。
55. SurfSaver Pro 2.3
可以專門用來存取一張網(wǎng)頁,并且簡(jiǎn)單易用。它可以完好無損地保存網(wǎng)頁,無論是圖片、文字、超級(jí)鏈接以及Frame等等的都可儲(chǔ)存在名為*.ask的文件中,所以一張網(wǎng)頁就是一個(gè)文件。與眾不同的是,Surfaver支持全文搜索,支持布爾方式和模糊查詢,并且你還可以為你所需要保存的網(wǎng)頁加上標(biāo)題、注釋和索引,也可把該網(wǎng)頁E-mail給你的朋友,當(dāng)然前提是他也必須用該軟件來閱讀。
56. SurfOffline 1.4.1
操作簡(jiǎn)單的網(wǎng)頁離線瀏覽工具 - SurfOffline,使用它的精靈引導(dǎo),輸入您所要下載的網(wǎng)站網(wǎng)址,告訴它您所要下載的深度,這個(gè)站臺(tái)就會(huì)下載回來在您的計(jì)算機(jī)中,下次要瀏覽時(shí),不用聯(lián)機(jī),開啟您所儲(chǔ)存的項(xiàng)目,便可以離線瀏覽,唯一的缺點(diǎn):不支持 Flash。
57. WebMirror 1.40
WebMirror 可以將網(wǎng)站快速下載到本地,以供脫機(jī)瀏覽。它可以提供頁面大小和時(shí)間的信息。
58. Site-Thief 1.8.0
一款可以將整個(gè)網(wǎng)站內(nèi)容都下載下來的工具,為用戶提供了下載某個(gè)網(wǎng)站的選定部分或全部?jī)?nèi)容的能力,并將下載的內(nèi)容儲(chǔ)存在本地硬盤,從而可以離線使用.
59. HTML Converter 2.0
該軟件可以把 IE4、IE5、Netscape 或 Opera 的 Cache 轉(zhuǎn)換為離線的、可以瀏覽的網(wǎng)頁。
60. HyperMaker HTML Viewer 3000.27
與HyperMaker HTML配套使用的HTML文本查看工具。
61. Power Siphon 1.9.1 Build 24
這是個(gè)高效能的網(wǎng)絡(luò)蜘蛛人,讓你下載網(wǎng)站,或任何明確的網(wǎng)頁。并儲(chǔ)存到硬盤以便瀏覽使用。簡(jiǎn)單的提供網(wǎng)頁的URL或任何其它開啟的頁面來下載整個(gè)網(wǎng)頁,你可以實(shí)時(shí)觀看下載進(jìn)度,并且從硬盤中存取所有離線頁面。此程序還提供了一個(gè)壓縮已下載網(wǎng)頁成為單一執(zhí)行檔案。嵌入的觀看器讓你看你已下載成功的頁面,還包含滾動(dòng)顯示模式。
62. WebCapture 1.0
一款 Internet 網(wǎng)絡(luò)工具??捎糜跒g覽網(wǎng)頁、生成鏡像網(wǎng)站、下載文件、管理internet鏈接等等??蓪⒄麄€(gè)網(wǎng)站備份到本地硬盤的工具,也可根據(jù)需要將網(wǎng)絡(luò)鏈接改為指向備份后的本地文件,這樣可以離線時(shí)瀏覽備份后的網(wǎng)站。還可以將要發(fā)布的整個(gè)網(wǎng)站整合到一個(gè)可執(zhí)行文件,這樣就可以在一個(gè)整合的瀏覽器里瀏覽你的網(wǎng)頁。
63. WebSlinky 1.13 Build 105
WebSlinky 是一款非常小巧的離線瀏覽的軟件,簡(jiǎn)單易用,它可以將你訪問站點(diǎn)的結(jié)構(gòu)復(fù)制到你的計(jì)算機(jī)上。
64. Zip Up The Web Lite 2.0.1
可以把整個(gè)網(wǎng)頁完整的儲(chǔ)存起來,含圖及文字部分,又能把抓下來的文件儲(chǔ)存成exe檔,也就是把抓取回來的網(wǎng)頁壓縮成一個(gè)exe執(zhí)行檔。所以他比其他的類似軟件更容易傳遞,也比較容易使用。
65. WebVCR 2.16
如同家中的VCR般的離線瀏覽程序,它有一個(gè)強(qiáng)大的程序向?qū)绾武浿颇P(guān)看的網(wǎng)頁內(nèi)容,它并可讓您同時(shí)使用多個(gè)網(wǎng)站的錄制,完全不受限制。它支援IE2.0及Netscape 2.0以上版本的瀏覽器。
66. Website Extractor 9.30 漢化版
該軟件可以下載某個(gè)網(wǎng)站中符合您指定條件,如關(guān)鍵字、文件類型、大小等的文件。 Website Extractor 幫你把整個(gè)網(wǎng)站搬搬搬…搬回家! 需要離線瀏覽時(shí),你會(huì)怎么做?打開 IE,選「儲(chǔ)存完整網(wǎng)頁」的功能?若是需要一個(gè)有一千頁的網(wǎng)站呢??jī)?chǔ)存一千次嗎?Website Extractor 可以讓你輸入一次網(wǎng)頁 URL,就等著所有的網(wǎng)頁通通下載到硬盤中吧! 推薦人評(píng)價(jià) ========== Website Extractor 讓你下載整個(gè)網(wǎng)站或是連結(jié)。你可以設(shè)定下載的條件,免得下載過多的文件: · 包含/不包含特定的關(guān)鍵詞 · 指定網(wǎng)域、目錄 · 文件大小、型式、名稱 · 要不要下載圖片等等。 Website Extractor 可以讓你同時(shí)下載最多 100 個(gè)文件,大幅節(jié)省上網(wǎng)的時(shí)間、費(fèi)用。因?yàn)榫€路品質(zhì)不好有文件傳不下來嗎?Website Extractor 提供續(xù)傳的功能讓你把沒抓到的文件補(bǔ)回來。 最棒的是,Website Extractor 是完全免費(fèi)的,沒有討厭的廣告在旁邊煩你! ---------------------------------------------------------------- 漢化說明 ======== 該軟件原本帶有多語言支持,但經(jīng)測(cè)試,發(fā)現(xiàn)該功能很不完善,而且遺漏了幾個(gè)標(biāo)準(zhǔn)資源的字符串,故本人發(fā)布的為直接修改資源的版本。無需原版。 漢化版相對(duì)于原版所作的更改: · 漢化文件:webextra.exe、DDOMAIN.TXT、default.txt; · 在 README.TXT 中添加漢化自述; · 刪除了所有的語言文件; · 去除了主程序菜單中的語言選項(xiàng); · 添加 XP 主題支持文件 webextra.exe.manifest,一定程度上美化了 XP 系統(tǒng)中的顯示。 P.S. 大家都說這個(gè)軟件是免費(fèi)版,可實(shí)際上經(jīng)本人研究,該軟件乃共享軟件泄漏之官方注冊(cè)版也。不過不管怎樣,好?/ca>
二、如何批量抓取網(wǎng)頁文字
如果你想要批量的抓取網(wǎng)頁文字,那么首先把當(dāng)前的頁面所有的元素全部都放在一個(gè)數(shù)組當(dāng)中,然后遍歷這個(gè)數(shù)組這個(gè)數(shù)組當(dāng)中,所有的 context屬性全部都設(shè)置為另外一個(gè)數(shù)組的內(nèi)容,這樣把另外一個(gè)數(shù)組相連接就是所有的文字。
三、python怎么抓取網(wǎng)頁中DIV的文字
1、編寫爬蟲思路:
確定下載目標(biāo),找到網(wǎng)頁,找到網(wǎng)頁中需要的內(nèi)容。對(duì)數(shù)據(jù)進(jìn)行處理。保存數(shù)據(jù)。
2、知識(shí)點(diǎn)說明:
1)確定網(wǎng)絡(luò)中需要的信息,打開網(wǎng)頁后使用F12打開開發(fā)者模式。
在Network中可以看到很多信息,我們?cè)陧撁嫔峡吹降奈淖中畔⒍急4嬖谝粋€(gè)html文件中。點(diǎn)擊文件后可以看到response,文字信息都包含在response中。
對(duì)于需要輸入的信息,可以使用ctrl+f,進(jìn)行搜索。查看信息前后包含哪些特定字段。
對(duì)于超鏈接的提取,可以使用最左邊的箭頭點(diǎn)擊超鏈接,這時(shí)Elements會(huì)打開有該條超鏈接的信息,從中判斷需要提取的信息。從下載小說來看,在目錄頁提取出小說的鏈接和章節(jié)名。
2)注意編碼格式
輸入字符集一定要設(shè)置成utf-8。頁面大多為GBK字符集。不設(shè)置會(huì)亂碼。
四、如何用python實(shí)現(xiàn)在爬取到某網(wǎng)頁搜索框中,并輸入文字后,自動(dòng)搜索信息并抓取
網(wǎng)絡(luò)爬蟲只能根據(jù)你指定的url爬取網(wǎng)頁的html代碼,至于你想要包含指定內(nèi)容的網(wǎng)頁的話,只能先爬取下來網(wǎng)頁,然后在對(duì)頁面內(nèi)容進(jìn)行匹配(正則,也有開源工具)找到你想要的內(nèi)容就可以了!順便說一句網(wǎng)絡(luò)爬蟲不能根據(jù)關(guān)鍵字來爬取網(wǎng)頁!
以上就是關(guān)于網(wǎng)頁文字抓取工具相關(guān)問題的回答。希望能幫到你,如有更多相關(guān)問題,您也可以聯(lián)系我們的客服進(jìn)行咨詢,客服也會(huì)為您講解更多精彩的知識(shí)和內(nèi)容。
推薦閱讀:
如何自己建立一個(gè)網(wǎng)頁(如何自己建立一個(gè)網(wǎng)頁文檔)
html網(wǎng)頁制作(html網(wǎng)頁制作代碼大全)
手繪室內(nèi)設(shè)計(jì)圖(室內(nèi)設(shè)計(jì)圖手繪)
廣告公司業(yè)務(wù)流程(廣告公司業(yè)務(wù)流程模板)
猜你喜歡
外貿(mào)電商美工工作內(nèi)容(外貿(mào)電商美工工作內(nèi)容有哪些)
做ui設(shè)計(jì)工作中還做電商(做ui設(shè)計(jì)工作中還做電商工作嗎)
網(wǎng)上帶你做電商能相信嗎(網(wǎng)上帶你做電商能相信嗎知乎)
直播久了會(huì)得什么?。ㄗ鲋鞑槭裁春苋菀滓钟簦?/a>
在小區(qū)做團(tuán)購賺錢嗎(在小區(qū)做團(tuán)購賺錢嗎知乎)
怎么看百度搜索熱度(怎么看百度搜索熱度數(shù)據(jù))
一個(gè)號(hào)碼抖音可以開幾個(gè)號(hào)(一個(gè)號(hào)碼抖音可以開幾個(gè)號(hào)嗎)
問大家
韶關(guān)效果好的網(wǎng)頁美工設(shè)計(jì)目前需要多少錢?各位同志們幫回復(fù)下
邳州比較好的網(wǎng)頁美工設(shè)計(jì)費(fèi)用多少錢?在座的筒子們幫忙回一下
南京可靠的網(wǎng)頁美工設(shè)計(jì)正常多少錢?朋友們問一下
汕頭值得選擇的網(wǎng)頁美工設(shè)計(jì)價(jià)格預(yù)估多少?在座的好基友們急急急
泰興人性化的網(wǎng)頁美工設(shè)計(jì)大概是多少錢?在座的老鄉(xiāng)們幫回答下
福安著名的網(wǎng)頁美工設(shè)計(jì)負(fù)責(zé)人手機(jī)號(hào)有么?各位老司機(jī)們跪求解答
電商設(shè)計(jì),網(wǎng)頁設(shè)計(jì),影視后期,哪個(gè)好,工資待遇高,門檻低點(diǎn)?
工作幾年了,想改行做網(wǎng)頁設(shè)計(jì),現(xiàn)在零基礎(chǔ),打算邊工作邊自學(xué),大概多久可以入門呢?
昆山值得推薦的網(wǎng)頁美工設(shè)計(jì)哪家口碑好?在座的筒子們幫忙回一下
宿遷口碑好的網(wǎng)頁美工設(shè)計(jì)公司號(hào)碼有么?在座的筒子們幫忙回一下
濟(jì)南哪家婚姻介紹所比較好?最真實(shí)可靠的?口碑好的?