伊人大香蕉久久动漫,国产日韩综合一区在线观看

網(wǎng)絡(luò)爬蟲(chóng)工具(NWebCrawler)

v1.0.1綠色版

請(qǐng)簡(jiǎn)要描述您遇到的錯(cuò)誤，我們將盡快予以修正。

輪壇轉(zhuǎn)帖HTML方式

輪壇轉(zhuǎn)帖UBB方式

網(wǎng)絡(luò)爬蟲(chóng)是一款一種按照一定的規(guī)則，自動(dòng)的抓取萬(wàn)維網(wǎng)信息的程序或者腳本。另外一些不常使用的名字還有螞蟻，自動(dòng)索引，模擬程序或者蠕蟲(chóng)，該又被稱(chēng)為網(wǎng)頁(yè)蜘蛛，網(wǎng)絡(luò)機(jī)器人，在FOAF社區(qū)中間，更經(jīng)常的稱(chēng)為網(wǎng)頁(yè)追逐者，歡迎需要的下載！

軟件介紹：

NwebCrawler是用C#寫(xiě)的一款多線(xiàn)程網(wǎng)絡(luò)爬蟲(chóng)程序，它的實(shí)現(xiàn)原理是先輸入一個(gè)或多個(gè)種子URL到隊(duì)列中，然后從隊(duì)列中提取URL（先進(jìn)先出原則），分析此網(wǎng)頁(yè)尋找相應(yīng)標(biāo)簽并獲得其href屬性值，爬取有用的鏈接網(wǎng)頁(yè)并存入網(wǎng)頁(yè)庫(kù)中，其中用爬取歷史來(lái)記錄爬過(guò)的網(wǎng)頁(yè)，這樣避免了重復(fù)爬取。提取URL存入隊(duì)列中，進(jìn)行下一輪爬取。所以NwebCrawler的搜索策略為廣度優(yōu)先搜索。采用廣度優(yōu)先策略有利于多個(gè)線(xiàn)程并行爬取而且抓取的封閉性很強(qiáng)。