蜘蛛: 蜘蛛(Spider)是搜索引擎的一個自動程序,它的作用是訪問互聯(lián)網上的HTML網頁 ,建立索引數(shù)據(jù)庫,使用戶能在搜索引擎中搜索到網站的網頁。
簡單的說,它是網站與搜索引擎交流的工具,正式有了蜘蛛,搜索引擎才能知道你的站點,進而才產生了收錄和排名。因為蜘蛛是一個自動程序,依靠各項設定的原則來行動,所以通過跟蹤蜘蛛的動向和搜索引擎的反應,就可以有的放矢地對網站進行優(yōu)化。
總是有人在一些論壇上發(fā)上一些關于百度收錄又消失的問題,我想就此發(fā)一下個人的觀點。一個網站的搜索引擎收錄量的高低,確實可以反應出網站現(xiàn)存在的一些不利于SEO的因素,這些就是阻礙網站在搜索引擎上表現(xiàn)更好的因素。
網站為什么收錄少?網站收錄少主要有如下兩類情況:
    A、網站內容本來就少,所以不可能收錄多 :
    比如,網站上總共有100頁內容,那么搜索引擎不可能收錄10,000頁。
    常見情況:用BBS系統(tǒng)建站,然后站長手工作坊式自己找內容、復制粘貼來建設內容
    B、網站雖有大量內容,但搜索引擎不喜歡所以收錄少:
    常見情況:使用小偷程序或使用采集器批量采集內容,但搜索引擎很少收錄,甚至造成整站被封。
搜索引擎不喜歡傳統(tǒng)采集的主要原因:
    傳統(tǒng)批量獲取的內容僅來自特定的一個或幾個網站,所以內容與目標網站大幅度重復,這是搜索引擎不收錄的最重要原因;
    傳統(tǒng)采集來的內容質量不高,主要是無有效過濾手段,比如采集來的很多內容都被添加了不相干的關鍵詞、或者關鍵詞堆積密度過高,造成搜索引擎連帶懲罰;
    傳統(tǒng)采集的內容與原網站完全一樣,但搜索引擎更喜歡原創(chuàng)內容;
    傳統(tǒng)采集后添加到網站的內容,彼此之間很少關聯(lián),這造成搜索引擎爬行一個頁面之后無法順利的爬行其他頁面,這也非常影響收錄。
    人工復制,雖然能保證內容質量,但又太累,并且獲取的總體內容太少,不行!
    傳統(tǒng)采集,雖然能快速獲得內容,但又要懂技術,并且搜索引擎不喜歡,還是不行!
首先 蜘蛛爬到你的主頁 會隨著你的鏈接不斷的進行爬尋 在爬尋的過程中不斷地將文章和百度首次收錄算法進行對比 這個要求很低 只要是出現(xiàn)他們喜歡的“關鍵字”你的站將很快就會被收錄,于是很多人的文章很快就被收錄了,歡天喜地,但是第二天卻又被百度刪除,哭喪著臉跑到各個論壇不斷的詢問,這是為什么呢?相信這是SEO初學者的一個共同疑問。
答案是 蜘蛛雖然把你帶回了家,但是他還要進行第二次數(shù)據(jù)對比,這就需要另外一只蜘蛛(這里強調下,研究搜索引擎的算法的時候我們一定要從實際出發(fā),如果你是搜索引擎蜘蛛的研究者,你是否能夠用一個蜘蛛就實現(xiàn)這個些功能呢,顯眼為了分工明確 百度派出了很多的蜘蛛各司其職 原理如同我們的CUP 多線程)將其與數(shù)據(jù)庫中的文章進行對比,如果文章內容重復讀超出60%便會默認為同樣的文章,這樣就是SEO界所謂的“頁面相似度過高”,容易導致失去百度信任進而有被降權的可能性.
總結,說了這么,主要就是闡述一下 很多人問過的 為何百度收錄了我的文章,很快又消失了的原因。SEO界有一句大家認同的話“內容為王”,的確是這樣老老實實做站 只要堅持內容原創(chuàng) 相信你的站距離成功不再遙遠。
[ 上一篇 ] 為什么網站百度快照慢?百度快照更新大絕密!
[ 下一篇 ] 關于論壇專項備案問答,個人能否申請論壇備案?
相關新聞
日期:19 瀏覽:38096
日期:19 瀏覽:33213
日期:19 瀏覽:24559
日期:19 瀏覽:22104
版權所有:啟邁科技-合肥網站建設 皖ICP備19009304號-1  皖公網安備 34010402702162號
皖公網安備 34010402702162號
網站建設,網站設計公司啟邁科技,為眾多企業(yè)提供網站建設,網站制作,響應式網站設計,手機網站建設,微網站,模板建站,企業(yè)郵箱等一站式互聯(lián)網解決方案和建站服務10年。