如果網(wǎng)站使用虛擬空間,就會(huì)有一些流量限制。如果大部分流量被蜘蛛占據(jù),我們需要花一些額外的錢(qián)來(lái)購(gòu)買(mǎi)流量。那么,如果一個(gè)網(wǎng)站上的大量流量被蜘蛛爬行浪費(fèi),有什么技能和方法可以限制搜索引擎優(yōu)化效果而不影響搜索引擎的優(yōu)化效果呢?企業(yè)推動(dòng)seo顧問(wèn)認(rèn)為我們可以采取以下方法:
1、找出假蜘蛛和盾牌IP。通過(guò)對(duì)網(wǎng)站日志的分析,我們可以知道許多所謂的百度蜘蛛或谷歌蜘蛛實(shí)際上是假的。我們可以分析這些假蜘蛛IP屏蔽它們不僅可以節(jié)省流量,還可以降低網(wǎng)站收集的風(fēng)險(xiǎn)。需要檢查具體操作ip是否是真正的蜘蛛,操作方法是:點(diǎn)擊左下角start-run-cmd-enter命令可以看到結(jié)果。如果是真的,搜索蜘蛛有蜘蛛標(biāo)記,但假蜘蛛沒(méi)有標(biāo)記。
2、屏蔽無(wú)效蜘蛛或搜索蜘蛛對(duì)搜索引擎優(yōu)化影響不大。例如,我們知道google蜘蛛是一種很大的抓取量,但對(duì)許多行業(yè)來(lái)說(shuō),google流量很低,seo效果不好,可以屏蔽google蜘蛛的抓取并節(jié)省很多流量,比如說(shuō)網(wǎng)站屏蔽了抓取量。谷歌蜘蛛。除了谷歌,還有一些蜘蛛,如谷歌搜索、必應(yīng)蜘蛛等。這些流量很低,或者幾乎沒(méi)有蜘蛛能真正躲開(kāi)。
3、使用robots.txt限制無(wú)效或重復(fù)頁(yè)面的爬網(wǎng)。有些頁(yè)面以前可能存在,但現(xiàn)在不存在,或動(dòng)態(tài)和靜態(tài)URL。蜘蛛仍然會(huì)不時(shí)地抓住它們,因?yàn)閿?shù)據(jù)庫(kù)中有反向鏈接或此類(lèi)鏈接。我們可以找到返回404頁(yè)的鏈接url并屏蔽,從而改進(jìn)抓取,屏蔽也減少了對(duì)流量的浪費(fèi)。
限制蜘蛛抓取頁(yè)數(shù)
4、限制頁(yè)面爬行內(nèi)容,提高爬行效率和速度,減少爬行流量。對(duì)于任何頁(yè)面,都有許多無(wú)效的噪聲區(qū)域,如網(wǎng)站登錄、注冊(cè)部分、底部版權(quán)信息、一些有用的鏈接導(dǎo)航等,或者一些模板上的蜘蛛無(wú)法識(shí)別的顯示模塊,我們可以使用這些模板添加nofollow標(biāo)簽。
5、外部鏈接或CDN加速,以改善蜘蛛捕獲,減少服務(wù)器響應(yīng)和流量浪費(fèi)。目前,大多數(shù)網(wǎng)站使用大量的圖片、視頻和其他多媒體來(lái)顯示,但這些圖片缺乏更多的下載流量。如果我們使用外部調(diào)用圖片,我們可以節(jié)省大量的蜘蛛爬行流量。目前,更好的方法是將圖片放在其他服務(wù)器上或上傳到一些磁盤(pán)上。
6、使用站長(zhǎng)工具限制或改進(jìn)蜘蛛抓取,或限制蜘蛛抓取時(shí)間。目前,百度站長(zhǎng)平臺(tái)和谷歌站長(zhǎng)平臺(tái)都有站長(zhǎng)抓取工具,可以用來(lái)限制蜘蛛抓取的時(shí)間和數(shù)量。我們可以根據(jù)需要合理部署,取得更好的效果。
當(dāng)然,在實(shí)踐中,我們也可以根據(jù)自己的實(shí)際需要來(lái)解決這個(gè)問(wèn)題,比如對(duì)于一些抓取量過(guò)大的欄目,在網(wǎng)站地圖上設(shè)置較低的抓取頻率,如果不包含一些重要的內(nèi)容,可以增加外部或內(nèi)部鏈來(lái)提高抓取效率等。該方法已失效,可根據(jù)具體情況進(jìn)行改進(jìn)。為了降低和提高抓取效率,更新期間的設(shè)置需要合理化。