從品牌網(wǎng)站建設(shè)到網(wǎng)絡(luò)營銷策劃,從策略到執(zhí)行的一站式服務(wù)
來源:東莞網(wǎng)站建設(shè) | 2015-04-21 15:56:05
官方IP工具的介紹為:網(wǎng)站建設(shè)站長可以通過該工具查詢站點(diǎn)的抓取異常數(shù)據(jù)明細(xì),包括死鏈、UA封禁、IP封禁、重定向等問題,還提供異常數(shù)據(jù)下載供站長自行分析。網(wǎng)站建設(shè)站長們可以根據(jù)這些數(shù)據(jù),更高效地解決網(wǎng)站與搜索引擎互動(dòng)的問題。
官方說明中對(duì)“抓取異常”的解釋為:對(duì)于互聯(lián)網(wǎng)中可正常訪問的內(nèi)容,百度Spider抓取的結(jié)果應(yīng)與普通用戶訪問的內(nèi)容是一致的,除此以外的情況,就是抓取異常。不過綜合看抓取異常工具中給出的數(shù)據(jù),“異常”不僅僅局限于官方所述的“訪問內(nèi)容不一致”,而是對(duì)常見的能給網(wǎng)站在百度搜索中造成不良影響的“異常”都進(jìn)行了提示。
抓取異常工具所給出的數(shù)據(jù)是具有非常重要參考意義的。在平時(shí)的日志分析中,服務(wù)器對(duì)spider返回404. 301. 302. 403. 500狀態(tài)碼的URL都是重點(diǎn)分析對(duì)象,并且大都是尋找和研究對(duì)Spider返回這些狀態(tài)碼頁面中非正常的頁面,即使有技術(shù)支持,也需要人工來逐行發(fā)現(xiàn)和提取非正常記錄,這是一個(gè)非常耗費(fèi)眼睛、時(shí)間和精力的工作?,F(xiàn)在百度直接通過抓取異常工具把這些狀態(tài)碼中非正常的抓取數(shù)據(jù)舉例給出來了,既為不懂得分析網(wǎng)站日志的站長提供了技術(shù)數(shù)據(jù)支持,也為經(jīng)常進(jìn)行日志分析的網(wǎng)站建設(shè)站長和SEO人員免去了大量枯燥繁雜的工作,當(dāng)僅僅需要研究這幾個(gè)狀態(tài)碼的情況時(shí),不再需要針對(duì)龐大的日志文件進(jìn)行提取分析了,直接根據(jù)此工具給出的示例數(shù)據(jù)進(jìn)行擴(kuò)展分析就可以了。
抓取異常工具除幫助網(wǎng)站建設(shè)站長和SEO人員減少網(wǎng)站日志分析工作之外,還提供一些網(wǎng)站日志無法體現(xiàn)的百度官方權(quán)威的數(shù)據(jù)。比如在百度搜索眼中:網(wǎng)站是否存在判斷百度Spider,然后專門返回和普通用戶不同內(nèi)容網(wǎng)頁的情況;網(wǎng)站是否存在針對(duì)來自于百度搜索的用戶和其他來源用戶返回不同內(nèi)容網(wǎng)頁;網(wǎng)站是否存在針對(duì)已經(jīng)被百度索引的網(wǎng)頁進(jìn)行直接JS跳轉(zhuǎn)等有作弊嫌疑的行為。有時(shí)網(wǎng)站可能不是出于作弊,只是技術(shù)操作失誤,或網(wǎng)站出現(xiàn)BUG才出現(xiàn)此類異常,網(wǎng)站管理員根據(jù)這些數(shù)據(jù)就可以及時(shí)地發(fā)現(xiàn)并解決這些問題。
當(dāng)然這只是百度Spider作為一個(gè)普通訪問者和Spider的雙重身份所給出的異常數(shù)據(jù)。由于Spider并不會(huì)記錄cookie,也不會(huì)耗費(fèi)大量時(shí)間解讀iFrame和JS中的內(nèi)容,所以站長通過Cookie或iFame及JS等方式,來實(shí)現(xiàn)Spider及來自于百度搜索的用戶和其他普通訪問用戶所看網(wǎng)頁內(nèi)容不同的目的,不論此工具提醒與否,都不會(huì)被當(dāng)做作弊處理。并且雖然百度表示會(huì)提供網(wǎng)站針對(duì)不同來源用戶返回不同結(jié)果的異常數(shù)據(jù),但是至今還沒有見過有網(wǎng)站建設(shè)站長獲得此類數(shù)據(jù)及進(jìn)行這方面的討論。