660
shares
聚米幫你連接全球客戶
服務熱(rè)線:400-8817-968
發布于:2019-07-04
談論我們一遍又一遍看到的(de)一些常見的(de)頁面陷阱會很有幫助,以下(xià)這(zhè)些點可(kě)以改善您的(de)頁面搜索引擎優化(huà)。
1.抓取預算(suàn)
鑒于像谷歌(gē)這(zhè)樣的(de)搜索引擎爲每個(gè)域(和(hé)子域)分(fēn)配了(le)一定的(de)抓取預算(suàn),我總是驚訝于網站所有者隻是試圖将所有内容都推送到索引中。而且對(duì)于哪些網站可(kě)以進行爬蟲訪問,他(tā)們似乎也(yě)完全不小心。
要在您的(de)網站上評估和(hé)解決這(zhè)些問題,一個(gè)很好的(de)起點是Google網站管理(lǐ)員(yuán)工具(轉到:抓取>抓取統計信息),它可(kě)以讓您初步了(le)解網站的(de)運作情況。一個(gè)成功的(de)圖表略有增加 - 這(zhè)通(tōng)常反映出Google會選擇添加的(de)内容,因此會更頻(pín)繁地返回。相反,如果該圖表跳躍或大(dà)幅減少,您可(kě)能會遇到問題。
有兩種方法可(kě)以控制搜索引擎抓取工具:使用(yòng)robots.txt指令并在HTML标記中實現漫遊器元标記(或将其作爲HTTP X-Robots标頭提供)。但是,這(zhè)兩個(gè)指令的(de)問題在于它們無法解決您的(de)(潛在的(de))爬網預算(suàn)問題:
機器人(rén)元标記:實施正确的(de)“無索引 ”确實會阻止某個(gè)網頁顯示在搜索結果中,但該網頁仍會被抓取 - 因此必須使用(yòng)抓取預算(suàn)。
robots.txt: 阻止網址(或文件夾等)會阻止網站被抓取(因此不會浪費抓取預算(suàn)); 然而,存在巨大(dà)的(de)缺點。一個(gè)是頁面可(kě)能仍然(部分(fēn))顯示在搜索結果中(主要是由于從其他(tā)地方鏈接),所有入站鏈接汁将被截止。換句話(huà)說,這(zhè)些鏈接無助于您的(de)排名。
考慮到這(zhè)些要點,你可(kě)能會考慮将這(zhè)些結合起來(lái)......但請 - 不要!它根本無法工作。如果使用(yòng)robots.txt阻止某個(gè)網頁,則系統不會抓取該網站,因此根本無法讀取元漫遊器代碼!
注意過濾器和(hé)排序,分(fēn)頁以及其他(tā)可(kě)能無用(yòng)的(de)頁面。我們經常看到這(zhè)些隻是被推到了(le)索引,但肯定永遠(yuǎn)不會或将會排名。不要浪費谷歌(gē)的(de)資源!
根據經驗:如果你想确保不浪費爬行預算(suàn),隻有頁面确實有用(yòng)(所以不要首先創建其他(tā)頁面)。如果你有其他(tā)人(rén)不想出現,我會使用(yòng)元機器人(rén)來(lái)至少利用(yòng)入站鏈接資産。
2.重複内容
我假設每個(gè)人(rén)都熟悉重複内容(DC)問題,但結果并非如此。由于大(dà)量的(de)内部(部分(fēn))DC,看到有多(duō)少站點仍然表現不佳,我總是感到驚訝。盡管現在大(dà)多(duō)數網站都可(kě)以處理(lǐ)會話(huà)ID和(hé)跟蹤參數,但這(zhè)裏有一些“經典”我想提醒你:HTTP與HTTPs被認爲是DC,産品可(kě)用(yòng)于多(duō)個(gè)類别(并且不使用(yòng)單個(gè)産品URL也(yě)會導緻DC,子域(如登台服務器)可(kě)能會讓您遇到麻煩。
也(yě)就是說,rel =“canonical”元标記(或X-Robots Rel-Canonical Header)可(kě)以幫助您解決這(zhè)些問題,但我認爲這(zhè)是解決DC問題的(de)第三個(gè)最佳選擇。在我看來(lái),這(zhè)完全取決于效率 - 因此解決問題的(de)最佳方法是确保您隻使用(yòng)一個(gè)(規範化(huà)的(de))URL而不是多(duō)個(gè)URL來(lái)提供内容。就這(zhè)麽簡單。
我一般不會依賴谷歌(gē)稱之爲“強烈暗示”的(de)東西 - 因爲它暗示他(tā)們可(kě)能會或可(kě)能不會考慮,但實質上它并不像HTTP 301重定向那樣強制指令(他(tā)們很容易遵循)。
同樣,它歸結爲盡可(kě)能少的(de)谷歌(gē)選擇。使用(yòng)令人(rén)驚歎的(de)内容強制執行單個(gè)唯一的(de)URL,并将先前存在的(de)URL(例如,舊(jiù)版本或多(duō)個(gè)版本)重定向到此(新)URL,您将不會遇到DC問題。
3.正确标記
關于适當加價是否以及爲何重要的(de)問題,有很多(duō)不同意見。我并沒有真正參與討(tǎo)論,但我堅信幹淨簡單的(de)标記會有所幫助。這(zhè)主要是因爲我真的(de)不想冒險嘗試從站點中提取信息時(shí)爬蟲可(kě)能會出現“問題”。這(zhè)也(yě)是我認爲做(zuò)schema.org标記是一件好事的(de)原因:它可(kě)以幫助引擎(不僅是爬蟲)真正理(lǐ)解(部分(fēn))内容并理(lǐ)解它。總之,要了(le)解它的(de)含義。
顯然,您必須考慮哪些信息可(kě)以并且想要提供給Google(以及其他(tā)人(rén)),但如果您不提供數據,他(tā)們會在其他(tā)地方獲取。所以一般來(lái)說,不要錯過這(zhè)個(gè)。它不僅僅是因爲更突出的(de)結果而獲得(de)更多(duō)的(de)點擊率 - 順便說一句,這(zhè)很棒 - 但是如果你将結構化(huà)數據與rel =“author”和(hé)/或rel =“publisher”相結合效益更大(dà)。基本上Google正在逐步理(lǐ)解并将經過驗證的(de)實體分(fēn)配給查詢集,您肯定不想錯過這(zhè)一點。在我看來(lái),谷歌(gē)正在大(dà)規模地移動到你需要成爲給定實體的(de)經過驗證的(de)權限的(de)點,因此将自動受益于屬于該實體的(de)所有長(cháng)尾流量 - 這(zhè)很有意義,因爲事實是谷歌(gē)每天都會看到大(dà)約20%的(de)新查詢。
評論展示
660
shares
掃碼加微信咨詢
15815846676
長(cháng)按号碼加微信
在線留言
參與評論