改善您的(de)頁面搜索引擎優化(huà)

發布于：2019-07-04

談論我們一遍又一遍看到的(de)一些常見的(de)頁面陷阱會很有幫助，以下(xià)這(zhè)些點可(kě)以改善您的(de)頁面搜索引擎優化(huà)。

1.抓取預算(suàn)

鑒于像谷歌(gē)這(zhè)樣的(de)搜索引擎爲每個(gè)域（和(hé)子域）分(fēn)配了(le)一定的(de)抓取預算(suàn)，我總是驚訝于網站所有者隻是試圖将所有内容都推送到索引中。而且對(duì)于哪些網站可(kě)以進行爬蟲訪問，他(tā)們似乎也(yě)完全不小心。

要在您的(de)網站上評估和(hé)解決這(zhè)些問題，一個(gè)很好的(de)起點是Google網站管理(lǐ)員(yuán)工具（轉到：抓取>抓取統計信息），它可(kě)以讓您初步了(le)解網站的(de)運作情況。一個(gè)成功的(de)圖表略有增加 - 這(zhè)通(tōng)常反映出Google會選擇添加的(de)内容，因此會更頻(pín)繁地返回。相反，如果該圖表跳躍或大(dà)幅減少，您可(kě)能會遇到問題。

有兩種方法可(kě)以控制搜索引擎抓取工具：使用(yòng)robots.txt指令并在HTML标記中實現漫遊器元标記（或将其作爲HTTP X-Robots标頭提供）。但是，這(zhè)兩個(gè)指令的(de)問題在于它們無法解決您的(de)（潛在的(de)）爬網預算(suàn)問題：

機器人(rén)元标記：實施正确的(de)“無索引 ”确實會阻止某個(gè)網頁顯示在搜索結果中，但該網頁仍會被抓取 - 因此必須使用(yòng)抓取預算(suàn)。

robots.txt： 阻止網址（或文件夾等）會阻止網站被抓取（因此不會浪費抓取預算(suàn)）; 然而，存在巨大(dà)的(de)缺點。一個(gè)是頁面可(kě)能仍然（部分(fēn)）顯示在搜索結果中（主要是由于從其他(tā)地方鏈接），所有入站鏈接汁将被截止。換句話(huà)說，這(zhè)些鏈接無助于您的(de)排名。

考慮到這(zhè)些要點，你可(kě)能會考慮将這(zhè)些結合起來(lái)......但請 - 不要！它根本無法工作。如果使用(yòng)robots.txt阻止某個(gè)網頁，則系統不會抓取該網站，因此根本無法讀取元漫遊器代碼！

注意過濾器和(hé)排序，分(fēn)頁以及其他(tā)可(kě)能無用(yòng)的(de)頁面。我們經常看到這(zhè)些隻是被推到了(le)索引，但肯定永遠(yuǎn)不會或将會排名。不要浪費谷歌(gē)的(de)資源！

根據經驗：如果你想确保不浪費爬行預算(suàn)，隻有頁面确實有用(yòng)（所以不要首先創建其他(tā)頁面）。如果你有其他(tā)人(rén)不想出現，我會使用(yòng)元機器人(rén)來(lái)至少利用(yòng)入站鏈接資産。

2.重複内容

我假設每個(gè)人(rén)都熟悉重複内容（DC）問題，但結果并非如此。由于大(dà)量的(de)内部（部分(fēn)）DC，看到有多(duō)少站點仍然表現不佳，我總是感到驚訝。盡管現在大(dà)多(duō)數網站都可(kě)以處理(lǐ)會話(huà)ID和(hé)跟蹤參數，但這(zhè)裏有一些“經典”我想提醒你：HTTP與HTTPs被認爲是DC，産品可(kě)用(yòng)于多(duō)個(gè)類别（并且不使用(yòng)單個(gè)産品URL也(yě)會導緻DC，子域（如登台服務器）可(kě)能會讓您遇到麻煩。

也(yě)就是說，rel =“canonical”元标記（或X-Robots Rel-Canonical Header）可(kě)以幫助您解決這(zhè)些問題，但我認爲這(zhè)是解決DC問題的(de)第三個(gè)最佳選擇。在我看來(lái)，這(zhè)完全取決于效率 - 因此解決問題的(de)最佳方法是确保您隻使用(yòng)一個(gè)（規範化(huà)的(de)）URL而不是多(duō)個(gè)URL來(lái)提供内容。就這(zhè)麽簡單。

我一般不會依賴谷歌(gē)稱之爲“強烈暗示”的(de)東西 - 因爲它暗示他(tā)們可(kě)能會或可(kě)能不會考慮，但實質上它并不像HTTP 301重定向那樣強制指令（他(tā)們很容易遵循）。

同樣，它歸結爲盡可(kě)能少的(de)谷歌(gē)選擇。使用(yòng)令人(rén)驚歎的(de)内容強制執行單個(gè)唯一的(de)URL，并将先前存在的(de)URL（例如，舊(jiù)版本或多(duō)個(gè)版本）重定向到此（新）URL，您将不會遇到DC問題。

3.正确标記

關于适當加價是否以及爲何重要的(de)問題，有很多(duō)不同意見。我并沒有真正參與討(tǎo)論，但我堅信幹淨簡單的(de)标記會有所幫助。這(zhè)主要是因爲我真的(de)不想冒險嘗試從站點中提取信息時(shí)爬蟲可(kě)能會出現“問題”。這(zhè)也(yě)是我認爲做(zuò)schema.org标記是一件好事的(de)原因：它可(kě)以幫助引擎（不僅是爬蟲）真正理(lǐ)解（部分(fēn)）内容并理(lǐ)解它。總之，要了(le)解它的(de)含義。

顯然，您必須考慮哪些信息可(kě)以并且想要提供給Google（以及其他(tā)人(rén)），但如果您不提供數據，他(tā)們會在其他(tā)地方獲取。所以一般來(lái)說，不要錯過這(zhè)個(gè)。它不僅僅是因爲更突出的(de)結果而獲得(de)更多(duō)的(de)點擊率 - 順便說一句，這(zhè)很棒 - 但是如果你将結構化(huà)數據與rel =“author”和(hé)/或rel =“publisher”相結合效益更大(dà)。基本上Google正在逐步理(lǐ)解并将經過驗證的(de)實體分(fēn)配給查詢集，您肯定不想錯過這(zhè)一點。在我看來(lái)，谷歌(gē)正在大(dà)規模地移動到你需要成爲給定實體的(de)經過驗證的(de)權限的(de)點，因此将自動受益于屬于該實體的(de)所有長(cháng)尾流量 - 這(zhè)很有意義，因爲事實是谷歌(gē)每天都會看到大(dà)約20％的(de)新查詢。

評論展示

參與評論

Rank:

ProductId:

姓名:
内容: