660
shares
聚米幫你連接全球客戶
服務熱(rè)線:400-8817-968
發布于:2019-10-28
像SEO中的(de)許多(duō)其他(tā)概念一樣,TF-IDF是一個(gè)備受争議(yì)的(de)話(huà)題。
首先,您了(le)解到它是将您的(de)内容在Google上排名的(de)靈丹妙藥。然後,您立即聽(tīng)到TF-IDF 太老派了(le),不值得(de)付出任何努力,真相通(tōng)常位于中間。這(zhè)篇文章(zhāng)将探討(tǎo)爲什(shén)麽您不應該期望TF-IDF替代全面的(de)優化(huà)策略,以及将其用(yòng)于SEO的(de)真正好處。
TF-IDF:那是什(shén)麽?
對(duì)于人(rén)類的(de)大(dà)腦(nǎo)來(lái)說,不需要任何數學運算(suàn)就能知道我的(de)文章(zhāng)是關于什(shén)麽的(de)。關于TF-IDF,對(duì)不對(duì)?
但是,當一台機器評估相關性(最重要的(de)是,将其與幾篇文章(zhāng)進行比較)時(shí),我們需要一個(gè)數字表示形式才能看到:
(1)A條是關于TF-IDF(相對(duì)于鏈接構建而言)。
(2)A條比B條更多(duō)地是關于TF-IDF。
我們能否簡單地計算(suàn)一下(xià)關鍵字TF-IDF在每個(gè)文檔中出現的(de)次數?
不可(kě)以,因此我們顯然會忽略文件的(de)大(dà)小。
我們可(kě)以将關鍵字的(de)數量與總字數進行比較嗎?
這(zhè)就是我們所說的(de)關鍵字密度 ,過去廣泛使用(yòng)的(de)内容優化(huà)指标。
但是依靠關鍵字密度使我認爲“要”(不是“ TF-IDF”)一詞是本文中最突出的(de)一個(gè)。
對(duì)于某些單詞通(tōng)常在語音(yīn)中出現頻(pín)率更高(gāo)的(de)事實,是否可(kě)以調整我的(de)計算(suàn)?
這(zhè)就是TF-IDF發揮作用(yòng)的(de)地方,讓我們看一下(xià)本文中“ TF-IDF”的(de)使用(yòng)頻(pín)率與Web其他(tā)文檔中其平均使用(yòng)頻(pín)率的(de)比較。
因此,我們可(kě)以減少對(duì)所有常用(yòng)單詞的(de)關注,并爲特定的(de)内容區(qū)分(fēn)非常具體的(de)主題。
計算(suàn)公式如下(xià):
或者,簡單地說(免責聲明(míng):爲了(le)傳達基本思想,我故意在這(zhè)裏過分(fēn)簡化(huà)),我們正在:
(1)字詞頻(pín)率=(字詞計數)/(文檔中的(de)總字數)
(2)反向文檔頻(pín)率=日志(文檔數)/(包含關鍵字的(de)文檔)
與反向文檔頻(pín)率相乘時(shí),常用(yòng)詞的(de)術語頻(pín)率會降低,而唯一的(de)主題識别術語則會更高(gāo)。
回到我們的(de)示例,動詞“ to be”用(yòng)在每篇英語文章(zhāng)中。但是很少有文章(zhāng)提到“ TF-IDF”,“關鍵字”,“内容”以及我在本文中介紹的(de)其他(tā)重要子主題。
因此,這(zhè)些術語的(de)TF-IDF變得(de)更高(gāo),并且……v oila!機器知道我的(de)文章(zhāng)是關于什(shén)麽的(de)。
通(tōng)常,當我們需要一台機器來(lái)識别大(dà)量文檔的(de)主題時(shí),可(kě)以使用(yòng)TF-IDF。例如,它已廣泛應用(yòng)于數字圖書(shū)館的(de)推薦系統中。
Google是否使用(yòng)TF-IDF作爲排名信号?
TF-IDF在許多(duō)Google專利中都被稱爲搜索引擎可(kě)以用(yòng)來(lái)删除停用(yòng)詞的(de)工具,這(zhè)是爲了(le)擺脫搜索查詢中以及頁面内容中的(de)所有功能詞:
但是使用(yòng)這(zhè)種确切的(de)機制來(lái)識别和(hé)比較相關性的(de)可(kě)能性很小。
僅僅因爲作爲詞法搜索機制的(de)示例,TF-IDF無法超越關鍵字。
與Google最可(kě)能使用(yòng)的(de)語義搜索模型相反,該模型将關鍵字視爲字符串,無法識别它們之間的(de)語義關系。
換句話(huà)說,TF-IDF本身不是确定您頁面位置的(de)排名信号。
您不需要爲内容中的(de)每個(gè)關鍵字匹配預期的(de)TF-IDF值。而且,最好不要試圖說服您。
語義搜索和(hé)共現
因此,Google已轉向語義搜索,試圖将搜索查詢的(de)含義與局部相關的(de)内容進行匹配,而不是将查詢關鍵字與頁面上的(de)相同關鍵字進行匹配。
更加智能地工作,并提高(gāo)您的(de)PPC性能。
使用(yòng)屢獲殊榮的(de)平台管理(lǐ)和(hé)優化(huà)您的(de)在線廣告。擊敗競争對(duì)手,自動化(huà)工作量,并赢得(de)Adzooma的(de)支持。
實際上,這(zhè)意味著(zhe)Google不再計算(suàn)關鍵字本身,而是開始使用(yòng)周圍的(de)上下(xià)文理(lǐ)解它們的(de)含義來(lái)統計同現。
例如,假設您遇到以下(xià)句子,但不知道鳟魚是什(shén)麽:
(1)鳟魚富含omega-3脂肪酸。
(2)鳟魚肉嫩,味道溫和(hé),有點堅果味。
(3)選擇鳟魚時(shí),我們要注意清晰的(de)橘紅色。
而且您還(hái)會遇到以下(xià)情況。我認爲大(dà)多(duō)數讀者都知道鲑魚是什(shén)麽:
(1)鲑魚是西方美(měi)食中一種受歡迎的(de)魚類,與白葡萄酒搭配非常好。
(2)嫩鲑魚肉可(kě)以添加到意大(dà)利面中。
(3)鲑魚皮是超級營養密集的(de)食品,所以在做(zuò)飯時(shí)要保留它。
鳟魚與omega-3,果肉和(hé)面食之類的(de)詞同時(shí)出現的(de)事實可(kě)能表明(míng),鳟魚是一種可(kě)食用(yòng)的(de)魚類,在某種程度上類似于鲑魚。
基于對(duì)上下(xià)文的(de)這(zhè)種簡單理(lǐ)解,Google能夠構建複雜(zá)的(de)單詞向量系統,進一步用(yòng)于理(lǐ)解用(yòng)戶查詢和(hé)内容相關性。
盡管我不是說您,而且我應該嘗試對(duì)整個(gè)矢量系統進行逆向工程,但通(tōng)過增加更多(duō)并發來(lái)豐富您的(de)内容來(lái)提供更多(duō)相關信号似乎是合乎邏輯的(de)(而且,如若幹 案例研究所示,這(zhè)确實會影(yǐng)響Google排名) 。
TF-IDF如何幫助您的(de)SEO?
查找共同出現的(de)術語正是TF-IDF發揮作用(yòng)的(de)地方。
當然,我們無法像Google一樣訪問每個(gè)網頁。但是爲什(shén)麽我們需要那些呢(ne)?
要獲得(de)一個(gè)同時(shí)出現的(de)想法的(de)完整列表,隻需看一堆頁面(例如20到30頁)就足夠了(le)。
美(měi)妙之處在于,使用(yòng)TF-IDF并不是火箭科學。您所要做(zuò)的(de)全部僅需三個(gè)簡單步驟。
(1)撰寫您的(de)内容
我并不是在敦促您使TF-IDF成爲您内容的(de)目的(de)。最後,即使頁面排名很高(gāo)并帶來(lái)所需的(de)訪問量,不自然的(de)寫作也(yě)不會轉換。因此,首先,您要坐(zuò)下(xià)來(lái)寫下(xià)内容計劃中的(de)内容。
(2)插入TF-IDF工具
我見過的(de)大(dà)多(duō)數工具的(de)工作原理(lǐ)都差不多(duō)。您輸入一個(gè)URL和(hé)要對(duì)其進行優化(huà)的(de)關鍵字。然後,該工具會檢查該關鍵字在Google上的(de)排名頁面,解析其内容,爲找到的(de)所有字詞計算(suàn)TF-IDF,并将您的(de)内容統計信息與競争對(duì)手的(de)統計數據進行比較。
使用(yòng)Seobility等基本工具,您将獲得(de)一個(gè)單關鍵字列表。
如果您使用(yòng)的(de)是SEO PowerSuite的(de)WebSite Auditor,Ryte或Text Tools,那麽您還(hái)将獲得(de)一個(gè)關鍵短語列表(如果您喜歡科學的(de)話(huà),也(yě)可(kě)以使用(yòng)N-gram),這(zhè)無疑會提供更多(duō)信息。
(3)通(tōng)過TF-IDF并發建議(yì)來(lái)豐富您的(de)内容
有些短語将隻是您内容中已有的(de)同義詞,如果合适,請嘗試使用(yòng)它們,其中一些短語會指出您尚未想到的(de)新主題。
篩選想法,并思考在内容中使用(yòng)它們的(de)方式(不必沉迷于它們)。
TF-IDF用(yòng)于關鍵字研究
從競争對(duì)手的(de)内容中選擇使用(yòng)最廣泛的(de)術語,也(yě)可(kě)能會在關鍵字研究和(hé)内容計劃中激發出新的(de)想法,尤其是當您覺得(de)需要開箱即用(yòng)的(de)思維和(hé)靈感時(shí)。
最後,很多(duō)時(shí)候,您會看到TF-IDF用(yòng)作點擊誘餌,這(zhè)些文章(zhāng)都承諾該公式是“ Google算(suàn)法逆向工程”或“破壞TF-IDF的(de)神話(huà)”。
但是,我鼓勵您将事物(wù)視爲真實事物(wù),并利用(yòng)TF-IDF優化(huà)提供的(de)機會。無需将整個(gè)SEO活動都押在上面。
評論展示
660
shares
掃碼加微信咨詢
15815846676
長(cháng)按号碼加微信
在線留言
參與評論