複制的內容

這裡的一個教訓是,在可能的情況下,避免添加URL參數或URL的替代版本(包含的信息通常可以通過腳本傳遞)通常是有益的八拓科技有限公司seo

2. HTTP與HTTPS或WWW與非WWW頁面
如果您的網站在“www.site.com”和“site.com”上有單獨的版本(帶有和不帶有“www”前綴),並且兩個版本都有相同的內容,那麼您已經有效地創建了每個版本的副本頁面。這同樣適用於在http://和https://維護版本的站點。如果頁面的兩個版本都是實時且對搜索引擎可見,則可能會遇到重複的內容問題。

3.剪輯或複制的內容
內容不僅包括博客文章或編輯內容,還包括產品信息頁面。在自己的網站上重新發布博客內容的刮板可能是更為熟悉的重複內容來源,但電子商務網站也存在一個常見問題:產品信息。如果許多不同的網站銷售相同的商品,並且他們都使用製造商對這些商品的描述,則相同的內容會在網絡上的多個位置展開。

如何解決重複的內容問題
修復重複內容問題都歸結為同一個中心思想:指定哪個重複是“正確”的重複。

只要在多個URL上找到網站上的內容,就應該為搜索引擎規範化。我們將介紹執行此操作的三種主要方法:使用301重定向到正確的網址,rel = canonical屬性,或使用Google Search Console中的參數處理工具。

301重定向
在許多情況下,打擊重複內容的最佳方法是設置從“重複”頁面到原始內容頁面的301重定向。

當多個具有良好排名的頁面組合成一個頁面時,它們不僅停止相互競爭;它們還會產生更強的相關性和流行度信號。這將對“正確”頁面排名良好的能力產生積極影響。

使用301重定向修復重複內容問題

相對=“規範”
處理重複內容的另一個選擇是使用rel = canonical屬性。這告訴搜索引擎應該將給定頁面視為指定URL的副本,並且搜索引擎應用於此頁面的所有鏈接,內容指標和“排名能力”實際應歸入指定的URL。

使用rel = canonical解決重複內容

rel =“canonical”屬性是網頁HTML頭部的一部分,如下所示:

一般格式:

<HEAD>
… [可能在您的文檔的HTML頭中的其他代碼] …
<link href =“URL OF ORIGINAL PAGE”rel =“canonical”/>
… [可能在您的文檔的HTML頭中的其他代碼] …
</ HEAD>
應將rel = canonical屬性添加到頁面的每個重複版本的HTML頭部,上面的“URL OF ORIGINAL PAGE”部分替換為原始(規範)頁面的鏈接。 (確保你保留引號。)該屬性傳遞大約相同數量的鏈接權益(排名權力)作為301重定向,並且,因為它在頁面(而不是服務器)級別實現,通常需要較少的開發時間實行。

下面是一個規範屬性在運行中的樣子:

重複-mozbar-screenshot_170315_161150.png的mtime = 20170315161151#資產:4195:網址

使用MozBar識別規範屬性。

在這裡,我們可以看到BuzzFeed正在使用rel = canonical屬性來適應他們對URL參數的使用(在本例中為點擊跟踪)。雖然此頁面可通過兩個URL訪問,但rel = canonical屬性可確保將所有鏈接權益和內容指標授予原始頁面(/ no-one-does-this-any)。

Meta Robots Noindex
在處理重複內容時特別有用的一個元標記是元機器人,當與值“noindex,follow”一起使用時。通常稱為Meta Noindex,Follow和技術上稱為content =“noindex,follow”這個元機器人標籤可以添加到應該從搜索引擎索引中排除的每個單獨頁面的HTML頭部。

一般格式:

<HEAD>
… [可能在您的文檔的HTML頭中的其他代碼] …
<meta name =“robots”content =“noindex,follow”>
… [可能在您的文檔的HTML頭中的其他代碼] …
</ HEAD>
元機器人標籤允許搜索引擎抓取頁面上的鏈接,但不允許它們在索引中包含這些鏈接。重要的是,即使您要告知Google不對其進行索引,仍然可以抓取重複的網頁,因為Google明確提醒您不要限制抓取訪問您網站上的重複內容。 (搜索引擎希望能夠在您的代碼中出現錯誤時查看所有內容。它允許他們在其他模糊情況下進行[可能自動化的]“判斷調用”。)