ポータルサイトで起こりがちな「重複コンテンツ」について

同じページが複数あると「重複コンテンツ」としてSEOへの影響が懸念されます。
どのようにして起こるのか、どう対策するか見てみましょう。

重複コンテンツの例

「重複コンテンツ」とは、URLが違うのに同じ内容のページが複数ある状態を指します。
特にポータルサイトでは重複コンテンツが起こりやすく、例えば以下のようなケースがあります。

検索一覧ページでの重複

例えば「エリア」と「カテゴリ」で絞り込みができるグルメ系ポータルサイトの場合で、「エリア=東京」「カテゴリ=寿司」と絞り込んみ、URLとして以下のようになったとします。
東京の寿司店の検索一覧ページが表示されます。

http://example.com/search/?area=tokyo&category=sushi

しかし、システム上では以下のURLでも同じ結果が表示されます。

http://example.com/search/?category=sushi&area=tokyo

URL末尾の「?」以降が違うのですが、全く同じページが表示されるため「重複コンテンツ」となります。

ドメイン名違いでの重複

ドメイン(DNS)やサーバーの設定によっては以下の4種類が同じという場合もあります。

http://example.com/
https://example.com/
http://www.example.com/
https://www.example.com/

「www」の有無はサイトによりますが、「https」の末尾「s」は見過ごされがちですので注意が必要です。

閲覧環境の違いでの重複

レスポンシブを採用しているポータルサイトは、デスクトップパソコンとモバイルで同じURLになるため問題ありませんが、別々のデザインで運用している場合、URLを分けることがあります。
そういった場合は重複コンテンツとなります。

重複コンテンツの影響

Googleにおいては、重複コンテンツがあったとしても不正とはみなされないとしています。
しかし、重複したコンテンツのなかから最適と思われるページをGoogleのロボットが自動判別するため、意図しないページが検索結果に表示される場合があります。

また、1つのサイトをGoogleが巡回する際に、無駄なページがあると、そのぶん他のページへの巡回に時間がかかります。
更新したページをすぐに認識してもらうのもSEOに重要であるため、スムーズに巡回できるに越したことはありません。

重複コンテンツの対策

Googleの「サーチコンソール」を利用していれば、重複コンテンツがある場合に警告してくれますので、積極的に活用しましょう(無料)。

サーチコンソールでは、主にページのタイトルやメタタグの内容が重複していないかがチェックされます。
ページタイトルやメタタグはそのページの要約ですので、重複を避けるようにします。

特に、ポータルサイトの検索一覧ページなどに見られる「ページ送り」がある場合、2ページ目以降のタイトルやメタタグが同じになりがちです。
その場合は、「(2ページ目)」など各ページ数を含めるようにします。

最も重要な対策は「canonical(カノニカル)」を指定することです。
HTMLの<head>~</head>内に「canonical」という名前を付けてURLを指定することで、そのURLが「正規URL」として各検索エンジンに伝達されます。

<link rel="canonical" href="http://example.com/search/?area=tokyo">

この場合、相対パス(/search/?area=tokyoなど)ではなく、必ず http~ からの絶対パスで指定します。

上記HTMLに手を加える方法に加え、サーバーサイドの HTTPヘッダ を利用して指定することもできます。

Link: <http://example.com/search/?area=tokyo>; rel="canonical"

canonicalが正しく指定されていればサーチコンソールの警告は発生しなくなりますが、重複コンテンツのページ自体が存在する限り、検索エンジンが巡回してしまいます。
可能なら、canonicalに頼るだけではなく、正しいページにリダイレクトした方が良いでしょう。


重複コンテンツについて、さらに詳細を知りたい場合はGoogleのヘルプページもご参照ください。