「検索順位の決定要因に関する調査(Ranking Factors Study)」を、Searchmetricsが先ごろ公開した。検索順位の相関とSEOによる検索順位トップ10の平均に基づいた年に1度のリサーチだ。
2014年の分析を見ると、検索で上位にあるサイトのコンテンツは、キーワード重視のものから全体を考えたものに大きく移っていることがわかる。
いまや、いかに「コンテンツが王者」であるかを、だれもが語り、「ユーザーのために質の高いコンテンツを作る」ようにとアドバイスする。キーワードが(not provided)になる以前から、「キーワードは終わった」と口にする人もいた。
もちろん、こうした言葉によってそれなりのアプローチがひらめく場合も多少はあるかもしれないが、実際のところ、たいていは、それ以上の情報を何ももたらさない役立たずの決まり文句でしかない。
コンテンツの関連性測定を可能にする
「質の高いコンテンツ」とは何なのだろうか。
ユーザーにとって関連性の高いコンテンツとは、どのようにすれば作れるのだろうか。
「タイトルにキーワードを入れ、コンテンツにキーワードを7回入れる」といった手法は、まだ有効だろうか。
検索エンジンが時とともにどのように発達してきたのか、そしてどんな特徴が流行しその重要性が変動してきたのかを理解するべく、Searchmetricsでは毎年1万をこえるキーワード(およそ30万のURL)についてトップ30のサイトを分析している。100ページ近い報告書のフルバージョンはこちらでダウンロードできる。
つまりこうだ。パンダ、ペンギン、さらにハミングバードは、アルゴリズムに、そして検索結果に、どれくらい影響しているだろう?
具体的な話に入る前に、念のためだが、相関関係が因果関係を意味するわけではないことを指摘しておきたい。相関についてもう少し包括的な情報や、導入、説明などが必要ならばこちらを見てほしい。そんなわけで、僕たちは2つのアプローチを採用した。
- トップ30の相関係数―― 検索結果の1~3ページに表示される各URLの違い
- 平均―― 順位ごとの各要因の有無と程度
キーワードは「凋落」したか?
大半のキーワードは、要因としての影響力が低下している。これは僕たちがここ数年来の調査から得た重要な知見の1つだ。例を挙げよう。
「URL内にキーワード」「ドメイン内にキーワード」という特徴の影響が低下していることは、僕たちの分析から得られた比較的分かりやすい知見の1つだ。見ての通り、2012年から2014年にかけて相関係数が明らかに下がっている。
では、ページ上のキーワードの場合はどうだろうか。
こちらも相関係数がかなり低いことがわかる。つまり、これらの特徴については、第1位から第30位のURLに大きな違いがない。
ただこれで終わりではく、平均も見ておかなければならない。
説明しよう。X軸とY軸は次のとおりだ。
- X軸はグーグル検索の順位(第1位~第30位)。
- Y軸は見出しh1/h2要素内にキーワードがあるURLの平均比率(0.10=10%)
なお、これらの特徴についてはクローリングを修正したため、2013年のデータよりも今回のほうがより正確になっている。2013年の値が若干だが高くなりがちなのはこのためだ。
ともかく、見出しにキーワードがあるサイトが比較的少ないことがわかる。具体的には、第1位~第30位のURLのうち、h2要素内にキーワードがあるサイトはわずか約10%、h1要素内は15%。また傾向としても下がってきている。
ちなみに、第1位と第2位はいわゆる「ブランド要因」が影響している。つまり、検索結果の1位~2位に表示されるのは大手企業や大手サービスであることが多く、従来型のSEOの測定基準について見てみると、それ以外の検索結果とは異なっている。
「相関関係」の罠――アンカーテキストを例に
実は、相関関係だけを見ていると間違った結果を引き出してしまうことがある。次の例を見てほしい。
「キーワードのある被リンクの割合」という特徴の相関係数は、2013年から2014年にかけてかなり上がっている。しかし、「なるほど、すぐにリンクビルディングに取りかかり、順位を上げたいキーワードをアンカーテキストに入れるように依頼しなくては!」というのは早合点だ。平均を見ると理由がわかる。
実際のところ、「アンカーテキストにキーワードがあるリンク」の平均比率は、2013年に比べて2014年では減少している(約40%→約27%)。
しかし、ここで見るべきは、2014年のグラフが右肩下がりになっている点だ。
つまり、この要因は、順位の高さとの相関が高くなっている。言い換えると、順位が上のURLほど、キーワードを含んだ被リンクの比率が(平均して)高い。平均比率は順位が下がるにつれて下がっていく。2013年のグラフとのこの違いにより、2014年は相関係数が(相対的に)高くなっている。
結論として、グーグルが他の要因の評価を上げるにつれて、キーワードの影響力は減少しているように見える。
では、他の要因とはどんなものだろう。
コンテンツの「台頭」
この1年間、僕たちはキーワードや関連する用語の共起がどう評価されているかに注目してきた。こうした要因で検索順位が大きく変わっているのに気づいたからだ。
この記事で扱うべき範囲を超えてしまうので深入りしないが、共起を分析すると、順位付けの質と内容に、キーワードの「徴証語(Proof Terms)」と「関連語(Relevant Terms)」が重要な役割を果たしていることが分かった。
「徴証(ちょうしょう)」とは、何らかの結論を導く根拠や証拠のこと。
徴証語(Proof Terms)は、メインキーワードとのつながりが高く共起する確率が高い言葉のこと。
関連語(Relevant Terms)は、メインキーワードとのつながりはそこまで高くないが、同じ文脈に(あるいはサブトピックの中に)出現する可能性が高い言葉のこと。
この種のアプローチの基本は意味と文脈にある。たとえば、「車」という語は「バンパー」という言葉が出ている文では関連性を持つ可能性が高いが、「冷蔵庫」という言葉についてそのようなことは言えない。
「徴証語」と「関連語」――トピックの定義と分析
Searchmetrics SuiteのContent Optimizationセクションで、「apple watch」というキーワードに関して、徴証語と関連語を分析した例をお見せしよう。
まずは、「apple watch」の徴証語だ。
棒の右端の数字は、このトピックを扱っているテキストにおけるその言葉の平均出現数を表す。棒の長さ(X軸、目盛は下部)は相対的な重み付けであり、メインキーワードへの意味の近さから算出している。
緑色チェックマークがついているのは、出現数、意味的な重み付け、その他のパラメータを総合的に計算した重要ワードのトップ10だ。
見てわかるように、「apple watch」に対して「iphone」「time」は非常に重要な徴証語だ。同様に、もし「apple phone」がメインキーワードの文脈ならば「iwatch」が徴証語として出現する可能性が非常に高いと思われる。
ここで留意すべきは、メインキーワードを知らなくても、このリストを読めばテキストの主要トピックを想像できる点だ。
次に、「apple watch」の関連語を見てみよう。
このグラフは関連語のリストの一部だ。意味による重み付けも出現数も先ほどのグラフよりいくぶん低いのがわかる。
徴証語のリストと異なり、この関連語のリストを見ただけでは何についての文章なのか正確には把握できないだろう(大まかには見当がつくかもしれないが)。
検索順位決定要因を解説するこの記事は、前後編の2回に分けてお届けする。後編となる次回は、「コンテンツ文章の長さ」「テキストの読みやすさ」などの指標の順位との相関をみたうえで、ハミングバード以降の「キーワード」ではなく「トピック」でとらえる検索エンジンの方向性と、50の要因を重要度順に並べた決定版データもお見せする。後編は2月16日公開予定
※このコンテンツはWebサイト「Web担当者Forum - 企業ホームページとネットマーケティングの実践情報サイト - SEO/SEM アクセス解析 CMS ユーザビリティなど」で公開されている記事のフィードに含まれているものです。
オリジナル記事:グーグルの順位決定要因2014年版データ登場!――まずはキーワード関連のデータを紹介(前編) | Moz - SEOとインバウンドマーケティングの実践情報 | Web担当者Forum
Copyright (C) IMPRESS CORPORATION, an Impress Group company. All rights reserved.