SEOのちょっとマニアックなQ&A×10
有益な情報が多し (DEJAN SEO)
オーストラリアのSEOコンサルタント、ダン・ペトロヴィック氏とマーティン・リード氏の2人がユーザーからの30個ほどのSEOに関する質問にGoogle+のハングアウトで回答した。
そのなかから特に興味深い10個のQ&Aをブログで紹介している。
-
Q 検索結果の表示とは関係なく、titleタグをどこまでグーグルはインデックスするのか?
A グーグルは文字数ではなく単語数でインデックスする。初めから12語までをtitleタグの一部として扱い、タイトルのそれ以降の部分はページコンテンツの一部として扱う。
-
Q robots.txtのDisallowで、グーグルの検索結果に表示されないようにできるか?
A 検索結果に表示させないようにするにはnoindexタグが唯一の方法だ。
-
Q サイトがハッキングされているかをグーグルウェブマスターツールで調べる方法は?
A 以下の4つの方法がある。
- 「マルウェア」レポート
- 「コンテンツ キーワード」レポート(でおかしなキーワードが出ていないか)
- 「検索クエリ」レポート(でおかしなキーワードが出ていないか)
- 警告メッセージによる通知
-
Q 著者情報はウェブページ以外のコンテンツでも出てくるか?
A 出てくる。PDFにも表示される(以下のようになる)。
-
Q noindex robots meta タグを記述してあるページがrobots.txtでブロックされていたらどうなるか?
A noindexタグはGooglebotには見えないので何も影響しない。
-
Q ユーザーエージェント(UA)に基づいた振り分けをグーグルが明確に許可しているケースは?
A 次のとおり。
- モバイル
- OS(たとえば、ソフトウェアをダウンロードするときにユーザーが使っているOSに対応した製品へリダイレクトするとき)
- ユーザーエージェントに基づいてA/Bテストするとき
- ファースト・クリック・ポリシーを採用するとき
-
Q robots.txtを無視するグーグルのクローラは?
A アドワーズのクローラ。Googlebot以外のほとんどのクローラも無視する。
-
Q ウェブページに書かれた文字の大きさは、グーグルが考慮する要因に含まれているのか?
A 検索エンジンがどのように動作するかをグーグルが説明した最初の論文では、検索結果の一部としてフォントのサイズを考慮することが説明されている。ただし、これは何年も前のことだ。
最近の話でいうと、極端に小さなフォントサイズは順位決定のマイナス要因になり得る。
-
Q 「http:」と「https:」は、正規化される前ではサイトの別々のURLとしてみなされるのか?
A それぞれのURLでの完全に異なるバージョンとしてみなされる可能性がある。
-
Q robots.txtでrobots.txtをブロックしたらどうなるか?
A 何も起きない。グーグルはrobots.txtを取得するしキャッシュする。キャッシュが期限切したら再び取得する。これを繰り返す。
日本語で読めるSEO/SEM情報
ウェブマスターツールに届くメッセージには2種類の重要度がある
ヤバいのとヤバくないの2種 (グーグル ウェブマスター向け 公式ヘルプフォーラム)
ウェブマスターツールにグーグルからメッセージが届くというと「何かまずい状態になっているのか」と思われるが、実はそうとは限らないことを、グーグル社員のkakaさんが公式ヘルプフォーラムで説明した。
メッセージには、次の2種類がある。
- ウェブマスター向けガイドライン違反に関する通知
→対処して再審査リクエストが必要 - サイトを運営する上での参考情報の通知
→すぐに対処は不要(でも要チェック)
1つ目はガイドラインに違反しているため手動処置が取られたときの通知で、2つ目はサイトに発生している問題を伝えるための通知になる。
それぞれの詳細はkakaさんの書き込みを読んでほしい(上の2つのリストにその書き込みへの直接のリンクを貼ってある)。
SEOにおける「コンテンツが王様」が表す本当の意味
あらゆるSEOは「コンテンツ」という土台の上に成り立つ (SEO 検索エンジン最適化)
“Content is King”(コンテンツは王様)と、SEOの世界ではよく言われる。しかしこのフレーズは必ずしも正しく理解されていないためその本質を住太陽氏が説明している。
「まずコンテンツありき」を重視する、検索業界に長く関わってきた住氏らしい説得力ある主張だと筆者には感じられた。
ところが実際には、ほとんどの企業サイトは売り込みにばかり熱心で、コンテンツの発信には消極的です。売り込みばかりでコンテンツがまったく存在しない、チラシの集合体のようなサイトすら珍しくはありません。
といったサイトにおいて、上位表示にふさわしくないページを無理やり上位にねじ込むテクニックがSEOではない。ユーザーにとって有益なコンテンツを、検索エンジンを通してユーザーに届けるための施策がSEOだ。すべてはコンテンツという土台の上に成り立つことを住氏の“コンテンツ”を丹念に読んで理解してほしい。
ちなみに、王様だけでは国は回らないのも事実だ。王様を助けるために周りでサポートするのがSEOだという考え方はどうだろうか。
あなたのサイトのランディングページはトップページだけじゃない
「ここはどこ?」状態にさせない (SEMアドバイザーの揺さBrain!)
サイト内のすべてのページに検索エンジンからのアクセスがありうることを想定してサイトを構成すべきだと、自身が困った事例をもとに説明した記事。
ロングテールの検索トラフィックを重視する今の時代には基本的すぎる考え方なのだが、意外にないがしろにされているのではないだろうか? ホームページへ戻るリンクやグローバルナビゲーション、パンくずリスト、問い合わせフォームなどユーザーがどのページにいても利用するだろうと想定できる要素は、できるだけわかりやすく設置したいものだ。ユーザーを迷子にさせてはいけない。
もし「ユーザーはまずトップページに来て……」という発言が打ち合わせで出てきたときには、Web担の記事で紹介されていた「サイト構成図は逆さまに見て最前線のページを把握する」の図3と図4のサイト構成図を思い出すようにしてほしい。
関連した内容として、検索結果からサイトに訪れるユーザーを意識する場合の視覚的な分かりやすさや使いやすさについて住氏が解説しているのでこちらも参考にしてほしい。
ウェブマスターツールのインデックス ステータスに「詳細」タブ
「インデックスの秘密」はどうかと (グーグル ウェブマスター向け公式ブログ)
グーグルウェブマスターツールに「インデックス ステータス」という機能が7月の終わりに加わった。1か月遅れになるが、日本版の公式ブログで紹介があった。
インデックス ステータスでは、管理サイトのインデックスの状態を知ることができる。
標準ではインデックス数の推移だけだが、詳細を選択すると上のキャプチャのようにインデックスに登録されたページの総数のほか、クロール済みページの累積数とrobots.txt によってブロックされていてクロールされないことが分かっているページの数、検索結果の表示対象に選ばれなかったページの数が表示される。詳しい内容は公式記事を参照してほしい。
日々ページが追加される大規模なサイトにおいてインデックス状況を把握するのにインデックス ステータスは有用な機能になりそうだ。
ちなみに、元記事のタイトル「インデックス ステータス機能で Google 検索のインデックスの秘密が明らかに!」は、記事の内容と合っていない、言ってみれば「釣りタイトル」ではないかと感じたのだが、あなたはどうだろうか。
Googleアナリティクスで外部リンクを正しく計測できないときの対処方法
hitCallback関数を使う (コラム アユダンテ株式会社)
Googleアナリティクで外部サイトへのリンクがクリックされたことを計測する場合、実は正しくデータを取得できないことがある。クリックしたことをGoogleアナリティクスのサーバーに伝える前にブラウザのページ表示が切り替わってしまうことが原因だ。
このトラブルの対処方法を、アユダンテさんが教えてくれた。“hitCallback”という関数と組み合わせて使うといいそうだ。計測漏れが発生する理由とともに実装方法を説明しているので詳しくはピックアップ元記事を参照してほしい。
レベルの高い技術者ぞろいのアユダンテさんならではのコンテンツだ。
元記事で解説されているのは_trackPageviewで仮想ページビューとしてクリックを測定する場合だが、Web担編集長によると、イベントトラッキングを使って測定する場合にも_setメソッドでのhitCallback設定を_trackEventと同時に指定することで同様のことができるということだ。ただし、これらの方法にはUX上で問題となる部分があるという話もある。詳しくは追って記事で解説するということなので、そちらを待ちたい。
海外SEO情報ブログの
掲載記事からピックアップ
グーグルの言語理解力をもとにした最適な記事の書き方と新規コンテンツを素早くインデックスさせる方法を解説した記事を今週はピックアップ。
-
SEOを意識せずにGoogleに評価される記事の書き方
自然に書くことが最大の秘訣 -
30分以内に新しいコンテンツをGoogleにインデックスさせる方法
どの方法が使えそうか
- SSL設定ミスに対する難解な警告メッセージがウェブマスターツールに届いた
- 販売終了した商品ページは301?それとも404?
- “example.com/abc/”と“example.com/abc”は違うの?
- インスタントプレビューは手動更新できるのか?
- Googleがスパムを特定する新アルゴリズム
- Googleの同義語マッチング – 意図の理解は諸刃の剣
海外のSEO/SEM情報を日本語でピックアップ
SSL設定ミスに対する難解な警告メッセージがウェブマスターツールに届いた
理解できないウェブ担当者が多そう (Google Webmaster Help Forum)
SSLの構成ミスで次のような警告メッセージがグーグルウェブマスターツールに送られてくることがあるようだ。
貴サイトのホスト名、https://example.com/ がSSL証明書のサブジェクト名と一致しないことをGooglebotが検出しました。
ウェブマスター様
貴サイトのホスト名、https://example.com/ がSSL証明書のサブジェクト名と一致していません。サブジェクト名は以下のとおりです。
*.anothersite.com
anothersite.comこの状態だと、多くのブラウザではユーザーが貴サイトにアクセスするのを拒否してしまうか貴サイトにアクセスしたときにセキュリティの警告メッセージを表示します
この問題を修正するにはホスト名と一致するサブジェクト名またはサブジェクトの別名とともに新しい証明書を認証局(CA)から入手してください。
敬具
グーグル ウェブクロール チーム
これは筆者が日本語に訳したものだが、英語で来るメッセージは次のようなものだ。
Googlebot noticed your site host name, https://example.com/, does not match your SSL certificate Subject Name
Dear Webmaster,
The host name of your site, https://example.com/, does not match any of the "Subject Names" in your SSL certificate, which were:
*.ssl-cert.com
ssl-cert.comThis will cause many web browsers to block users from accessing your site, or to display a security warning message when your site is accessed.
To correct this problem, please get a new SSL certificate by a Certificate Authority (CA) with a "Subject Name" or "Subject Alternative DNS Names" that matches your host name.Thanks,
The Google Web Crawling Team
専門用語が多いので意味がわからなくても無理はない。要はSSL証明書を取得するときに申請したサイト名(正確にはホスト名)とそのSSL証明書を設定しているサイト名が異なるということを伝えている。例えて言うなら、顔写真が違う他人の免許証で身分証明しているようなものだ。
この警告メッセージについて、グーグルのジョン・ミューラー氏は次のように説明している。
SSL証明書が正しく導入できていないときに送信する。サイトのクロールやインデックス、ランキングには影響しない。しかしブラウザに警告メッセージが出ることがあるので、ユーザーが混乱するだろう。
サイトのコンテンツが http:// でインデックスされているなら心配しなくていい。サイト内に https:// のページへのリンクを発見した際にそのURLをクロールしようとしてSSL設定の間違いがあればサイト管理者に伝えるためのものだ。http:// でも私たちがそのコンテンツを発見するのであればそのままで構わない。
サーバー管理者の設定ミスなどの事情で他の組織のSSL証明書を使った状態になってしまい、それがGooglebotによって発見されてしまったときに送られてくることもあるようだ。
SSL通信(https)を利用しておらず、通常のhttpで正しくウェブページがインデックスされているなら特に問題は起きないとミューラー氏はアドバイスしている。そうは言っても念のため、301リダイレクトやrel="canonical"で正規化しておくと安心だろう。
日本では聞いたことのない警告メッセージであるが、筆者が調べたところ英語圏では複数の事例を見つけることができた。もし送られてきたとしてもメッセージが日本語化されていない可能性が考えられるので、万一受け取ったり周りに受け取った人がいたりしたらこの記事を思い出してほしい。
販売終了した商品ページは301?それとも404?
不用意に301を使うと思わぬ事態に (John Mueller’s comment on Google+)
想定外の現象に見舞われたサイト管理者がグーグルの社員にGoogle+でアドバイスを求めた。次のような現象が起こったそうだ。
販売終了した商品のページを親カテゴリのページへ301リダイレクトした。
すると、検索結果に表示されるその親カテゴリのURLが本来のURLではなくリダイレクト元の商品のページのURLになってしまった。
数千の販売終了ページがあるがその一部でこのようにURLが置き換わってしまった。
グーグルのジョン・ミューラー氏は次のようにアドバイスした。
代わりになる商品がないのであれば404を返すことを推奨する。
あなたがやったように301リダイレクトを使うと、そういった結果を招くことがある。
「301リダイレクト」は、「そのコンテンツはこちらの場所に移動しました」という意味だ。ECサイトにおいて販売が終了した商品が出た場合、代替になるほぼ同じような商品があるのならば、そのページへ301リダイレクトするのは妥当だ。そうでないならば、「そのコンテンツは見つかりません」を意味する404を返すのが基本だと理解しておいてほしい。
トップページやカテゴリページへリダイレクトするのはユーザーにとっても検索エンジンにとっても適切な処置ではない。404を返したうえで、代表的なカテゴリへのリンクや検索ボックスを設置したカスタムエラーページを表示するようにしおくと、ユーザーに優しくなる。
ちなみに、生産終了やメーカー倒産などでその製品が二度と入荷しない場合は410を返すのが正しいのだが、実際には404を使っておくのが安心だろう。ちなみに、グーグルは404と410をほぼ同等に(若干の違いはあるものの)扱っている。
“example.com/abc/”と“example.com/abc”は違うの?
違うけど普通は気にしなくていい (High Rankings Search Engine Optimization Forum)
下の2つのURLには違いがありますか?
- http://example.com/abc/
- http://example.com/abc
上記のような質問の投稿が、High Rankingsフォーラムにあった。
URLの末尾に「/」(スラッシュ)が入っているかいないかが差異だ。技術的には両者は別々のURLを示す。しかしどちらも同じコンテンツを表示するのであれば、現在の検索エンジンは同一に扱ってくれるはずなので、特に気にする必要はないだろう。
同様に、
- http://example.com
- http://example.com/
のように、トップページを表すドメイン名だけの表記の場合に末尾に付く「/」の有無に関しても通常は意識しなくてよい(以前にこのコーナーで取り上げた)。
インスタントプレビューは手動更新できるのか?
残念ながら無理 (Google Webmaster Help Forum)
グーグルのインスタントプレビュー機能を利用すると、実際に訪れることなく検索結果からそのページの外観を見ることができる。
インスタントプレビューを手動で更新できるかという質問が英語版のグーグルウェブマスター向けヘルプフォーラムに投稿された。
結論としては、インスタントプレビューは自動で作成されるため手動での更新はできない。
インスタントプレビューはGooglebotがそのページをクロールした際に自動で作成される。プレビューのキャッシュが存在しないページのインスタントプレビューをユーザーがリクエストした時は、「Google Web Preview」というユーザーエージェント名のクローラがその場でプレビューを作成する。
SEO Japanの
掲載記事からピックアップ
グーグルが取得したスパム対策用の特許とグーグルの同義語処理の記事を今週はピックアップ。
-
Googleがスパムを特定する新アルゴリズム
検索エンジンとの駆け引きもSEOには重要!? -
Googleの同義語マッチング – 意図の理解は諸刃の剣
グーグルの言語理解は進化を続ける
- 内容カテゴリ:SEO
- コーナー:海外&国内SEO情報ウォッチ
※このコンテンツはWebサイト「Web担当者Forum - 企業ホームページとネットマーケティングの実践情報サイト - SEO/SEM アクセス解析 CMS ユーザビリティなど」で公開されている記事のフィードに含まれているものです。
オリジナル記事:SEOのちょっとマニアックなQ&A×10 など10+4記事(海外&国内SEO情報) [海外&国内SEO情報ウォッチ] | Web担当者Forum
Copyright (C) IMPRESS BUSINESS MEDIA CORPORATION, an Impress Group company. All rights reserved.