2012年6月4日月曜日

ウェブマスターツールの「クロールエラー」画面 = 公開に失敗したページを確認する方法 - ウェブマスターツール

ウェブマスターツール
ウェブマスターツールの「クロールエラー」画面では、Google検索が取得に失敗したページと、その理由を確認する事が出来ます。

o Google検索が調べたリンク元も分かります。内部リンクの時は、自分で訂正する事が出来ます。
o サイトマップに登録したページのアドレスが間違っている時も、分かります。


**** 手順
o ウェブマスターツールにログインして、目的のWebサイト名をクリックします。
   + 詳しくは、「ウェブマスターツールにログインする方法
o 左のメニューから、「健全性」-「クロールエラー」
   + もしくは、現在のステータスの下にある「クロール エラー」をクリックします。
o 詳しい情報を知りたい時は、項目名の文字をクリックします。
o グラフの下には、問題を検出したページの一覧が表示されます。
   + ページ名をクリックすると、そのページに関する情報が表示されます。
   + ページ名の詳細画面では、そのページへのリンク元を知る事が出来ます。
   + 「サイトマップ」や「リンク元」をクリックすると、アクセス出来ないリンク元のアドレスを見つける事が出来ます。
      + 悪意のあるリンク元かもしれませんので、リンク元を辿る時は慎重に行います。
      + 例えば、ドメイン名でGoogle検索してみて、評判やサービス内容を調べてみます。
      + また、不思議なパラメーターが付いている時は、クリックしないように気を付けます。

「クロールエラー」画面で詳細調査出来る項目
項目名意味
サイト エラー欄でクリック出来る項目
DNSこの項目で障害が発生している時は、ドメイン名の登録が失敗しているか、DNSサーバーの障害が起こっています。
通常、この項目でエラーになる事はありません。
サーバー接続この項目で障害が発生している時は、ホームページのあるサーバーが過負荷になっているか、Webサーバーサービスが止まっています。
robots.txtの取得robots.txtは、(ウェブ検索など)ファイルを取得する外部サービスに対して、アクセス制限を要求するファイルです。
このファイルが取得出来ない時は、おそらく、アクセス制限はないものと外部サービスは解釈します。(中には、このファイルを最初から無視する外部サービスもあります。)
URL エラー欄でクリック出来る項目
ウェブ(= 初期値です)
携帯電話モバイルアクセスに関するエラー情報を表示します。
サーバー エラー(= 初期値です)
障害でアクセス出来なかったページです。
理由は、過負荷、もしくはサーバーメンテナンス中
ここに表示されているページは、確認するとアクセス出来ると思います。
HTTPのレスポンス コードは、503辺り
見つかりませんでしたアクセスしたのに存在しなかったページです。
理由は、「記事を削除した後のリンクアクセス」など
HTTPのレスポンス コードは、404辺り
その他不正なHTTPリクエストです。
理由は、「リンク元ページの、HTMLの書き間違い」など
HTTPのレスポンス コードは、400辺り


==
関連ページ:
    ▼ウェブマスターツール
    ▼Bloggerブログの分析とWebサービス連携
    ▼Blogger
    ▼制作メモ
    > ウェブマスターツールの「検索クエリ」画面その1 = サイト訪問時に使ったWeb検索キーワードを確認する方法
    ウェブマスターツールの「検索クエリ」画面その2 = Google検索経由で表示された人気ページを確認する方法
    ウェブマスターツールの「サイトへのリンク」を使って、自サイトの強みと弱みを把握する方法
(2012年6月4日変更。誤字訂正)