sitemap.xmlの作り方と効果的な使い方【初心者向け】

17592
Pocket

検索エンジンのクローラーに、効率よくサイトをクロール/インデックスしてもらうためのひとつの手段として有効なsitemap.xml。今回は、sitemap.xmlって何?というところからsitemap.xmlの書き方、使い方までを解説します。

<登場人物>

小谷礼王

小谷れお

新人Webマーケター。16卒の内定者インターン。
入社と同時にぶっちぎりの成果を上げるために、Webマーケティング、主にSEO、コンテンツマーケティングについて勉強している。

小谷礼王

桑原一聖

Webアナリスト。多くのクライアントサイトのアクセス解析、改善施策立案から実装までを担当している。

 

sitemap.xmlとは何か?

comment_photo

sitemap.xmlって何ですか?

 

comment_photo

sitemap.xmlとは何か? まずはGoogleの説明を見てみましょう。

サイトマップとは、サイトのウェブページのリストを指定して、Google や他の検索エンジンにサイトのコンテンツの構成を伝えるファイルです。Googlebot などの検索エンジンのウェブクローラは、このファイルを読み込んで、より高度なクロールを行います。
出典:サイトマップについて – Search Console ヘルプ

comment_photo

ざっくりと、sitemap.xmlは、検索エンジンのクローラーがWebサイト内のコンテンツを効率よくクロールするために設置するもの、と理解しておけばいいでしょう。サイトマップと言っても、いわゆるユーザー向けのサイトマップページとは異なりますから注意してくださいね。

XMLサイトマップ

ユーザー向けサイトマップ

なぜsitemap.xmlが必要なのか?

comment_photo

sitemap.xmlって何のために必要なんですか?

comment_photo

言葉の意味を繰り返すようだけど、検索エンジンに自分のサイトを効率良くインデックスしてもらうためです。基本的に、検索エンジンのクローラーはsitemap.xmlを設置していなくても、他サイトのリンクを辿ることでサイトを見つけ出しますが、新しく立ち上げたサイトで他サイトからのリンクがまだ無い場合など、クローラーがそのサイトを発見できずにインデックスされない場合もあります。
sitemap.xmlを作成し、検索エンジンにクロールを促すことで、そのような状況を避けることができます。

comment_photo

そうなんですね。じゃあ新規サイトはsitemap.xmlを作ったほうがいいとして、現状特にクロールの問題を抱えていない場合にも作ったほうがいいんですか?

comment_photo

良い質問ですね。
Googleは、どのような場合にサイトマップが必要なのか、以下のように条件を定めています。
  • サイトのサイズが非常に大きい。 その場合、新しいページや更新されたばかりのページの一部が Google のウェブクローラによるクロール対象から漏れることがあります。
  • サイトにどこからもリンクされていない、または適切にリンクされていないコンテンツ ページのアーカイブが大量にある。 サイトのページ間に自然なリンクがない場合は、サイトマップで指定して、それらのページの一部が Google のクロール対象から漏れることがないようにすることができます。
  • サイトが新しく、外部からのリンクが少ない。 Googlebot などのウェブクローラは、ページからページヘリンクをたどることによってウェブをクロールします。そのため、他のサイトからのリンクがないページは Google のクローラに検出されないことがあります。
  • サイトでリッチメディア コンテンツを使用している、サイトが Google ニュースに表示されている、または他のサイトマップ対応アノテーションを使用している。サイトマップがあれば、状況に応じて Google 検索でサイトマップからの追加情報が考慮されます。

出典:サイトマップについて – Search Console ヘルプ

comment_photo

上記の条件に当てはまらない場合は、あえて作らないという選択肢もありだと思います。

sitemap.xmlの作成方法

comment_photo

sitemap.xmlが何かと、どんなときに必要なのかはよくわかりました! ぱっと見た感じ、作り方が検討つかないのですが、どうやって作るんですか?

comment_photo

サイトのURLリストを用意できれば、自分で作れます。
でも、サイトのURLを登録するだけで、sitemap.xmlを作成してくれるWebツールも多く公開されているので、基本的にはそれらを使えばOKです。またWordPressならプラグインが公開されているので一度導入すればあとは自動で作成・更新してくれます。
参考:WordPress導入必須アイテム XMLサイトマップ作成ブラグイン【Google XML Sitemaps】

comment_photo

簡単そうですね!

comment_photo

ツールを使えば簡単です。
ただし、ページの優先度や更新頻度などを個別で指定してサイトのクローラビリティを改善するためには、手動作成もしくは、ツールで生成されたものを修正する必要があります。sitemap.xmlの書式や記述の意味を理解しておくと、後々そういった作業もしやすいので、以下で簡単に解説しますね。

sitemap.xmlを構成する要素

まずはソース全体がこちら。

<?xml version=”1.0″ encoding=”UTF-8″?>
<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>
<url>
<loc>http://example.com/</loc>
<lastmod>2015-10-01</lastmod>
<changefreq>weekly</changefreq>
<priority>1.0</priority>
</url>
</urlset>

次にサイト内のURLを指定するタグ内を中心に説明しますね。

sitemap.xml使用タグ一覧

urlタグ

<url></url>

⇒locタグやlastmodタグ(※後から説明)などのページの情報を囲う親タグ。
サイト内のページが複数ある場合、このurlタグを複数記述していきます。

なお、以下の制限事項に該当しないように作成する必要があります。

  • 1つのsitemap.xmlに5万URLを超えるurlタグを記載しない
  • sitemap.xmlのファイル容量は10MBを超えてはいけない

上記に該当する可能性がある場合は、sitemap.xmlを複数に分けてURLを指定するか、ファイルをgzip形式に圧縮するなどの方法でsitemap.xmlを作成します。

locタグ

<loc></loc>

サイト内のページ(URL)を記載します。

lastmodタグ

<lastmod></lastmod>

※省略可

そのページの最終更新日を記載します。
この項目は省略可能ですが、Googleのクローラーはこの情報を参考にクロールしているため、可能な限り値を記載し、ページ更新時にはこちらの値も更新することが望ましいです。

changefreqタグ

<changefreq></changefreq>

※省略可

ページの更新頻度を記載します。
こちらも省略可能な項目ですが、クローラーがサイトをクロールする頻度に参考にされる可能性があるので、特に更新頻度が高いものは記載しましょう。

priorityタグ

<priority></priority>

※省略可

そのページのサイト内での優先度を記載します。
0.0から1.0までの値で優先度を設定することができますが、すべてのページで同じ優先度の場合は、その効果がなくなります。
この項目も必須項目ではありませんが、早めにインデックスして欲しいページや重要なカテゴリページなどは優先度を高くするなど設定しましょう。

sitemap.xmlのアップロードとGoogleサーチコンソールへの登録

comment_photo

いったんツールを使ってsitemap.xml作ってみました! 作ったあとはどうすればいいのでしょうか?

comment_photo

作成後は以下のような対応が必要です。

  1. sitemap.xmlのアップロード
  2. Googleサーチコンソールに登録
  3. robots.txtにサイトマップの情報を追記

まず、sitemap.xmlのアップロードですが、そのサイトを管理しているサーバーに設置しましょう。
設置箇所はルートディレクトリ内です。ファイル名については、特に制限はありませんが、ひとつしかsitemap.xmlを設置しない場合は、そのままsitemap.xmlというファイル名でアップロードしましょう。

comment_photo

次にGoogleサーチコンソールへの登録です。
Googleサーチコンソールへログインして、サイドメニューの「サイトマップ」という項目からsitemap.xmlのURLを指定すればGoogleサーチコンソールに登録することができます。

sitemap.xml登録イメージ-完了画面

comment_photo

最後に、robots.txtにサイトマップに関する記述を追記します。
robots.txt内に以下のような記述をし、再度サーバーへアップロードすることでsitemap.xmlのURLをクローラーに通知できます。

Sitemap:http://example.com/sitemap.xml

Googleサーチコンソールへの登録は、Googleのクローラーにしか影響を与えませんが、robots.txtに記載していればその他の検索エンジンのクローラーにもsitemap.xmlの存在を知らせることができます。
必須ではありませんが、できる限り対応しておくことをおすすめします。

comment_photo

まずはsitemap.xmlをルートディレクトリにアップロードして、さらにクローラーに知らせる必要があるんですね。Googleサーチコンソールからの登録はすごく簡単でありがたいです。

comment_photo

そうだね。字面だけ見ると難しいものみたいに見えるsitemap.xmlだけど、そんなことはない! もしサイトのクロールになにか問題があるなら、ぜひ使ってみて欲しいですね。
Pocket

無料ebook

【超実践編】実際のGoogleアナリティクス画面を見ながら学べるアクセス解析入門講座
姓(必須)
名(必須)
会社名(必須)
電話(必須)
メールアドレス(必須)
個人情報のお取り扱いについて

競合比較ができるSEOツール SEOカウンセラー

最大10項目(順位/被リンク数など)の競合調査が無料でできます。

桑原 一聖
Webアナリストとして数値分析を元にしたサイト改善・効果検証を行うかたわら新商品開発にも携わり、コンテンツの効果測定手法の設計などを行っている。