Gooogleの+1ボタンがrobots.txtを無視する理由は単純なことだった

[対象: 中級]

+1ボタンを設置したコンテンツは、たとえrobots.txtでブロックしていた場合でも検索結果に表示されることがあり注意が必要です。

このブログとWeb担当者Forumの連載の両方で警告しました。

robots.txtを無視してまで検索に出すとは +1 はどこまで強力なんだと驚いたかもしれませんが、実は理由はいたってシンプルでした。

+1したコンテンツはGoogle+のプロフィールで公開されるからです。

Google+で公開された+1ボタンを押したコンテンツ

robots.txtでブロックしていたとしてもそのページにリンクが多く張られているときは検索結果にURLだけ、またはページのタイトルとしてアンカーテキストをGoogleは表示することがあります(この動きを知らない人は、こちらの記事を読んで勉強してください)。

+1ボタンが例外的に特殊な動きをするわけでは決してなくて、Googleのrobots.txtに対する標準の処理に従っているにすぎません。

他のケースと同じようにrobots.txtでブロックしているので中身を読むことはしません。

Google+に出てきた+1情報に頼って検索結果に表示するかもしれないということです。

検索結果に出したくないページであればnoindex robots meta タグを付けるか、Googlebotのアクセスを完全に拒否するのであれば認証設定するなど別の仕組みが必要になります。

ですが、+1ボタンが押されるということは公開を前提にしているので公開したくないページに+1ボタンを設置するのは矛盾していますね。

まとめると、+1によってGoogleがrobots.txtでブロックしたコンテンツを検索結果に表示することがあるのは既定の動きです。

Google+のプロフィールに出てきた情報を手がかりにできるからです。

ただし中身を読み取りはしません。

とはいえ検索結果に出したくないコンテンツなら+1ボタンを設置しないように注意しましょう。

【参照】
Cristina Wood – Google+ – The adventures of the Google PlusOne button and the robots.txt file