rel=“canonical”タグを記述したページからの発リンクをGoogleはたどるのか

rel=”canonical”タグでページBがページAを指し示していた場合、ページBにあるリンクをGooglebotはたどるのかどうかという質問にMatt Cutts(マット・カッツ)氏が回答しました。

状況が分からないかもしれないと思い、図に表しました。

ページBをページBにrel=“canonical”で正規化。Bからは発リンク。

rel=”canonical”でページBをページAに正規化しています。
ページBには発リンクがあって、そのリンクをGooglebotがたどるかどうかというのが質問の意味です。
※元の質問は「発リンク」に限定していません。内部リンクも含んでのことと思われます。でもマットは発リンクで回答しています。

rel=”canonical”によってページBはページAと同じ、言い換えると(検索結果に)存在しない存在になりますね。
それでもリンクをたどるのでしょうか?

リンクをたどるかどうかは、2つのページが同じかどうかとは無関係だ。
ページBに十分なPageRankがあれば、通常はリンクをたどってその先にあるものを発見する。

基本的には、rel=”canonical”があれば指定された新しい場所にマップし、それとは別に発リンクがあればその発リンクをたどる。

両者は完全に独立していると考えている。

僕たちがリンクをたどるかどうかは、そのページのPageRankがどのくらいあるかによるんだ。
ページの最後までかろうじてクロールできて発リンクを見つけたとしても、そのリンクをたどって処理しないことがあるかもしれない。

ある時点で必ずクロールをストップして、再びクロールをスタートし、インデックスの再構築を始めなければならない。
だから僕たちがたどり着いて取得できないページがウェブには常に存在する。

したがって比較的高いPageRankのページがあるなら、簡単な方法の1つとして、そのページからすべてのリンクをGoogleにたどらせることがある。

前半と後半で2つのトピックに分かれていますね。

前半は、ページAを指すrel=”canonical”を記述したページBに発リンクがあったとしても、rel=”canonical”はrel=”canonical”として処理して、それとは無関係にページBにある発リンクをたどるということでした。

後半は、そのページのリンクをたどるかどうかはそのページのPageRankに依存するということでした。

PageRankが高いページであればすべてのリンクをたどるし、PageRankの低いページだとリンクを発見したとしてもその先のページには行かないかもしれません。

言われてみればそうなんだろうなと認識していたような気がしますが、Googleの中の人から僕がはっきりと説明を聞いたのはこれが初めてかもしれません。

PageRankが低いページから渡されるPageRankが少ないのは当然として、それ以前にリンクをたどることすらしないかもしれないわけですね。

PageRankがランキングに占める重要度は前に比べるとずっと下がっていますが、それでもやっぱり重要な要素であることにかわりはないですね(ツールバーのPageRankではなくてGoogleが内部で使う本当のPageRankのこと)。