検索エンジンのアルゴリズムを自分で調べてみよう(前編)。

公開日:2009/9/28
執筆者:世良 裕之

Yahoo!検索において、9/4のインデックスアップデートに続き、9/14にはYSTの検索アルゴリズムのアップデートが公式発表されました。
そのため、今月はYahoo!に振り回された人も多かったのではないでしょうか。
また同時にインターネット上には多くの情報が流れ、それに惑わされた人も多いでしょう。
良く言われることですが、自分で心当たりのない順位降下があったときは、あわてずに何もせずにじっと待つことです。
特にYahoo!は、ほとんどの場合、元にもどります。

中には、日頃から自分自身で、いろいろな方法で検索エンジンのアルゴリズムについて調査を行ない、いろいろな推論を立てている方もいるでしょう。

 自分のサイトだけでなく、競合のサイトもあわせて順位変動を追いかけ分析をする人。
 分析用のサイトを準備し、いろいろな施策を施し、順位の変化を追い、効果を見る人。

いろいろな方法がありますが、SEOのアルゴリズムを検証する際、難しいのは、自分が行なった施策が検索結果の順位変動に影響した要因なのかどうかがわかりずらいということです。

まわりの競合サイトの順位が下がったために、自分のサイトの順位が上がったのかもしれません。
アルゴリズムの変更があり、いままで評価されていなかった他の要因によって順位が引き上げられたかもしれません。

ある要因が影響するという仮説を証明するためには、他の要因が影響することのない無菌状態の実験室が必要なのですが、その環境を作ることが難しいのです。

全く意味の成さない単語をターゲットとして複数のページを作り、そのサイトを利用して実験を行なう方法などもありますが、今回の前編、次回の後編とあわせて2回に分け、簡単に無菌状態の実験室が作れる「カスタム検索」を利用した方法について書きたいと思います。

カスタム検索とは?

各検索エンジンには検索対象サイトを指定し、指定サイト内からのみの検索結果を表示させる「カスタム検索」というサービスがあります。

Google  「カスタム検索」http://www.google.com/cse/ ヘルプ
            
Yahoo!  「カスタムサーチ」http://custom.search.yahoo.co.jp/ ヘルプ
            
Bing    「Bing ボックス」http://www.bing.com/siteowner

通常は、自分の運営サイトを指定し、サイト内検索として、自分のサイトに設置している人が多いのではないでしょうか。
Sphinn Japanの、右サイドに設置している検索窓もGoogleによるカスタム検索のサイト内検索です。

しかし、このカスタム検索は自分が運営しているサイトだけではなく、他のサイトも複数登録をすることができます。
例えば、SEO関連の有名な情報サイトをいくつか登録し、その登録サイトの中からのみ、求める情報を引き出す検索エンジンが作れるわけです。
1つのカスタム検索に、Yahoo!は30サイト、Bingは10サイトの登録が可能です。
また、Googleは1アカウントあたり5000のアノテーションが割り当てられます。(※)
さらにGoogleのカスタム検索には、検索結果上の優先順位を調節したり、表示結果の制限などの機能もあります。

※Googleのアノテーションに関しては「カスタム検索エンジンに追加するページ数の制限」をお読みください。

カスタム検索を利用した検索エンジンアルゴリズムの検証

ここまで書けば、皆さんもおわかりでしょう。

「カスタム検索を利用した検索エンジンアルゴリズムの検証」とは、まず検証サイトを作成し、その検証サイトをカスタム検索に登録をしたうえで、カスタム検索の検索結果をチェックすることで、検索エンジンのアルゴリズムを探っていきましょうということです。
カスタム検索では、登録サイトからのみ検索結果を返すわけですから、10個のサイトを登録すれば、そこに10個のサイトしかインデックスがされていない小さな世界ができあがるわけです。
SEOの内部要因に関するアルゴリズムを検証するには、かなり無菌状態に近い環境を作ることができます。

ただし、ここで注意しなければいけないのは、Yahoo!やBingのカスタム検索では、通常のクローラによって、検証サイトもインデックスしてもらわなければ、カスタム検索の検索結果には表示されませんので、他のサイトから検証サイトへのリンクを張り、クローラを導く必要があります。

一方、Googleにはカスタム検索専用の「オンデマンド インデックス登録」という機能があり、カスタム検索エンジン専用に作成された特別なインデックスへ登録することができますので、外からクローラを呼び込むためのリンクを張る必要もありませんし、インデックスされるのを待つ必要もありません。
ちなみに、この「オンデマンド インデックス登録」の機能はカスタム検索専用ですので、一般の検索結果に反映させるさせるために利用しても、一般のランキングやインデックス登録には影響しません。


Googleは日々検索技術が進歩しています。それはなにもいじっていない検証サイトのカスタム検索の検索結果が日々変動することからもよくわかります。
一方、Yahoo!はインデックスアップデートやアルゴリズムのアップデートがないときには、カスタム検索の検索結果は変動しません。
そのため、検証サイトをいじりながら、カスタム検索の検索結果を随時チェックすると、いろいろなものが見えてきます。

昨年末にカスタム検索の日本語サービスがスタートしてから、アルゴリズムの検証方法の1つとして、このカスタム検索を1年近く利用してきましたが、
次回「検索エンジンのアルゴリズムを自分で調べてみよう(後編)」では、
実際に検証サイトでの実験結果などもあわせて、より具体的なお話を書きたいと思います。

この記事が良かったと思ったらSphinn Japanへ投稿/投票お願いします。

この記事へのコメント

コメントはまだありません »
Leave a comment