Googleの非公開内部ドキュメントが流出

ConfidentialGoogleには、10,000人の人間のサイト評価者が存在して、検索結果が適切かどうか人の目で品質チェックしていることは、Google自身の代表者によってオープンになっています。

なんと、検索結果をレビューするスタッフが検索品質を評価するためのガイドラインを示した内部ドキュメントが、流出しました。

このニュースを知ったのは、3月14日にSEO BLACK HATというサイトから届いた1通のメールです。

Hey,

It’s QuadsZilla from SEO Black Hat. Let me tell you about some of the cool stuff going on at our private forum right now:

Human Reviewer Spam Guidlines Leaked from Google

You can check out the full blog post about the leak here,

http://seoblackhat.com/2008/03/10/excerpts-from-google-reviewer-guidlines/

Basically one of our private forum members got hold of the internal document that Google uses to train the human reviewers and posted it for forum members to read and discuss. These people surf the web all day and decide whether to penalize or ban a site from Google’s index.

Being as most of the banning is done by hand these days, this is pretty damn important information to have if you don’t want to get banned.

Forum subscribers have access to all 43 pages on this thread.

http://www.seoblackhat.com/forum/showthread.php?p=8087

登録したことすら忘れていたサイトから、初めて届いたメールです。

検索結果を評価する際に使っているという、Google内部のマニュアルが外部に漏れ、それを入手できたというのです。

さっそく中身が公開されているフォーラムにアクセスしようとしたのですが、残念なことに有料メンバーのエリアで目にすることができませんでした。

有料メンバーになるには、1か月100ドルの料金がかかります。
今は急激な円高で、1ドル100円になっているので約1万円ですね。
高額というわけではありませんが、本当にGoogleの内部文書かどうかも怪しいところだし、果たして1万円を払って読む価値があるのかどうか思案していました。

そうこうしていると、一般のSEO関連ブログでもこのGoogle内部文書流出の情報が取り上げられたのです。
Aaron Wall氏のSEO BookGoogle BlogscopedSearch Engine Watch Forumsなどです。

でも、いちばん気になる機密文書そのものは、手に入りませんでした。
Google Blogscopedで入手先が書かれていたようですが、リンク切れですでにアクセスできない状態でした。

しかし、さすがはインターネット、探せば見つかるものです。
ついに、Googleの内部文書のPDFファイルを入手することに成功しました。

ヘッダーには、「General Guidelines(一般ガイドライン)」というタイトルと「Version 2.1 (April 6, 2007)」という版数・発行年月日が、フッターには「Proprietary and Confidential(非公開・厳秘扱い)」という注釈が書かれています。

計42ページからなる文書で、Part1?Part6まで次のような6つのセクションに別れています。

  1. Part 1: Rating Guidelines
  2. Part 2: Using EWOQ
  3. Part 3: Rating Examples
  4. Part 4: Webspam Guidelines
  5. Part 5: Quick Guide to Quality Rating
  6. Part 6: Quick Guide to Webspam Recognition

パート1は、「評価付けの種類と分け方」、パート2は「EWOQという評価を記録するツールの使い方」、パート3は「評価の具体例」、パート4は「スパムサイトの判断基準」、パート5は「パート2の要約」、パート6は「パート4の要約」です。

このうちパート1に含まれる「検索タイプの分類」とパート4の「スパムサイトとみなす基準」は、非常に価値ある情報です。

ただ、文中にGoogleという文字は発見できませんでした。
ツールの利用には、Gmailのアカウントが必要との記述はありました。

ただし、Google Blogscopedの追記によれば、本当にGoogleの内部ドキュメントの可能性が高いとのことです。
マニュアルの具体的事例やツールのキャプチャ画面から判断して、僕もそう感じました。

まだ、ざっと読んだだけなので、詳しくは後日解説します。

ドキュメント本体は、モノがモノだけに、このブログで公開するべきか決めあぐねています。

どうしても欲しいという人は、頑張って探してください。

とりあえず、目次ページだけこちらからどうぞ。w

Google Rating Guidelineの目次