59は得体が知れず、57と35の一部だけが変化しているだけなので、ダンス開始宣言を保留していたが、53もすべて変化したことを確認したので、このサイトでは、8月8日をGoogle Danceの開始日と認定する。
Google データセンターの変化一覧 98 99 100 101 102 103 104 105 2003-08-08 23:40 変化確認 2003-08-11 21:21 変化確認 2003-08-13 17:40 変化確認 2003-08-14 01:10 変化確認 2003-08-14 09:55 変化確認 2003-08-14 13:00 変化確認 2003-08-14 14:35 変化確認 33 35 37 39 41 51 53 55 --- --- --- --- --- 57 59
更新前と更新後?のデータセンターでキーワード検索しても順位が変わらない。管理人のサイトだけかもしれないが。
もう少し分析する必要がある。
しかし、Google Danceの影響が少ないことはいいことである。まぁハルマゲドンにならないし、これを記録しても黙示録でもないことになるのだが…
前回から、更新前のDeepbotの巡回が無くなり、フレッシュクロールがディープクロールの役割もはたし、インデクシングのすべてを担っている。
つまりFreshbotは、正規更新、日付入り、Everfluxのすべてをまかなっている訳だ。
しかも、キーワード検索の順位は、いつも変動している。
従来のGoogleの常識は、かなり覆っている。下手な読みをせず、普通通りが一番かもしれない。
やっぱりコンテンツの充実しかない。
最近のGoogleはおかしいことだらけなので、今更って感じだが、www2.google.com、www3.google.comからデータセンターの変化がはじまっていない。なぜだ。そして、6月更新では後回しだった57から変化しているのも頷けないし…
まぁ更新、つまりGoogle Danceのはじまりだろうとは想像できるが、納得できないなぁ。
しかし、バックリンク数とPageRankの変化は、更新以外に考えられないので、おそらくグーグルダンスのはじまりと言えるだろう。でも、明言は控えておく。
わが管理サイトでは、サイト内リンクが高評価を得ている、しかも途轍もなく。
例えば、「link:bingoall.net」は、更新前「34」、更新後「107」である。その実態は、管理サイトの一つ「Maniac-IME」のPageRankが3から5に大昇級していることらしい。つまり、このhttp://bingoall.net/ime/からのバックリンクが非常に数多くSERPに出てくるのである。
もっとも、これを以てサイト内バックリンクのGoogle評価が、上がった・下がったとは結論付けることはできないのだが。もう少し様子を見てみよう。
どーでもいいことだが、このままでいくと、日本のお盆の期間中に更新が完了するものと思われる。GoogleはUSAの企業なのにね?
「今回の更新」とハッキリ言い切れるかどうか、つまり、変化済みのデータセンターでのSERPが、そのまま、更新後のSERPとして再現されるか、判断できないし、予想では更新後のSERPは違ったものとなる可能性が高い。なぜなら、
Googleのデータセンターのデータベースには、(1)Googleディレクトリとも連動したPageRankやバックリンクと、(2)ページキャッシュの二つが存在するように思う。つまり二つは分かれているということである。今回というか、今のところ、データセンターの変化は、(1)のみのようである。また(2)は、ご存じのごとく、更新のみならず、日付入りやEverfluxで変化し続けていたりするのだが。
キーワード検索のSERPは、(2)のページキャッシュに含まれる、テキストマッチが中心となっているようだが、SERPの順位については、Google検索の「allintitle」「allintext」「allinanchor」でも、ある程度解析できる。
allintitleとallintextは、自ページ内キーワード記述であり、allinanchorは、他ページからの自ページ内のキーワードテキストリンクである。
さて、SERPには、もう一つの要素がある。この黙示録の母サイト、Google Danceの「サイトテーマ」で解説しているが、キーワード検索のクエリでも、もう一度PageRankなどが再計算されているようである。
キーワードを含むページ群の中で、さらに、バックリンクの量と質が再確認されて、最終的に順位付けされ、SERPとして書き出されてくるらしい。これはGoogleのUSA特許の根幹の一つのようだ。
どういうことかというと、SERP前の静かなるデータセンターには、(1)PageRankやバックリンク情報と、(2)ページキャッシュのテキストマッチ情報が、記録されている。
ところがキーワード検索では、これに新たな要素として、(3)クエリ内バックリンクの再計算が行なわれ、最終的に順位付けをしてSERPとして吐き出される訳である。
この(3)については、クエリによって動的に瞬時に働くようであるが、SERP直前のクエリ群の中で参照されるバックリンクは(1)であるにしても、(3)においては、(1)と(2)が連動されていないといけない。
ということで、あくまでも私見であるが、なるほど素の状態での(1)は変化したものの、一番大事な(3)における(1)と(2)の連動については、まだ変化していないと想像されるのである。つまり、現在変化しているかに見えるデータセンターも、最後はまた(1)以外は変わるだろうということである。
前回(6月)の更新後、われわれを悩ませたDirectoryIndexの不遇によるSERPの変動も、(1)は固定的だったが、フレッシュクロールによる、(2)がおかしいキャッシュのされ方をしたのか、(3)の仕組みがうまく働かなかったか、そのどちらかであろうと思っている。
こうなると、ドイツ哲学の認識論、カントの「物自体」のようになってくる。われわれはGoogleのデータセンターのデータベースそれ自体を決して見ることはできない。常に何らかのキーワード検索によるSERPの形のみが見えるのである。
結論としては、更新完了時には、現在の変化済みのデータセンターのSERP、順位が再現するのではなく、別の結果になるだろうということである。
残念ながら、まだ分からない。
これといってスパムフィルタが適用されたなという例は見当たらない。スパムサイト健在である。
またアンテナサイトの検索エンジンスパムでは、ドアページのうち、
(a) <meta http-equiv="Refresh" content="0;url=doorpage_meta.html">
すべて何度もGooglebotはファイルをGETしているが、キャッシュに残っているのは、(b)のみだったりする。確認したい方はクリック。しかし(c)タイプのスパムサイトは相変わらず上位表示されている。まぁ参考にしないでいただきたい。
(b) function refresh() { location.href = "doorpage_jsre.html"; }
<body onload="setTimeout('refresh()', 1);">
(c) window.location.replace("doorpage_jslo.html");
5月革命の時に、スパムが駆逐されているとSEOサイトでも言われているらしいが、真相は残念ながらつかめていない。Googleは何かやろうとしている、ということだけだね。