richtags.com: Intelligence0.1

Intelligence0.1

URL: /show/9877
作成者: jun
作成日: Sat Mar 18 01:31:15 JST 2006
変更日: Thu Mar 13 16:57:17 JST 2008
公開モード: private

( ) ポストしたグループ: RekiLog

茂木さんとあさりで久々に飲みつつ、だべる:

http://kenmogi.cocolog-nifty.com/qualia/2006/03/post_43d2.html

梅田さんの「Web進化論」やHawkinsの"On Intelligence"、あるいはいわゆる「Webインテリジェンス」に非常に関連するが、最近のWebあるいはネット上での"intelligence"と言って良いかどうなかわからない何か、が、一線を越えてきつつある感じを持つ。

ちょっと前までは、Webサーチなどは古典的技術(GOFAI- good old fashioned AI)であり、GoogleはGOFAI的なことをエンジニアリングとして大規模にやっているだけ、みたいな評価であって、本当の知能はしんぼるぐらうんでぃんぐだとかいんてりじぇんとだいなみっくすだとかちゃんと考えなければね、みたいな認識だった。

しかし、規模の違いがあるオーダーを越えると、もはやそれを単にGOFAIだと言い続けるのはどんどん無理な気がしてきている。turning point はPageRank だったのかもしれない。人間を "intelligence1.0" だとすると、あえてintelligence0.1。だけど進む方向が非常に異っているので単純に優劣は比較できない。(茂木さんは虚数かもと言っていた)。今のGoogleがどうこうというより、その先(post Google)には何があるのだろうという興味でもある。

たとえば、東大の黒橋先生がされているWebマイニングを使った超大規模(5億文)コーパス。

http://www.ii.ist.i.kyoto-u.ac.jp/c/final.html

一人の人間が一生涯かけて読み聞きできる言葉の量をあっさり越えてしまっている。規模の差が質の差になってきていて、たとえば書き言葉を話し言葉に変換するなど、従来のコーパスとはかなり違った感じの応用ができている。Googleがマイニングしている量はさらにこれの数百倍であろうから、そこにまた一段、質の飛躍があるだろう。今後は非言語情報のマイニングがさらに本格的になっていくだろうから、そこにもジャンプがあるだろう。というあたりにもintelligence0.1 を感じる。

Intelligence0.1の本質は何だろうか?規模が質に転換されるとはどういうことなのか、など関連して気づいたことをランダムに記してみる。

* 準完全情報

従来の考えでは "intelligence" が対象とする問題領域はopen systemであって事前に完全情報を得ることができない、というのが常識であった。しかし、ネット上では、問題領域によってはそのほぼ全てをマイニングしつくす、ということが可能である。上の例に即していえば、従来のコーパスはあくまで言語記述のサブセットという認識だったが、今後は「人類が書き記した全ての言葉」をインデックスするという前提で話しが進むのだろう。地球シミュレータの佐藤先生によると、地球の一部だけ切り取ってシミュレートするのはむずかしく(境界があるので)、全地球表面でシミュレートすることのほうが逆にやさしいそうだ。それとも関連するかもしれない。

*Crowd-Based

reasoningはメモリーベースが中心になるだろう。Jeff Hawkins のOn Intelligence とも合致する考え方。ただ、ベースとなるデータは、超大規模(あるいは準完全)であるが、ノイズも相当混じっている。これが、昔はやっていた事例ベースとは違うところかも知れない。Crowd of Wisdomにならって Case-Basedならぬ"Crowd-Based Reasoning"と呼んでみる。 Reasoningだけではなく、Crowd-Based Design や Crowd-Based Modeling 等も有り得るだろう。

* 人間ー機械系

folksonomy的発想では、もし1億人のユーザが、一日にWeb1ページにそれぞれタグをつけていくとすると、数ヵ月でGoogle規模のインデックスができてしまう。つまりintelligence0.1は単独で存在するのではなく、その周りにいる超大量の「ユーザ」との協調系となるだろう。ユーザが発するすべての行為(どこのページを見るか、何を検索するか)はnetに取り込まれ、アグリゲートされてシステム全体のintelligenceになっていく。たとえばPageRank もこういった地球規模の人間ー機械系のひとつだろう。

* no-身体性、ソラリスの海

Googleには身体はない。考えてみると身体というのは非常に特殊な制約条件で、ある場所にいると得られる情報(見たり聞いたり)は基本的にその周辺に限られる。環境の変化はゆるやかで連続的。だから力学的方法論が使える。一方、ネットワーク上のintelligenceには身体的制約はなく、localityもあまりなく、世の中「全て」の情報を一気に得ることが可能である。その環境に対し、身体性という物理制約にチューンされているであろう「脳」というアーキテクチャーは適しているのだろうか。「ソラリスの海」が持つ知性と人間の差とでも言えばいいのか。

*鳥と飛行機とテレビ

よくAIの世界で使われるたとえに、「飛ぶために鳥を一生懸命模倣するだけではだめで、飛行機になるためには鳥の真似ではないブレイクスルーが必要」というのがある。それは非常に正しいのだが、鳥も飛行機も大局的にはまだ似通ったものである、と言うこともできる。「飛びたい」を「遠くの場所に素早く到達したい」ということと解釈すると、遠くの情報が一瞬で見れる「テレビ」もその解決手段なのかもしれない(あるいはテレプレゼンスとか)。鳥→テレビぐらいの飛躍/発想の転換がnet上のinnteligence には必要だろう。

タグ:

(technorati: . . . . . . . . . . . )

コメント: ( 追加 )

関連するブックマーク:

©2006 SonyCSL