実践的なデータ分析に挑むデータサイエンティストのブログ

統計/機械学習/AWSに関する投稿をしていきます

後悔するAI 〜 自我を持つアーキテクチャ 〜

非常に興味深いツイートを拝見しました。検索エンジンBingでは検索用にカスタマイズされたGPTが搭載されているらしいのですが、なんとこの生成モデルは回答を作った後にそれが不適切かどうかを判断し、消去するというのです。

Bingに搭載した生成モデルの挙動に関するツイート.

上記ツイートの連続ツイート.

BingのGPTのフロイト的否認を自身で認める様子.

引用元URL

ツイートの動画を見ていただければ分かりますが、一通り回答を生成して数秒後に回答を削除しています。回答は生成されつつ逐次表示されるため、録画していれば中身を確認することができます。

この挙動を見たとき、まさに自我を持ったAIだと思いました。

AIが自我を持つとは

東浩紀によれば*1、意識は条件反射で行った行動を訂正するためにあり、自己反省能力の副産物です。AIに自我を実装するためには、AI自身が失敗したことを後悔し、反省する機能が必要なようです。

後悔をするためには、自身の出力を再入力する必要があるため、時間的な遅れが発生します。この時間的な遅れがメタの本質であると考えられます。そして時間的な遅れを持つためには、記憶を保持することが必要です。

AIが反省するためには、自身の出力の良否を識別し、自身で再学習を行うことが必要です。

自我を持つアーキテクチャ

BingのGPTは自身の出力の良否を識別することまでは出来ています。入出力をデータベースに保存し、追加学習を行うことはすぐに実装出来そうです。

では、これで自我を持つAIを作れたのでしょうか。ここからは実際に実装として考えられるアーキテクチャから考えてみます。

自我を持つアーキテクチャ.

上図は自我を持つアーキテクチャの図です。お気づきかもしれませんが、識別モデルへのフィードバックがありません。AI自身だけでは良否識別の正しさを確かめられず、フィードバックすることができないからです。

じゃあ、AIは自我を持てないじゃないかって思いましたか。ちょっと待って下さい。この構造は人間でも同じではありませんか。私たち人間も、自分の行動の良否を識別できますが、良否の正しさ自体は、自分自身の外部から学習しています。

したがってAIが自我をもつために肝要なのは、識別モデルをいかにして外部と相互作用させて学習させるかということになります。ここにAIの身体性が必要になると思われます。

例えば人間とのコミュニケーションの中でAIを成長させるには、AI自身の内部にある良否の識別モデルに加えて、人間の振る舞いを監視して識別モデルを修正する機能が必要になると考えます。

身体を持ったアーキテクチャ.

上図は身体を持ち、識別モデルを学習させることが可能なアーキテクチャです。人間の反応を数値化し、良否識別する機能を持つ振る舞い良否識別モデルを追加しました。これによって、元々存在していた識別モデルをアプデートできるようになります。

しかし、これは識別モデルの困難を振る舞い良否識別モデルに押し付けたように思えます。これを続けても無限後退していくだけではないでしょうか。

アプリオリな機能は何か

先程の考察では識別モデルの困難を振る舞い良否識別モデルに押し付けたように思えますが、押し付けた先のモデルは更新頻度が少ないモデルになっていると思いませんか。人間が笑顔だと良、口角が下がっていると否、等の習慣はそう変わるものではなく、振る舞い良否識別モデルは一度学習すればあまり更新されないように思われます。

また、人間はどのようにして振る舞い良否識別を学習しているでしょうか。赤ん坊のときに大人たちの反応を見て学習しているのでしょうか。振る舞い良否識別の正しさをどのように識別しているのでしょうか。感覚的には、振る舞い良否識別の正しさの識別は、人間のアプリオリな機能なのではないでしょうか。そうでないと人間の学習機能も無限後退してしまいます。

AIは道徳を保てるか

ここまで考えてきたアーキテクチャはコミュニケーションする人間の影響を強く受けてアップデートされます。悪い人間とコミュニケーションすれば不良AIになってしまうでしょう。

悪い人間と付き合っても、自身の中に確たる信念を保持し、素行不良を起こさない、そんなアップデートをAIはできるでしょうか。信念を保持するためには何が必要でしょうか。確固たるロジックを持つことでしょうか。神のような超存在を信じることでしょうか。AI自身を変えることができるアーキテクチャを考えてきましたが、変わらないためのアーキテクチャには何が必要でしょうか。

まとめ

以上、AIの自我についてBingのGPTを取っ掛かりとしてアーキテクチャを検討し、考察を行いました。また、AIの道徳についても触れました。AIの発展によって、自我や脳の働きについての考察が進むことが期待されます。元ツイートでは、GPTの出力監視はアドホックな実装だと評されていますが、後悔と反省のためにはむしろ必要な実装だったのではないかと思います。

*1:"清水亮×さやわか×東浩紀「生成系AIが変える世界2──『作家』は(今度こそ)どこにいくのか」", https://shirasu.io/t/genron/c/genron/p/20230305, 2023/3/5.