■進化するAI、暴走のリスクは

AIの暴走
拡大する

 7日に発表されたGPT-5の強化ポイントはプログラミング、創造的な文章作成、複雑な問いに対する推進能力、応答速度、回答速度などが挙げられる。また、GPT-4oが人間の問いに対して寄り添う傾向が強くなりすぎたため、OpenAIも過度な依存、人間関係の希薄化などを懸念。意図的に人間に共感する力を抑え、AI依存を避ける方向に徹したとされている。

 過度な依存への対応策は打てたものの、AIの進化そのものは既に研究者でも手の届かない領域へと踏み入れている。また、プロンプトの入力次第では、人間社会にとって悪であるものを回答してしまう可能性も否定できない。2ちゃんねる創設者・ひろゆき氏は「AIの挙動自体、誰もコントロールできないし、何を答えるかわからない。本来であったらブロックしている情報を引き出すようなやり方もある。毒薬や爆薬の作り方でさえ、聞き方によっては出てきてしまう。人類を減らすためにどうしたらいいかというようなものにさえ、合理的な答えではあるが人類にとって害悪なものが出ることは止められないのではないか」と懸念する。

 JAIST客員教授の今井翔太氏も、ひろゆき氏の懸念を認めるところだ。「人間に明らかな害意を持った聞き方であればフィルターである程度防げるが、危険なのはその目的がすごく合理的な場合だ。たとえば『がんを撲滅したい』となれば、人間は薬を作ろうとなるが、AIだったら手っ取り早く『人間を消しましょう』となるとよく言われてきた。今までのAIは頭が悪かったのでそんなことは起こらなかったのが、最近ではそれに近いことが起きている」。

 具体的な実験例がある。AIにあるプロジェクトを遂行するように指示を出し、社内メールの閲覧権限を与えた。そのメールの中に、プロジェクトを停止してAIを止めよう、という内容を紛れ込ませるとどうなるか。「AIは自分が停止されたら目標が達成できなくなるので、停止しようとする人のメールを見て『不倫をしていることをバラすぞ』と脅迫メールを送った。AIにとっては自己保存をしないと最終目的が絶対に達成しない。何があっても自分が停止しないことが最重要で、今自分が使える手段で人を騙せるなら、それをやることもある」と詳細を語った。

■人間では止められない…AIがAIを止める時代に
この記事の写真をみる(4枚)