■人が何を話すかを予測する生成AI
小島氏のKotoba Technologiesは、創業から2年弱。国内外を問わず翻訳サービスは多数あり、その精度や速度は生成AIの活用などによりさらに高まっている。海外のビッグテックは生成AIの開発に莫大なリソースを投じるが、その分テキストや画像など様々な分野があり、音声分野に割けるのは一部のリソースだ。一方でKotoba Technologiesは、音声・同時通訳に特化したAIが強み。小島氏も「基本的にAIの研究開発は、汎用的にいろいろなタスクで使えるものを作ろうというコンセプト。我々はスピード、同時通訳に全振りした」と語る。
同社のサービス「同時通訳」では、独自の生成AIモデルを開発し、リアルタイム性と精度の2つで、世界最速レベルを達成した。現在は日本語・英語・中国語・韓国語に対応している。その速度は、人間が話したものが翻訳されて文字になるまで平均1秒以内。さらには相手が次に話す内容を“予知”することで、話す前に文字が表示される“マイナス0.5秒”にまで達した。「マイナスということは、人が何を話すかを事前に予測してしまうということ。(予測したものが)テキストで出た後、間違っていて取り下げることもある」と笑う。生成AIが「この人は次にこう話すだろう」と予測したものと実際の発言が異なるケースもあるが、それも“先読み”までできるレベルにまで高まった証しだ。
■同時を超えた速度、その先は■Pick Up
・キー局全落ち!“下剋上”西澤由夏アナの「意外すぎる人生」
・現役女子高生の「リアルすぎる日常」をのぞき見