AIが「人間並み」の文章 画像、音声に次ぐ革新迫る

英語が先行、日本語は後れ

<<Return to Main

Microsoft News, 2020/11/19 7:46更新

GPT-3が書いたブログが大きな話題を呼んだ

人工知能(AI)の「言語能力」が飛躍的に向上している。人間並みに高度で自然な文章を生成する技術も登場した。画像・音声の認識に次ぐ革新が起こりつつある。

「GPT-3がブロックチェーンに匹敵するほどの破壊的な可能性をもつと考える理由を説明する」。こんな導入で始まる7月公開の英語のブログが、AI研究者らの間で話題を呼んだ。

読み進めると「GPT-3」の説明が長文で記されている。米テスラの最高経営責任者(CEO)イーロン・マスク氏らの支援を受けた研究企業オープンAIが開発した「言語AI」であり、報道や広告、政治に広く影響を与えうる、という。

淡々と文章が続くが、後段で様子が変わる。突然「告白がある」との一文が入り「この記事は完全にGPT-3によって書かれたものだ」という記述が出てくる。AIによる作文だったとタネ明かしされるわけだ。

GPT-3の発表直後の7月ごろから、英語圏では様々な文章をつくる試みが広がった。GPT-3に書かせたことを明かさずに投稿されたブログ記事が、ソーシャル・ニュースサイトでランキングの首位を獲得する現象も起きたという。「人間と同レベルの文書を生成できるようになった」。言語分野のAIを手掛けるスタートアップ、ストックマーク(東京・港)の近江崇宏氏はその性能の高さに舌を巻く。

GPT-3は巨大な「脳」で大量の文書を学び高い能力を得た。学習時にAIを調節するポイントともいえるパラメーター数は1750億個と従来の約100倍だ。開発に使ったデータは単語数で数千億に相当する。

使う際はいくつか例を示して「こんな文を書いてほしい」と指示するだけで済む。この柔軟性、汎用性の高さもGPT-3の画期的な点だ。あらゆる場面で完璧な文章を書くわけではないが、今後の進化に注目が集まる。鍵を握るのが米マイクロソフトの動向だ。

同社は2019年にオープンAIに10億ドル(約1040億円)を投資すると表明し、20年9月にGPT-3の独占ライセンスを得たと発表した。最高技術責任者のケビン・スコット氏は「実現するビジネスや創造力の可能性は非常に幅広い」とコメントし、文章の作成支援や要約、翻訳への活用に期待を示した。

なぜ今、言語分野のAIが注目されるのか。AIブームに火が付いたのは12年ごろだ。深層学習と呼ぶ技術により画像や音声の認識精度が上がり、人間に例えるとまず視覚や聴覚にかかわる領域で革新が起きた。15年には世界的な画像認識技術のコンテストでAIの精度が人間を上回り、車の自動運転や顔認証などでの活用も進んだ。

一方、言語分野のAIが飛躍を遂げたのは18年だ。米グーグルが「BERT」と呼ぶモデルを開発したのを機に、急激に性能が上がった。文の類似度や意味の判定など多角的に能力を測る「GLUE」と呼ぶ指標で人間との差を一気に縮め、19年に追い抜いた。

GPT-3の登場も、こうした進化の延長上にある。文章の作成や要約、分類、対話や翻訳など言語にかかわる業務は多い。AIの高度化で劇的に効率化できる可能性がある。東京大学の松尾豊教授は画像認識の革新に触れつつ「それ以上に大きな変化をもたらすのではないか」とみる。

ただ、日本語に対応するAIの開発は英語に比べ後れを取る。学習用のデータが少なく、研究に携わる人材や資金力も見劣りする。英語圏でGPT-3などの導入が進んだとき、生産性や競争力の差が広がりかねない。

松尾教授の研究室から生まれたスタートアップのイライザ(東京・文京)はBERTなどの技術を取り入れ、9月に人間超えの性能をもつ「日本語AI」を開発したと発表した。読み書き、対話など幅広い業務に対応するという。曽根岡侑也CEOは利用の拡大に向け「一緒に取り組んでくれるパートナー企業が必要だ」と呼びかける。

こうした試みをどこまで広げられるか。日本の産業界にとっても重要な意味をもつ。

(AI量子エディター生川暁)