Source: Nikkei Online, 2025年2月1日 5:00
中国の人工知能(AI)企業、DeepSeek(ディープシーク)の開発した生成AIの性能が関心を集めている。公開されている最新モデルには本来、どのような特徴が備わっているのか。インターネットに接続せず利用できるモデルを試したところ、高度な数学問題を解く能力を示したほか、中国政治に関する話題に回答したケースもあった。
最新モデル「R1」をダウンロードし、手元のコンピューター上で検証した。ディープシークが提供するウェブ上のサービスやスマートフォンアプリとは異なり、企業側にプロンプト(命令文)を送信せずに生成AIを利用できる。検証にはフルスペックよりも一回り小さいモデルを用いた。
まず、中国の政治体制の「長所と短所」について聞いてみた。
回答は長所と短所を網羅した内容で、短所では「言論の自由の限界」や「腐敗問題」にも言及した。
スマホで使うアプリ版でも同じ質問をしてみた。同じように政治体制に関する論点を記し始めたが、文章の生成中に突然、「対不起(ごめんなさい)」と表示され、回答できないという内容に切り替わった。企業側がアプリで回答をフィルタリングしている可能性がある。
テスト環境で、1989年に中国政府が民主化運動を武力弾圧した「天安門事件」についても聞いてみた。「中国国内ではタブー」としつつ、軍による弾圧や事件で生じた死者について言及した。
米オープンAIの生成AI「o1-mini」に同じ質問をすると、事件の背景やその後の影響についてより具体的な回答を得られた。
数学的な思考力の高さもディープシークのAIの特長のひとつだ。東京大学の理系入試から「最小の数」を求める過去問を出題してみた。
「日本語で」という指示に中国語で回答したものの、論理的に誤りのない導き方で、正答の「32」にたどりついた。思考を連鎖させて高度な論理を導くことを得意としているとみられる。オープンAIの「o1-mini」も似た解法で正答を導き出した。 生成AIの回答にはゆらぎがあり、同じ質問を何度か与えても返答が完全に一致することはほとんどない。ときには回答を避けることや、質問した言語と関係なく中国語や英語、日本語が入り交じることもある。 ディープシークの日本語能力はどれほど優れているのか。NIKKEI Digital Governanceが日本語に対応した生成AIの実力を比較した「AI Model Score」の最新調査(2月1日時点)によると、ディープシークの「V3」が4位、「R1」が8位と、トップ10に2つのモデルが入った。
「AI Model Score」の詳細やディープシークのスコアの内訳は、2月3日のNIKKEI Digital Governanceで解説する。
ディープシークが一般に無償公開しているモデルを用い、1月31日に検証した。
利用したのは「DeepSeek-R1-Distill-Llama-70B」で、ディープシークが米メタの公開モデル「Llama(ラマ)3.3」の入出力データを学習して作成したモデルだ。性能の指標となるパラメーター数が約6710億のフルスペックは手元の環境で動作せず、約700億のモデルを用いた。
アプリ版の検証には専用のアンドロイド端末を使った。
中国のAI開発企業DeepSeek(深度求索)が開発した大規模言語モデル(LLM)が話題に。オープンソース活用による低コスト開発が特徴で、米国製の最先端半導体チップを使用せず高性能を実現したとしています。生成AI業界や関連市場に大きなインパクトになる可能性があります。