生成AIは人間を代替するか～生成AIと人間の知能の違いとは～

金融研究部准主任研究員・サステナビリティ投資推進室兼任原田哲志

1――生成AIの活用

近年では生成AI（人工知能）の性能向上などにより社会の様々な分野での生成AIの活用に注目が集まっている。生成AIの社会的な活用が推進されており、2023年11月には政府は生成AIの開発者向けに政府保有データの提供を始めることを決定した¹。生成AIの開発において米国など海外が先行する中、国産の生成AI開発を促進する狙いだ。

一方で、生成AIの普及には様々なリスクも指摘されており、適切な利用が肝要と言われている。政府はAIの開発や利活用に関するガイドラインの策定を進めている²。「広島AIプロセス包括的政策枠組み」や「人間中心のAI社会原則」といった国内外の諸原則や規制を踏まえたガイドラインの策定が行われている(図表１)。

生成AIの活用を巡っては、活発な議論が行われており、様々な意見がある。生成AIの活用や今後を考える上では、その仕組みや性質について理解することが必要だろう。本稿では、生成AIの仕組みや性質について説明したい。

¹ 日本経済新聞、「生成AI学習向け、政府データを提供へ　国内事業者に」、2023年11月7日
² 経済産業省、「AI事業者ガイドライン案」

2――生成AIの仕組みと特徴

代表的な生成AIサービスであるChatGPTを提供するOpenAIは入力された文章から画像を生成する処理の基盤となるCLIP(Contrastive Language-Image Pre-training)モデルの論文を公表している³。CLIPは、テキストと画像の対応関係をとらえるモデルであり、 (1)与えられた学習データの文章や画像の特徴(特徴量)を抽出、(2)それらを特徴量によって文章と画像を関連付ける、(3)画像が入力された際には、その特徴量を抽出、あらかじめ学習したテキストと画像の対応関係に基づいて関連性が高い文章を提示することができる(図表２)。つまり、簡単に言うと入力された画像の内容について文章で回答することができる。

画像や文章から特徴量を抽出することを「エンコード」と呼ぶ。逆に特徴量をもとに具体的な画像や文章を生成することを「デコード」と呼ぶ。

文章をもとに画像を生成するように指示された場合は、与えられた文章の特徴量をもとCLIPモデルにより、関連性が強い画像の特徴量を取得し、その特徴量をもとに画像を生成するというプロセスを行っている(図表３)。

このように生成AIは大きく(1)画像や文章から特徴量を抽出、(2)これらの特徴量を関連付け、(3)関連性から得られた特徴量をもとに画像や文章を生成する処理から成り立っている。これにより、入力された画像や文章と関連が強い画像や文章を出力している。また、文章による質問に文章で回答する場合も同様に関連性が強い情報を探し提示するプロセスを行っている。

生成AIはこのようにして与えられた文章から画像を生成しているが、どのような処理が得意・不得意だろうか。

生成AIは「手」の画像の生成が不得意だと言われている(図表４)。人間は片手の指が基本的には5本だということをあらかじめ知っており、そうした前提知識をもとに絵を描くことができる。一方で、生成AIはそうした前提知識はなく、与えられた手の画像の学習データのみからそれを判断し、画像を生成する。しかし、多くの手の画像は一部の指が隠れていることなどから、本来の手の形状・性質の学習が困難となっている。生成AIの学習データは一般的に２次元の平面的な画像であり、３次元の「立体的な情報」は得られないことも影響している。

また、生成AIの特徴として「ハルシネーション(幻覚)」が指摘される。ハルシネーションとは生成AIが事実と異なる情報や、実際には存在しない情報を生成する現象を指す。

ハルシネーションは生成AIが関連の強い情報を提示する仕組みに基づいて回答文を生成しており、事実かそうでないかという観点は基本的に持ち合わせていないことが原因となっている。

このようにAIが単に関連性によって回答しているのに対して、人間は例えば「事実かそうでないか」、「対象に関する知識」、「立体的な情報」といった多面的な観点や知識から判断を行っていることが分かる。

³ OpenAI,” CLIP: Connecting text and images” https://openai.com/research/clip

3――AIが抱え続けるフレーム問題とは

上記の点と関連するAIの課題点として「フレーム問題」が指摘されている。フレーム問題とは、AIの処理能力は有限であるため、現実で起こりうる無数の出来事に対処することはできないことを意味する。チェス、将棋といったルールが規定されたボードゲーム、製品の組立作業といった対象となる範囲が限定されている課題では、フレーム問題は生じずAIは対処ができる。

対象や問題の範囲が限定されている状況では、それに沿って特定のモデルにより回答することができるが、人間が普段何気なく行っているように問題の範囲が限定されない中で様々な観点をもとに回答するようなことを、特定のモデルにより実現することは困難である。

AIの分類として、「強いAIと弱いAI」という分類がされる場合がある。弱いAI(特化型AI)とは、対象となる課題の範囲内で回答を行うAIを指す。強いAI(汎用型AI)とは、対象となる課題が限定されず、人間のように様々な課題に対して対応・回答を行うAIを指す。弱いAIが特定の課題にしか対処できず、道具のような存在であるのに対して、強いAIは人間に近いものと言える。

しかし、強いAIである汎用型AIは現時点では原型となる有力なモデルすら存在しない、想像上の存在である。様々な要素を考慮に入れるようにAIのモデルや性能が改善される可能性はあるが、フレーム問題が解決しない限り、強いAIの実現は難しい。

米国の大手IT企業IBMは「学術機関や民間のAI研究者たちが、汎用人工知能（AGI）の開発に投資を行っている一方で、それは現時点では、理論的な概念としてしか存在しておらず、具体的な現実にはいたっていません」と述べている⁴。また、米国のコンピュータ科学者Marvin Minsky氏は、今後数十年のうちに汎用型AIが実現するという見方は楽観的すぎると指摘している。

今後、AIの性能が向上し続けたとしてもフレーム問題は現状では解決の目途は立っておらず、AIが苦手な分野は長期間残り続けるかもしれない。

生成AIは現状では期待が先行しているが、こうした特徴や得意・不得意はよく知られていない面もある。しかし、けっして生成AIが万能でないことは理解すべきである。生成AIの社会実装を進めていく上では、その得意・不得意を踏まえた適切な利用が不可欠であり、政府や各企業等の具体的で分かりやすいガイドラインの早期策定が求められる。生成AI活用の今後の動向に注目したい。

⁴ IBM,「強いAIとは」 https://www.ibm.com/jp-ja/topics/strong-ai

（お願い）本誌記載のデータは各種の情報源から入手・加工したものであり、その正確性と安全性を保証するものではありません。また、本誌は情報提供が目的であり、記載の意見や予測は、いかなる契約の締結や解約を勧誘するものではありません。

日付	タイトル	執筆者	媒体
2025/07/08	次世代の太陽電池「ペロブスカイト」とは	原田哲志	基礎研マンスリー
2025/07/07	グローバル株式市場動向(2025年6月)－半導体関連銘柄を中心に上昇	原田哲志	基礎研レター
2025/06/25	退職世代の家計の実際－統計で見る退職世代の貯蓄・消費	原田哲志	基礎研レター
2025/06/13	DeepSeekに見るAIの未来－近年のAI進化の背景とは	原田哲志	基礎研レポート

日付

タイトル

執筆者

媒体

2025/07/08

次世代の太陽電池「ペロブスカイト」とは

原田哲志

基礎研マンスリー

2025/07/07

グローバル株式市場動向(2025年6月)－半導体関連銘柄を中心に上昇

原田哲志

基礎研レター