近年、「生成AI」「フィジカルAI」「AGI」など、AIと名の付く言葉が急速に増えています。
これは単なる流行語ではなく、
AIが「何をする存在なのか」「どこまで役割を持つのか」を区別する必要が出てきたことの表れです。
本用語集では、AIと名の付く用語を以下の3つの視点で整理します。
- AIは何を理解・生成するのか
- AIは社会でどう使われるのか
- AIはどこまで行動するのか
生成AIで起こる「誤りの生成」その仕組みは以下の記事で解説しています。
🔗 ChatGPTはなぜウソをつくのか?生成AIの誤りと進化の最前線!
センシングAI(目や耳となる技術)
センシングAIとは、カメラや各種センサーで収集した現実世界のデータをAI(人工知能)が解析し、自動で状況判断や異常検知、予測を行う技術の総称です。
主な解析対象:
- 画像・映像
- 音声・振動
- 温度・圧力・位置情報
監視カメラによる異常検知や、製造ラインの不良検出、医療画像診断などが代表例で、
フィジカルAIや自律型AIの「目や耳」となる基盤技術とも言えます。
コグニティブAI(判断を補完・拡張する技術)
コグニティブAIとは、人間の思考や判断のプロセスを模倣し、「理解・推論・意思決定」を行うAI技術の総称です。単なるデータ処理やパターン認識にとどまらず、文脈や意味を読み取りながら、より人に近い形で考えることを目指します。
主な処理対象:
- 言語(文章・会話)
- 知識データ
- 複雑な条件やルール
意思決定支援システムや、ナレッジ検索、カスタマーサポートの高度化などが代表例で、
人間の判断を補完・拡張するAIとして、経営や専門領域での活用が期待されています。
ジェネレーティブAI(AIブームの中心技術)
ジェネレーティブAI(生成AI)とは、蓄積されたデータからパターンや特徴を学習し、新たなテキスト、画像、アイデアなどを自動的に生成するAI技術の総称です。業務の効率化だけでなく、企画・開発・クリエイティブ領域における新たな可能性を広げています。
主な生成対象:
- テキスト
- 画像
- 音声
- 動画
ChatGPTや画像生成AIが代表例で、現在のAIブームの中心技術とも言えます。
マルチモーダルAI(AIの進化を支える技術)
マルチモーダルAIとは、テキスト・画像・音声・動画など、複数の異なる情報形式(モダリティ)を同時に理解・処理できるAI技術の総称です。人間が目で見て、耳で聞き、言葉で考えるように、複数の情報を組み合わせて状況を把握できる点が特徴です。
主に扱える情報:
- テキスト
- 画像
- 音声
- 動画
- センサー情報
画像を見ながら質問に答えるAIや、音声と表情から意図を読み取るシステムなどが代表例で、
生成AI・フィジカルAI・エージェントAIの進化を支える技術です。
ファウンデーションAI(AI時代のインフラ)
ファウンデーションAIとは、さまざまな用途に応用できる「AIの基盤(基盤モデル)」です。
大量のデータを用いて事前学習されており、特定の用途に限らず、多様なタスクに柔軟に対応できる点が特徴です。
一からAIを開発するのではなく、基盤となるAIを活用・調整することで、効率的にAIサービスを構築できるため、現在のAI開発の中心的な考え方となっています。
主な特徴:
- 大規模データによる事前学習
- 多用途に転用可能
- 追加学習や調整(ファインチューニング)が可能
大規模言語モデル(LLM)をはじめ、生成AIや業務特化型AIの土台として利用されており、
AI時代のインフラとも言える存在です。
スウォームAI(最適な判断や行動を導く技術)
スウォームAIとは、複数のAIやエージェントが連携し、集団として最適な判断や行動を導くAI技術の総称です。個々のAIは単純でも、全体として高度な知的行動を実現する点が特徴です。
主な特徴:
- 分散型の判断
- 協調・連携による最適化
- 単一障害点を持たない構造
物流最適化や交通制御、ロボット群制御などが代表例で、
複雑で変化の多いシステムに強いAIアプローチとして注目されています。
自律型AI(自ら行動を選択する技術)
自立型AIとは、人の指示や操作を受けずに、自ら状況を判断し、行動を選択するAI技術の総称です。
環境の変化に応じてリアルタイムで意思決定を行う点が特徴です。
主な特徴:
- 人の介入を前提としない判断
- 継続的な状況認識
- 行動結果を踏まえた制御
自動運転車や自律ロボットなどが代表例で、
安全性や責任の所在といったAIガバナンスの観点が強く求められる分野でもあります。
フィジカルAIが「AIの物理的身体(行動能力)」に焦点を当てているのに対し、
自律型AIは「AIの判断能力(脳・プロセス)」に焦点を当てた概念です。
フィジカルAI(機械を通じて実際に行動する技術)
フィジカルAIとは、現実世界で「動く・触る・操作する」ことを前提とした物理空間で機能するAI技術の総称です。デジタル空間にとどまらず、ロボットや機械を通じて実際の行動を伴う点が特徴です。
主な構成要素:
- センシング(視覚・音・触覚など)
- 判断(AIによる解析・推論)
- 行動(モーター・アクチュエータ)
ロボット、ドローン、自動運転などが代表例で、
AIが社会や産業の現場に直接関与する段階を象徴する技術です。
AGI(まだ実現していない理論のAI)
AGI(汎用人工知能)とは、人間と同等、あるいはそれ以上の汎用的な知能を持つとされるAIの概念です。
現在実用化されているAIはすべて「特化型(ナローAI)」であり、AGIはまだ実現していない理論・研究段階のAIです。
AGIが持つとされる能力:
- 未知の問題への適応
- 複数分野を横断した学習
- 自己改善・自己目的化の可能性
研究や議論の中心では、「技術的に実現できるか」だけでなく、
社会・倫理・安全性への影響が大きなテーマとなっています。
今回ご紹介したAIに関する用語(概念)を実際に支える技術のひとつがLLM(大規模言語モデル)です。
実装技術としてのLLMの仕組みを知りたい方は以下の記事が参考になります。
🔗 LLM(大規模言語モデル)をやさしく解説|仕組みから実用例・課題までまとめて理解
