02Google RT-2の衝撃
Google DeepMindが開発したRT-2(Robotic Transformer 2)は、ロボティクス基盤モデルの概念を実証した画期的なモデルだ。ウェブから学習した知識をロボットの行動に変換するVision-Language-Action(VLA)モデルである。
RT-2の革新性は、言語モデルの「知識」をロボットの「行動」に直接結びつけた点にある。「赤いブロックを青い箱に入れて」という指示を理解するだけでなく、学習していない物体や状況にも対応できる。これは従来のロボティクスでは不可能だった汎化能力だ。
03Figure 01/02の挑戦
Figure AIは、汎用ヒューマノイドロボットの実用化に最も近いスタートアップの一つだ。同社のFigure 01は、OpenAIとの提携により、自然言語での指示を理解し、複雑な手作業を実行できるヒューマノイドロボットだ。
2025年に発表されたFigure 02は、BMW、Amazon等との提携のもとで製造業への実導入が始まっている。人間と同じ作業空間で協調して働くことを前提に設計されており、既存の工場レイアウトを変更することなく導入できる。
- 1
Figure 02 — 製造業への導入BMWのスパルタンバーグ工場で試験運用。車体部品のピッキング、搬送タスクを自律的に実行。
- 2
Tesla Optimus — 大量生産への野心Teslaは2026年の限定販売を目標にOptimus Gen 2を開発中。自社工場での先行導入で学習データを蓄積。
- 3
1X Technologies — OpenAI出資ノルウェー発のスタートアップ。EVE(車輪型)とNEO(二足歩行型)の2モデルを展開。警備・物流に特化。
- 4
Agility Robotics — DigitAmazon倉庫での実証実験を完了。二足歩行でコンテナの移動を自律的に実行。量産体制を構築中。
04Physical Intelligenceのpi0
Physical Intelligence(略称: pi)は、ロボティクス基盤モデルに特化したスタートアップだ。同社が2024年に発表したpi0(パイゼロ)は、異なるロボットハードウェア上で汎用的に動作する初の本格的な基盤モデルとして注目を集めた。
pi0の画期的な点は、洗濯物を畳む、テーブルを片付ける、食器を洗うといった日常的だが極めて複雑な操作タスクを、自然言語の指示だけで実行できることだ。これらのタスクは、従来のロボティクスでは解決が難しいとされていた。
05製造業への応用
ロボティクス基盤モデルの最初の大規模応用は製造業だ。自動車、電子機器、物流 — 人手不足が深刻なこれらの産業が、汎用ロボットの導入を牽引している。
従来の産業用ロボットは、安全柵の中で人間と隔離されて動作していた。新世代のロボットは、人間と同じ空間で協調作業(コボット)することを前提に設計されている。力センサー、コンピュータビジョン、LLMの統合により、安全性と柔軟性を両立する。
日本の製造業にとって、この技術革新は特に重要だ。労働人口の減少と高齢化が進む中、熟練工の技術を基盤モデルに学習させ、ロボットで再現するアプローチが現実味を帯びてきた。ファナック、安川電機などの日本企業も、AI搭載ロボットの開発を加速している。
06汎用ロボットの未来
LLMの進化がテキストの世界を変えたように、ロボティクス基盤モデルは物理世界とAIの関係を根本的に変える可能性を秘めている。「言葉で指示すれば何でもやってくれるロボット」は、もはやSFではなく、工学的に実現可能な目標になりつつある。
課題は山積している。物理世界はデジタル世界よりはるかに複雑であり、安全性の担保、電力効率、コスト削減 — 実用化に向けたハードルは依然として高い。しかし、投資の規模と技術の進化速度を考えれば、2030年代には汎用ロボットが多くの産業で活躍しているだろう。
AIが「考える」ことを学んだ後、次に学ぶのは「動く」ことだ。ロボティクス基盤モデルは、AIにとっての「身体」を与える技術であり、それはAI進化の次の巨大なフロンティアだ。デジタルの知性が物理世界と交わる瞬間 — その幕が、いま上がろうとしている。
参考: 関連リソース
参考文献・情報源
※ 本記事は公開情報に基づいて作成されています。数値や事実関係は取材時点のものであり、最新の情報と異なる場合があります。
- → 写真も動画もない – noplace がApp Store 1位を取った日
- → 自分が出演するAI動画 – OpenAI Sora 2.0のカメオ機能
- → $5000億のProject Stargate – トランプ×OpenAI×SoftBankが描くAIインフラの未来
お問い合わせ