📖 読了まで置10分
World Startup Report - vol.17

全てのロボットを動かす”一つのモデル”。Physical Intelligence

AU
ABOUTUS編集部
World Startup Report
World Startup Report

ロボティクスの「GPTモーメント」

2022年11月、ChatGPTが世界を変えた。テキスト生成AIが「使えるもの」になった瞬間だ。画像生成ではMidjourneyとDALL-Eが同様のブレイクスルーを起こした。しかし、ロボティクスの世界には、まだ「GPTモーメント」が訪れていなかった

ロボットは長い間、「特定のタスクしかできない機械」だった。工場のアームロボットは溶接ができるが、ネジを締めることはできない。倉庫のピッキングロボットは箱を掴めるが、食器は扱えない。一つのロボットが、あらゆるタスクをこなす。そんな汎用ロボットは、映画の中だけの存在だった。

Physical Intelligence(通称 Pi)は、この常識を書き換えようとしている。2024年、サンフランシスコで創業されたこのスタートアップは、ロボティクスの基盤モデル「pi-zero」を開発した。GPTがあらゆるテキストタスクをこなすように、pi-zeroはあらゆる物理的タスクをこなすことを目指している。

pi-zero。一つのモデルで全てを動かす

従来のロボティクスAIは、タスクごとに個別のモデルを訓練していた。「箱を掴む」ためのモデル、「ドアを開ける」ためのモデル、「物を移動させる」ためのモデル。これでは、新しいタスクが必要になるたびに、膨大な訓練データの収集と学習が必要になる。

従来型 vs 基盤モデル。ロボティクスAIの進化
従来型
タスク特化型
1タスク1モデル。溶接ロボット、ピッキングロボット等が別々のシステムで動く。汎用性ゼロ

pi-zero
汎用基盤モデル
一つのモデルが複数タスクに対応。テキスト指示で新タスクを実行。未知のタスクにも適応可能

pi-zeroの核心技術は、Vision-Language-Action(VLA)モデルと呼ばれるアーキテクチャだ。視覚情報(カメラ映像)、言語情報(テキスト指示)、行動情報(ロボットの動作)を統合的に学習する。「テーブルの上のコップを棚に置いて」という自然言語の指示を、視覚情報と組み合わせて、ロボットアームの具体的な動作系列に変換する。

公開情報によると、重要なのは、pi-zeroがロボットの形状やメーカーに依存しない点だ。2本腕のヒューマノイド、単腕の産業用ロボット、移動型の配送ロボット。異なるハードウェア上で同じモデルが動作する。これは、ロボティクスにおける「Androidモーメント」とも言える。

$1.1B調達と$5.6B評価

2024年、Physical Intelligenceは2回のラウンドで合計$1.1B(約1,650億円)を調達した。企業評価額は$5.6B(約8,400億円)に達している。創業からわずか1年でのこの評価は、ロボティクスAI分野としては前例のない水準だ。

$56億
企業評価額

$11億
累計調達額

2024年
創業年

出資者リストは圧巻だ。Jeff Bezos(Amazon創業者)、OpenAI、Sequoia Capital、Lux Capital、Thrive Capital、Bond、Khosla Ventures。テック業界とVC業界のオールスターが集結している。

なぜこれほどの資金が集まったのか。それはpi-zeroが解決する問題のスケールにある。世界のロボティクス市場は2030年までに$260B(約39兆円)規模に成長すると予測されている。しかし、その成長を阻んでいたのが「汎用性の欠如」だった。pi-zeroがこのボトルネックを解消すれば、ロボティクス市場全体が爆発的に拡大する

洗濯物を畳み、コーヒーを入れる

pi-zeroのデモ映像は、ロボティクス業界に衝撃を与えた。一つのモデルが、以下のような多様なタスクをこなす様子が公開されたのだ。

  • 1
    洗濯物を畳む柔軟物体のハンドリングはロボティクス最難関の一つ。Tシャツを認識し、広げ、正確に畳む一連の動作を自律実行。
  • 2
    コーヒーを入れる豆を計量し、グラインダーにセットし、ドリップする。複数のツールを順序立てて使う複雑なタスク。
  • 3
    テーブルを片付ける食器、グラス、カトラリーを識別し、それぞれ適切な場所に分類して収納。壊れやすいものは力加減を調整。
  • 4
    箱の梱包異なるサイズの商品を認識し、適切な箱を選び、緩衝材と共に梱包。物流倉庫での実用を想定。

これらのタスクに共通するのは、事前にプログラムされた動作ではなく、モデルが「理解」して実行している点だ。初めて見る形状の洗濯物でも畳める。指示されていない状況変化(テーブルの位置が変わった等)にも対応できる。これはルールベースのロボットでは不可能だったことだ。

Bezos、OpenAI、Sequoiaが賭けた理由

Jeff BezosがPhysical Intelligenceに出資した意味は大きい。Amazonは世界最大の物流ネットワークを持ち、75万台以上のロボットを倉庫で稼働させている。しかし、それらのロボットは特定タスク専用であり、汎用性に欠ける。pi-zeroのようなモデルは、Amazonの物流効率を根本から変える可能性を持っている。

Physical Intelligenceのエコシステム戦略
01 プラットフォーム化
ロボットメーカーにpi-zeroをライセンス提供。ハードウェアは作らず、「頭脳」だけを提供するビジネスモデル。

02 データ・フライホイール
様々なロボットからの動作データが蓄積されるほど、モデルの性能が向上。利用が増えるほど良くなる好循環。

03 ロングテール対応
大企業だけでなく、中小規模の製造業・サービス業にもロボット導入を可能にする。カスタム開発なしで導入可能。

OpenAIの出資も象徴的だ。OpenAIはかつて独自のロボティクスチームを持っていたが、2021年に解散した。その際、「データ不足」が最大の課題だと結論づけた。Physical Intelligenceは、まさにそのデータ問題を大規模に解決しようとしている

日本のロボティクスへの示唆

日本はロボティクス大国だ。ファナック、安川電機、川崎重工。産業用ロボットで世界をリードしてきた。しかし、AIによる汎用ロボティクスの領域では、アメリカに大きく遅れを取っている

日本のロボットメーカーが強いのは「ハードウェア」だ。精密な動作制御、高い耐久性、優れた品質管理。しかし、pi-zeroのような基盤モデルが普及すれば、ロボットの価値はハードウェアからソフトウェア(AI)へとシフトする

  • 1
    ハードウェアの優位性は「ボディ」に残るpi-zeroが「頭脳」なら、日本企業が得意な精密機械は「ボディ」として不可欠。頭脳とボディの分離が、日本企業にとっての新たな機会になる。
  • 2
    少子高齢化が最大の動機日本の労働力不足は深刻。汎用ロボットが家事、介護、飲食サービスをこなせるなら、日本が最大の市場になる可能性がある。
  • 3
    データ収集の国家戦略が必要pi-zeroの強さはデータ規模にある。日本独自のロボット動作データセットの構築が、国際競争力の鍵を握る。

Physical Intelligenceの物語は、ロボティクスがいよいよ「ソフトウェアの時代」に入ったことを告げている。ハードウェアの精度ではなく、AIモデルの汎用性が競争力の源泉になる。日本のロボットメーカーがこの転換に適応できるかどうかが、今後10年の産業競争力を左右する。

一つのモデルが、
全てのロボットに
知性を与える。

Physical Intelligenceのpi-zeroは、ロボティクスのGPTモーメントだ。洗濯物を畳み、コーヒーを入れ、テーブルを片付ける。$5.6Bの企業価値は、物理世界にAIの知性を解き放つことへの賭けである。

← 前の記事
FAXをAIで読む。医療事務AIのTennrが$605M評価になった理由
次の記事 →
21歳の大学中退3人が$10Bを作った。Mercorの軌跡
すべての記事を見る →
TOP