📖 読了まで置10分
World Startup Report - vol.38

AI推論のインフラを制する。Baseten $2.15Bの”つるはし”戦略

AU
ABOUTUS編集部
World Startup Report
World Startup Report

ゴールドラッシュの”つるはし”

公開情報によると、

1849年のカリフォルニア・ゴールドラッシュで最も確実に富を築いたのは、金を掘り当てた採掘者ではなかった。つるはしとジーンズを売った商人たちだった。リーバイ・ストラウスがその代表例だ。金脈を掘り当てるかどうかは運次第だが、採掘者全員がつるはしを必要とする。この構造は、2025年のAI業界にもそのまま当てはまる。

OpenAI、Anthropic、Google、Meta。巨大テック企業とAIスタートアップが、こぞって大規模言語モデル(LLM)の開発競争を繰り広げている。数十億ドルの資金が訓練(トレーニング)に投じられ、GPUの争奪戦が過熱する。しかし、この狂騒の中で、ひとつの根本的な事実が見落とされがちだ。モデルは訓練しただけでは1円も生まない。ユーザーのリクエストに応答する「推論」の段階で初めて価値が生まれる

この「推論インフラ」に特化し、AIゴールドラッシュの”つるはし”として急成長しているのが、サンフランシスコのBaseten(ベイステン)だ。2025年、同社はSeries Dで$150Mを調達し、評価額は$2.15B(約3,200億円)に到達した。

訓練ではなく推論。見落とされた本丸

AI業界では長らく「訓練(Training)」が注目を集めてきた。何千台ものGPUを何週間も回して、巨大なモデルを作り上げる。この工程は華やかであり、技術的にも興味深い。しかし、ビジネスの現場で実際にコストが発生するのは「推論(Inference)」の方だ。

Training vs Inference。AIのコスト構造
Training
モデルを作る
一度の大規模投資。数週間〜数ヶ月のGPU使用。完了すればコストは停止する

vs
Inference
モデルを使う
ユーザーのリクエストごとに発生。24時間365日。規模拡大に比例してコスト増大

調査会社の推計によると、AIワークロード全体のコンピュート消費のうち、推論が占める割合は約60〜70%に達するとされている。つまり、AIの「運用コスト」の大半は推論にかかっている。モデルが社会に普及すればするほど、推論の需要は指数関数的に増大する。

Basetenの創業者たちは、この構造を早期に見抜いていた。2019年の創業当初からMLモデルのデプロイに焦点を当て、訓練ツールがレッドオーシャン化する中で、推論インフラという「必ず通る道」を押さえる戦略を選んだのだ。

$150M Series D、$2.15B評価の裏側

Basetenの資金調達の歴史は、AI推論市場の成長をそのまま反映している。

$215M
累計調達額

$2.15B
最新評価額

2019年
創業年

  • 1
    2019年。創業Tuhin Srivastava(元Cruise)、Amir Haghighat、Philip Choによる共同創業。MLモデルのデプロイ簡素化を目指す。
  • 2
    2022年。Series B($20M)Greylock Partners主導。推論特化のプラットフォームとしてピボットを完了。
  • 3
    2024年。Series C($40M)LLMブームに乗り、顧客数が急増。AI企業だけでなく一般企業からの需要も拡大。
  • 4
    2025年。Series D($150M、$2.15B評価)BOND、CapitalG(Google母体)、Greylockが出資。推論インフラのカテゴリーリーダーとしての地位を確立。

注目すべきは出資者の顔ぶれだ。BONDはMary Meeker率いるトップティアVC。CapitalGはAlphabet(Googleの親会社)の成長投資部門。Greylockはシリコンバレーの名門VCだ。「AI推論インフラ」というカテゴリーが、トップ投資家から本格的に認知されたことを意味する。

なぜ巨大テック企業と共存できるのか

「推論インフラならAWS、GCP、Azureがやるのでは?」。自然な疑問だ。実際、クラウド大手はGPUインスタンスを提供しており、推論ワークロードを処理する能力がある。それでもBasetenが選ばれる理由は何か。

答えは「抽象化のレベル」にある。AWSのGPUインスタンスは汎用的だ。開発者はGPUドライバの設定、モデルの最適化、オートスケーリングの設計、コールドスタート対策など、インフラ層の問題を自分で解決しなければならない。Basetenはこれらを全て自動化する。

クラウド大手 vs Baseten。抽象化レベルの違い
AWS / GCP / Azure
GPUインスタンスを提供。設定・最適化・スケーリングは開発者の責任。自由度は高いが運用負荷も高い。

Baseten
モデルをアップロードすれば推論APIが自動生成。GPU最適化、オートスケーリング、コールドスタート対策を自動処理。開発者は推論ロジックに集中可能。

これはStripeと銀行の関係に似ている。銀行が決済の根幹インフラを持っていても、開発者が使いたいのはStripeのAPIだ。Basetenは「AI推論のStripe」を目指していると言っていい。実際にBasetenはAWSやGCPの上に構築されており、競合ではなくレイヤーの違いだ。

さらに、Basetenが支持される背景にはオープンソースモデルの台頭がある。Meta Llama、Mistral、Stable Diffusionなど、自社でホスティングしたいオープンソースモデルが急増している。これらのモデルを効率的に推論するには、GPUの特性を熟知した専用インフラが不可欠であり、まさにBasetenの得意領域なのだ。

推論インフラの技術的優位性

Basetenのプラットフォームが評価される理由は、いくつかの技術的な差別化要素にある。

  • 1
    Truss。オープンソースのモデルパッケージングMLモデルをコンテナ化し、どこでもデプロイ可能にするOSSフレームワーク。ベンダーロックインを排除し、開発者の信頼を獲得。
  • 2
    自動GPU最適化モデルのサイズや特性に応じて、最適なGPUタイプとメモリ割り当てを自動選択。NVIDIA A100、H100、L40Sなどの使い分けを自動化。
  • 3
    コールドスタートの解消GPUインスタンスの起動には通常数十秒〜数分かかる。Basetenは事前ウォームアップ機構により、レイテンシーをミリ秒単位に抑える。
  • 4
    マルチモデル同居1つのGPU上で複数の小型モデルを同時に動かし、リソース利用率を最大化。コスト効率を劇的に向上。

これらの技術は一見地味だが、AI企業のインフラコストを30〜50%削減できるポテンシャルがある。AIスタートアップにとってGPUコストは最大の出費項目であり、ここを圧縮できる意味は計り知れない。

日本のAIスタートアップへの示唆

Basetenの成功は、日本のスタートアップに重要な示唆を与える。

  • 1
    「つるはし」ポジションの発見AI領域でモデル開発の競争に参入するのは、資金力で劣る日本のスタートアップには厳しい。しかし、AIを使う全企業が必要とするインフラやツールの領域なら、十分に戦える。推論インフラ、データパイプライン、AIモニタリング。「つるはし」は至る所にある。
  • 2
    レイヤーの選択が競争優位を決めるBasetenはクラウド大手と競合しない。その上のレイヤーで価値を提供する。日本市場でも、既存の巨人と同じ土俵で戦うのではなく、その上のレイヤーで専門特化する戦略が有効だ。
  • 3
    OSSコミュニティからの信頼獲得BasetenのTrussはオープンソースとして公開されており、これが開発者コミュニティからの信頼と認知を獲得する強力なフライホイールとなっている。日本のAIスタートアップも、OSSによるコミュニティ構築を戦略的に活用すべきだ。

AIゴールドラッシュは始まったばかりだ。金を掘り当てる企業がどこになるかは誰にもわからない。しかし、採掘者全員がつるはしを必要とするという事実は変わらない。Basetenが証明しているのは、「華やかなフロンティア」ではなく「確実に需要があるインフラ」を押さえた企業こそが、最も堅実に成長できるという古くて新しい真理だ。

日本からも、この「つるはし」戦略で世界に挑むスタートアップが生まれることを期待したい。AIの波は止まらない。そしてその波を支えるインフラの需要もまた、止まることはないのだから。

金を掘るな。
つるはしを売れ。
それがAI時代の勝ち筋だ。

Basetenは推論という「見えないインフラ」に賭けた。AIが社会に浸透するほど、その賭けの正しさが証明されていく。

← 前の記事
海からCO2を取り出す。Caltechが生んだCaptura
次の記事 →
起業のバックオフィス業務を1日で片付ける、Every.ioの革命
すべての記事を見る →
TOP