AIは訓練しただけでは稼げない。日々動かし続ける裏方仕事に勝機を見た

ゴールドラッシュの”つるはし”

1849年のカリフォルニア・ゴールドラッシュで最も確実に富を築いたのは、金を掘り当てた採掘者ではなかった。つるはしとジーンズを売った商人たちだった。リーバイ・ストラウスがその代表例だ。金脈を掘り当てるかどうかは運次第だが、採掘者全員がつるはしを必要とする。この構造は、2025年のAI業界にもそのまま当てはまる。

OpenAI、Anthropic、Google、Meta。巨大テック企業とAIスタートアップが、こぞって大規模言語モデル（LLM）の開発競争を繰り広げている。数十億ドルの資金が訓練（トレーニング）に投じられ、GPUの争奪戦が過熱する。しかし、この狂騒の中で、ひとつの根本的な事実が見落とされがちだ。モデルは訓練しただけでは1円も生まない。ユーザーのリクエストに応答する「推論」の段階で初めて価値が生まれる。

この「推論インフラ」に特化し、AIゴールドラッシュの”つるはし”として急成長しているのが、サンフランシスコのBaseten社（ベイステン）だ。2025年9月にはSeries Dで1億5,000万ドル（約232億円）を調達し、評価額は21億5,000万ドル（約3,330億円）に到達。さらに2026年1月には評価額50億ドル（約7,750億円）でSeries E 3億ドル（約465億円）を追加調達し、推論インフラのリーダーとしての地位を固めている。

訓練ではなく推論。見落とされた本丸

.@Baseten is building the Inference Cloud, and has raised another $1.5B to invest aggressively in their capacity, infrastructure platform and research products.

Today, they serve the leading AI-native companies who want to own and improve their intelligence. These frontier… https://t.co/EgAFyuPSwy

— sarah guo (@saranormous) 2026年6月22日

“Basetenは「推論のクラウド」を作っていて、設備、インフラ基盤、研究プロダクトに積極的に投資するため、さらに15億ドルを調達した。いま彼らが支えているのは、自分たちの知能を自ら所有し磨きたいと考える、AIネイティブの主要企業たちだ。”

出資元コンビクションのサラ・グオ（@saranormous）2026年6月の投稿より（日本語訳）

AI業界では長らく「訓練（Training）」が注目を集めてきた。何千台ものGPUを何週間も回して、巨大なモデルを作り上げる。この工程は華やかであり、技術的にも興味深い。しかし、ビジネスの現場で実際にコストが発生するのは「推論（Inference）」の方だ。

Training vs Inference。AIのコスト構造

Training

モデルを作る

一度の大規模投資。数週間〜数ヶ月のGPU使用。完了すればコストは停止する

Inference

モデルを使う

ユーザーのリクエストごとに発生。24時間365日。規模拡大に比例してコスト増大

調査会社の推計によると、AIワークロード全体のコンピュート消費のうち、推論が占める割合は約60〜70%に達するとされている。つまり、AIの「運用コスト」の大半は推論にかかっている。モデルが社会に普及すればするほど、推論の需要は指数関数的に増大する。

Basetenの共同創業者たちは、この課題を身をもって体験していた。CEO トゥヒン・スリヴァスタヴァはオーストラリア・シドニー育ち。南カリフォルニア大学（USC）で電気工学を学び、2012年ごろにクリエイター向け決済プラットフォームGumroadの初期メンバーとして参画した。CTO アミール・ハギガットはカリフォルニア大学アーバイン校（UC Irvine）でコンピューターサイエンスの修士号を取得し、PalmやYelpを経てGumroadのエンジニアリングヘッドを務めていた。Chief Scientist フィリップ・ハウズはシドニー大学で数学のPhDを持ち、コペンハーゲン大学でも研究した後、スリヴァスタヴァと共にGumroadでMLエンジニアとして働いていた。

3人を動かした原体験は、Gumroadでのクレジットカード不正検知プロジェクトにある。スリヴァスタヴァとハウズはラップトップ上でMLモデルを訓練し、精度の高い不正検知器を作り上げた。だが本番環境への展開が壁だった。Kubernetes（コンテナの管理ツール）やDockerの設定、スケーリング設計、レイテンシーの最適化。ML以外の作業に費やす時間が膨大で、「モデルを作る」のではなく「モデルを動かす」ことへの苦労が、起業のきっかけとなった。スリヴァスタヴァは「パイプライン全体のコストを下げ、反復サイクルを改善しなければならない」と感じたと語っている。その後、スリヴァスタヴァとハウズはHRデータ分析のShape社を共同創業し、2018年にReflektiveに売却。ハギガットはClover Health（保険テック企業）でエンジニアリングマネージャーを経験したのち、2019年に3人とパンカジ・グプタの4名でBasetenを立ち上げた。

Series Eで評価額50億ドル。急成長の軌跡

We’re excited to announce our $1.5B Series F.

Baseten exists to help companies own their intelligence and run AI products in production with speed, reliability, and control. As we enter this next chapter, three things are clear:

1. Customers like Abridge, Clay, Cursor, Decagon,… https://t.co/96xCJBjYAh pic.twitter.com/At1I40iDNc

— Baseten (@baseten) 2026年6月22日

“シリーズFで15億ドルの調達を発表する。Basetenは、企業が自らの知能を所有し、速さ・信頼性・制御を保ったままAIプロダクトを本番運用できるようにするために存在する。次の章に入るにあたり、はっきりしていることが3つある。まず、Abridge、Clay、Cursor、Decagonのような顧客が。”

Baseten公式（@baseten）2026年6月の投稿より（日本語訳）

Basetenの資金調達の歴史は、AI推論市場の成長をそのまま反映している。

5億8,500万ドル超（907億円）

累計調達額

50億ドル（7,750億円）

最新評価額（2026年1月）

2019年

創業年

1
2019年。創業トゥヒン・スリヴァスタヴァ（Tuhin Srivastava、CEO）、アミール・ハギガット（Amir Haghighat、CTO）、フィリップ・ハウズ（Philip Howes、Chief Scientist）、パンカジ・グプタによる4名での共同創業。MLモデルのデプロイ簡素化を目指す。
2
2022年。シード＋Series A（合計2,000万ドル）Greylock主導。推論特化のプラットフォームとしてピボットを完了。
3
2024年3月。Series B（4,000万ドル）IVPとSpark Capital主導。LLMブームに乗り、顧客数が急増。AI企業だけでなく一般企業からの需要も拡大。
4
2025年2月。Series C（7,500万ドル）IVPとSpark Capital共同主導。累計調達額が1億3,500万ドルに到達。
5
2025年9月。Series D（1億5,000万ドル、評価額21億5,000万ドル）BONDが主導し、CapitalG（Alphabetの成長投資部門）、IVP、Spark Capital、Greylockらが参加。推論インフラのカテゴリーリーダーとしての地位を確立。
6
2026年1月。Series E（3億ドル、評価額50億ドル）IVPとCapitalGが共同主導し、Nvidiaも参加。わずか4か月で評価額が倍以上に跳ね上がった。

注目すべきは出資者の顔ぶれだ。BONDはメアリー・ミーカー率いるトップティアVC。CapitalGはAlphabet（Googleの親会社）の成長投資部門。NvidiaはGPU覇者として推論インフラへの直接投資に踏み切った。「AI推論インフラ」というカテゴリーが、トップ投資家から本格的に認知されたことを意味する。

なぜ巨大テック企業と共存できるのか

「推論インフラならAWS、GCP、Azureがやるのでは？」。自然な疑問だ。実際、クラウド大手はGPUインスタンスを提供しており、推論ワークロードを処理する能力がある。それでもBasetenが選ばれる理由は何か。

答えは「抽象化のレベル」にある。AWSのGPUインスタンスは汎用的だ。開発者はGPUドライバの設定、モデルの最適化、オートスケーリングの設計、コールドスタート対策など、インフラ層の問題を自分で解決しなければならない。Basetenはこれらを全て自動化する。

クラウド大手 vs Baseten。抽象化レベルの違い

AWS / GCP / Azure

GPUインスタンスを提供。設定・最適化・スケーリングは開発者の責任。自由度は高いが運用負荷も高い。

Baseten

モデルをアップロードすれば推論APIが自動生成。GPU最適化、オートスケーリング、コールドスタート対策を自動処理。開発者は推論ロジックに集中可能。

これはStripeと銀行の関係に似ている。銀行が決済の根幹インフラを持っていても、開発者が使いたいのはStripeのAPIだ。Basetenは「AI推論のStripe」を目指していると言っていい。実際にBasetenはAWSやGCPの上に構築されており、競合ではなくレイヤーの違いだ。

さらに、Basetenが支持される背景にはオープンソースモデルの台頭がある。Meta Llama、Mistral、Stable Diffusionなど、自社でホスティングしたいオープンソースモデルが急増している。これらのモデルを効率的に推論するには、GPUの特性を熟知した専用インフラが不可欠であり、まさにBasetenの得意領域なのだ。

推論インフラの技術的な差別化

Model labs should spend their time pushing the frontier, not thinking about API keys, rate limits, metering, and billing.

Today, we're launching Baseten Frontier Gateway: the fastest path from trained weights to a production, white-labeled API. https://t.co/1tmF8Xq9OE https://t.co/2aAcrBkzQy

— Tuhin Srivastava (@tuhinone) 2026年5月6日

“モデルの研究所は、APIキーやレート制限、使用量計測や請求のことを考えるのではなく、最前線を押し広げることに時間を使うべきだ。本日Baseten Frontier Gatewayを立ち上げる。学習済みの重みから、自社ブランドで動く本番APIまで、最短で到達する道だ。”

共同創業者兼CEOトゥヒン・スリバスタバ（@tuhinone）2026年5月の投稿より（日本語訳）

Basetenのプラットフォームが評価される理由は、いくつかの技術的な差別化要素にある。

1
Truss。オープンソースのモデルパッケージングMLモデルをコンテナ化し、どこでもデプロイ可能にするOSSフレームワーク。ベンダーロックインを排除し、開発者の信頼を獲得。
2
自動GPU最適化モデルのサイズや特性に応じて、最適なGPUタイプとメモリ割り当てを自動選択。NVIDIA A100、H100、L40Sなどの使い分けを自動化。
3
コールドスタートの解消GPUインスタンスの起動には通常数十秒〜数分かかる。Basetenは事前ウォームアップ機構により、レイテンシーをミリ秒単位に抑える。
4
マルチモデル同居1つのGPU上で複数の小型モデルを同時に動かし、リソース利用率を最大化。コスト効率を大幅に向上。

これらの技術は一見地味だが、AI企業のインフラコストを30〜50%削減できる可能性がある。AIスタートアップにとってGPUコストは最大の出費項目であり、ここを圧縮できる意味は計り知れない。

日本のAIスタートアップへの示唆

Basetenの成功は、日本のスタートアップに重要な示唆を与える。

1
「つるはし」ポジションの発見AI領域でモデル開発の競争に参入するのは、資金力で劣る日本のスタートアップには厳しい。しかし、AIを使う全企業が必要とするインフラやツールの領域なら、十分に戦える。推論インフラ、データパイプライン、AIモニタリング。「つるはし」は至る所にある。
2
レイヤーの選択が競争力を決めるBasetenはクラウド大手と競合しない。その上のレイヤーで価値を提供する。日本市場でも、既存の巨人と同じ土俵で戦うのではなく、その上のレイヤーで専門特化する戦略が有効だ。
3
OSSコミュニティからの信頼獲得BasetenのTrussはオープンソースとして公開されており、これが開発者コミュニティからの信頼と認知を獲得する強力なフライホイールとなっている。日本のAIスタートアップも、OSSによるコミュニティ構築を戦略的に活用すべきだ。

AIゴールドラッシュは始まったばかりだ。金を掘り当てる企業がどこになるかは誰にもわからない。しかし、採掘者全員がつるはしを必要とするという事実は変わらない。Basetenが証明しているのは、「華やかなフロンティア」ではなく「確実に需要があるインフラ」を押さえた企業こそが、最も堅実に成長できるという古くて新しい真理だ。

日本からも、この「つるはし」戦略で世界に挑むスタートアップが生まれることを期待したい。AIの波は止まらない。そしてその波を支えるインフラの需要もまた、止まることはないのだから。

起業家への示唆

1
自分が痛みを感じた現場が最良の市場だBasetenはGumroadでのML本番展開の苦労から生まれた。MLエンジニアが感じた「動かすことへの苦痛」が、そのままプロダクトの設計思想になった。原体験のある課題は、他人には見えにくい市場の深さを与えてくれる。
2
チームの「共通体験」が事業の芯になるスリヴァスタヴァ、ハギガット、ハウズの3人はGumroadという同じ現場で同じ問題に直面し、そこから長年の信頼関係を築いた上でBasetenを共同創業した。創業チームの結束は、投資家の信頼だけでなく、困難な技術課題を解く原動力になる。
3
「派手なフロンティア」より「確実に通る道」を押さえるBasetenは訓練（Training）の競争が過熱する中で、あえて推論（Inference）という「脚光を浴びにくいインフラ層」に注力した。全員が必ず通る道を押さえることで、AIブームの勝敗に左右されない安定した需要を手に入れた。