📖 読了まで置10分
AI Latest News - vol.29

Fortune 500のAI分析基盤。Databricksが選ばれる理由

AU
ABOUTUS編集部
AI Latest News
AI Latest News

Databricksとは

Databricksは、Apache Sparkの生みの親であるAli Ghodsi率いるデータ&AI分析プラットフォーム企業だ。2013年にUCバークレーの研究者グループによって創業され、Fortune 500企業の60%以上が同社のプラットフォームを採用している。

公開情報によると、同社が提供するのは、データの保存、分析、機械学習、AIモデルの構築までを一つのプラットフォームで行える統合環境だ。従来はデータウェアハウス、データレイク、MLプラットフォーム — と別々のツールが必要だったが、Databricksはこれらを「レイクハウス」という統合アーキテクチャで一つにまとめた。

$620億
評価額(2024年)
10,000+
顧客企業数
$24億+
年間売上(ARR)

レイクハウスという発明

Databricksの最大のイノベーションは「レイクハウス(Lakehouse)」アーキテクチャだ。これはデータレイク(安価で柔軟な大容量ストレージ)とデータウェアハウス(高速なクエリ処理)の長所を組み合わせた新しいデータ基盤である。

従来、企業は生データをデータレイクに保存し、分析用にデータウェアハウスにコピーし、さらにAI/MLの学習用に別の環境に移すという、複雑で非効率なパイプラインを構築していた。レイクハウスは、一つのストレージ上でSQL分析もAI学習もリアルタイム処理も可能にする。

AI時代の分析基盤

生成AIの台頭により、Databricksの重要性はさらに増している。企業がLLMを自社データで活用するには、データの統合、前処理、セキュリティ管理が不可欠だ。Databricksはこれらすべてを一つのプラットフォームで提供する。

  • 1
    Mosaic AI — 生成AI開発基盤2023年に$13億で買収したMosaicMLの技術を統合。自社データでのLLMファインチューニング、RAG(検索拡張生成)構築が容易に。
  • 2
    Unity Catalog — データガバナンス全データ資産のアクセス制御、監査、リネージ管理を一元化。AI時代のデータセキュリティの中核。
  • 3
    Delta Lake — オープンストレージACID トランザクション対応のオープンソースストレージ。Sparkエコシステムと完全互換。ベンダーロックインなし。
  • 4
    Databricks SQL — BI連携SQLアナリストがレイクハウス上で直接分析。Tableau、Power BIとの統合も標準対応。

$620億の評価と成長戦略

2024年12月、Databricksは$100億の資金調達を実施し、評価額は$620億に達した。これはSnowflakeやPalantirを上回り、未上場のデータ/AI企業として世界最大級の評価だ。IPOへの期待も高まっている。

成長の原動力は、既存顧客の利用拡大(ネットドルリテンションレート150%超)と、AI需要の爆発的増加だ。企業が生成AIを導入するには、まずデータ基盤を整備する必要がある。「AIを始めるなら、まずDatabricks」という認識が広がりつつある。

同社のオープンソース戦略も特筆に値する。Apache Spark、Delta Lake、MLflow — Databricksが開発したオープンソースプロジェクトは、データ分析のデファクトスタンダードとなっている。オープンソースでエコシステムを広げ、商用版で収益化するこのモデルは、Red HatやElasticと同様のアプローチだ。

日本企業への示唆

日本企業のデータ活用は、欧米に比べて遅れているとされる。データのサイロ化(部門ごとにバラバラなシステム)、レガシーシステムへの依存、データエンジニア人材の不足 — これらは多くの日本企業に共通する課題だ。

Databricksは2020年に日本法人を設立し、NTTデータ、トヨタ、リクルートなど大手企業での導入が進んでいる。「まずデータ基盤を統合し、その上でAIを活用する」というアプローチは、日本企業のDX推進においても有効だ。

AIの時代、データは新たな石油と呼ばれる。しかし、石油も精製しなければ使えない。データの精製装置としてのDatabricksの価値は、生成AIの普及とともにさらに高まるだろう。Fortune 500がDatabricksを選ぶ理由は明確だ — AIの未来は、データ基盤の上に築かれる。

あわせて読みたい

AIの基盤は、
データの統合にある。

Databricksが選ばれる理由はシンプルだ。すべてのAI戦略は、データ戦略から始まる。

← 前の記事
AIが数学オリンピックで金メダル。新たな数学的発見にも成功
次の記事 →
Microsoft Copilot、365全面統合。メール・Excel・TeamsにAI搭載
すべての記事を見る →
TOP