📖 読了まで置10分
AI Latest News - vol.29

Fortune 500のAI分析基盤 – Databricksが選ばれる理由

AU
ABOUTUS編集部
AI Latest News
AI Latest News

02レイクハウスという発明

Databricksの最大のイノベーションは「レイクハウス(Lakehouse)」アーキテクチャだ。これはデータレイク(安価で柔軟な大容量ストレージ)とデータウェアハウス(高速なクエリ処理)の長所を組み合わせた新しいデータ基盤である。

従来、企業は生データをデータレイクに保存し、分析用にデータウェアハウスにコピーし、さらにAI/MLの学習用に別の環境に移すという、複雑で非効率なパイプラインを構築していた。レイクハウスは、一つのストレージ上でSQL分析もAI学習もリアルタイム処理も可能にする。

03AI時代の分析基盤

生成AIの台頭により、Databricksの重要性はさらに増している。企業がLLMを自社データで活用するには、データの統合、前処理、セキュリティ管理が不可欠だ。Databricksはこれらすべてを一つのプラットフォームで提供する。

  • 1
    Mosaic AI — 生成AI開発基盤2023年に$13億で買収したMosaicMLの技術を統合。自社データでのLLMファインチューニング、RAG(検索拡張生成)構築が容易に。
  • 2
    Unity Catalog — データガバナンス全データ資産のアクセス制御、監査、リネージ管理を一元化。AI時代のデータセキュリティの中核。
  • 3
    Delta Lake — オープンストレージACID トランザクション対応のオープンソースストレージ。Sparkエコシステムと完全互換。ベンダーロックインなし。
  • 4
    Databricks SQL — BI連携SQLアナリストがレイクハウス上で直接分析。Tableau、Power BIとの統合も標準対応。

04$620億の評価と成長戦略

2024年12月、Databricksは$100億の資金調達を実施し、評価額は$620億に達した。これはSnowflakeやPalantirを上回り、未上場のデータ/AI企業として世界最大級の評価だ。IPOへの期待も高まっている。

成長の原動力は、既存顧客の利用拡大(ネットドルリテンションレート150%超)と、AI需要の爆発的増加だ。企業が生成AIを導入するには、まずデータ基盤を整備する必要がある。「AIを始めるなら、まずDatabricks」という認識が広がりつつある。

同社のオープンソース戦略も特筆に値する。Apache Spark、Delta Lake、MLflow — Databricksが開発したオープンソースプロジェクトは、データ分析のデファクトスタンダードとなっている。オープンソースでエコシステムを広げ、商用版で収益化するこのモデルは、Red HatやElasticと同様のアプローチだ。

05日本企業への示唆

日本企業のデータ活用は、欧米に比べて遅れているとされる。データのサイロ化(部門ごとにバラバラなシステム)、レガシーシステムへの依存、データエンジニア人材の不足 — これらは多くの日本企業に共通する課題だ。

Databricksは2020年に日本法人を設立し、NTTデータ、トヨタ、リクルートなど大手企業での導入が進んでいる。「まずデータ基盤を統合し、その上でAIを活用する」というアプローチは、日本企業のDX推進においても有効だ。

AIの時代、データは新たな石油と呼ばれる。しかし、石油も精製しなければ使えない。データの精製装置としてのDatabricksの価値は、生成AIの普及とともにさらに高まるだろう。Fortune 500がDatabricksを選ぶ理由は明確だ — AIの未来は、データ基盤の上に築かれる。

参考文献・情報源

※ 本記事は公開情報に基づいて作成されています。数値や事実関係は取材時点のものであり、最新の情報と異なる場合があります。

あわせて読みたい

AIの基盤は、
データの統合にある。

Databricksが選ばれる理由はシンプルだ。すべてのAI戦略は、データ戦略から始まる。

← 前の記事
AIが数学オリンピックで金メダル – 新たな数学的発見にも成功
次の記事 →
Microsoft Copilot、365全面統合 – メール・Excel・TeamsにAI搭載
すべての記事を見る →
TOP