Jubatus : オンライン機械学習向け分散処理フレームワーク

Jubatusは「分散したデータ」を「常に素早く」「深く分析」することを狙った分散基盤技術です。

Jubatusの名前の由来は、俊敏な動物であるチータの学術名からの命名で、「ユバタス」と読みます。株式会社Preferred NetworksとNTTソフトウェアイノベーションセンタが共同開発した、日本発のオープンソースプロダクトです。

最終的に全ての人にスケーラブルなオンライン機械学習フレームワークを提供することがJubatusの目標です。

Jubatus は以下の特徴を持ったオンライン機械学習向け分散処理フレームワークです。

  • オンライン機械学習ライブラリ: 多値分類、線形回帰、推薦(近傍探索)、グラフマイニング、異常検知、クラスタリング
  • 特徴ベクトル変換器 (fv_converter): データの前処理と特徴抽出
  • フォルトトレラントな分散機械学習のためのフレームワーク

Jubatus は Spark (JubaQL) や Python / scikit-learn (Jubakit) と連携して動作させることも可能です。

English documentation is also available.

Get Jubatus

Jubatus の最新バージョンは 1.1.1 (ChangeLog) です。Jubatus は LGPL v2.1 の下で配布されています。