Jubatus : オンライン機械学習向け分散処理フレームワーク¶
Jubatusは「分散したデータ」を「常に素早く」「深く分析」することを狙った分散基盤技術です。
Jubatusの名前の由来は、俊敏な動物であるチータの学術名からの命名で、「ユバタス」と読みます。株式会社Preferred NetworksとNTTソフトウェアイノベーションセンタが共同開発した、日本発のオープンソースプロダクトです。
最終的に全ての人にスケーラブルなオンライン機械学習フレームワークを提供することがJubatusの目標です。
Jubatus は以下の特徴を持ったオンライン機械学習向け分散処理フレームワークです。
- オンライン機械学習ライブラリ: 多値分類、線形回帰、推薦(近傍探索)、グラフマイニング、異常検知、クラスタリング
- 特徴ベクトル変換器 (fv_converter): データの前処理と特徴抽出
- フォルトトレラントな分散機械学習のためのフレームワーク
Jubatus は Spark (JubaQL) や Python / scikit-learn (Jubakit) と連携して動作させることも可能です。
English documentation is also available.