DX・AI のためのインフラストラクチャー
dataiku DSS
現在、世界のいたるところでデジタル技術を駆使した新規参入企業が短期間のうちに急成長しています。
これに危機感を持った経済産業省は、2018年9月 『DX レポート ~IT システム「2025年の壁」の克服と DX の本格的な展開~』を公表し、以下の問題提起を行いました。
- デジタルトランスフォーメーションをスピーディーに進めていくこと
- AI技術を駆使してデータを活用し新たな価値創造を行うこと
2年後の 2020年12月 に中間報告が公表しましたが、その中で ほとんどの経営者は DX の必要性を認識しているが、9割以上の企業が全く取り組めていないか散発的な実施に留まっていると問題視しています。
DX が進まない原因として次のことが挙げられています。
- ビジネスをどのように変革するかその具体的な方向性が定まっていない
- 既存システムがそれぞれ個別に開発されてきたため複雑化しデータが活用できない
- 事業部門と情報システム部門とのコミュニケーションが十分に取れていない
- システム開発をベンダーに丸投げしてきたため社内に人材がいない、または育っていない
- 一方、ベンダーでは、納品したシステムのメンテに人が取られ、新しい技術の習得が困難
dataiku は、こういった問題の解決を支援します。
- dataiku DSS(Data Science Studio)は、業務システムごとに散在するデータをプロジェクトという目的に沿ってデータを集約し、処理フローをグラフィカルに表示します。
- レシピという標準化された処理機能オブジェクトが用意されており、データと処理が完全に分離されてフロに表示されるため、フロー全体および細部にわたって処理内容が理解しやすく、また、頻繁に発生する変更に対してもロバストな仕組みを提供します。
- dataiku DSS は、経営者・管理者、データ管理者、データサイエンティスト、ビジネス担当者などの関係者全員に対して情報共有の基盤を提供します。
dataikuDSS は関係する人全てがコラボレートできる環境を提供します
- dataikuDSSは、CIO、データ管理者、データサイエンティスト、ビジネス担当者など関係者全員が情報を共有し、作業ができるインフラストラクチャーを提供します。
複雑な処理プロセスに対する高い理解性
- データ加工処理をレシピという機能オブジェクトを使うことにより、加工処理の標準化・統一化を実現します。
- レシピは、データの所在(CSVファイル、DBテーブル、クラウド)の違いを吸収してくれるため、ユーザはデータの所在を意識することなく同一の設定で処理が可能です。
- データと処理が完全に分離されているため、変更に対してロバストな仕組みを提供します。
専門的知識がなくても機械学習(ML)が可能
- 内蔵している ML モデルを半自動的に選択し複数のモデルを同時に実行してくれるため、ユーザは数回クリックするだけで実行が可能。
- より一度な機械学習をする場合、必要な設定項目はグラフィカルに表示されるため、設定漏れをすることなく実行可能
- dataiku DSS は、機械学習の結果評価について、必要な評価指標のほとんどをカバーしており、グラフィカルに表示します。
頻繁に発生する変更への半自動対応
- データ分析においては、処理内容の変更やそれに伴うデータスキーマの変更が頻繁に発生します。
- dataiku DSS は、データスキーマの変更について、その整合性を自動的にチェックし、補正を試みます。自動補正ができない場合、アラートを上げてユーザの介入を促します。
豊富な表示機能・レポート機能
- データを見ながらクイックリーにその状態を確認できるチャート機能
- 分析したい内容ごとに関係するグラフをひとまとめにしたカード機能とカードをまとめたワークシート機能によるデータ探索
- データを集約して表示するダッシュボード機能、レポート機能 •これらグラフィカルな情報がデータに関係する全員で共有が可能
各自の作業進捗やディスカッションの共有
- dataiku DSS は、関係者間でデータを共有する環境を提供するだけではありません。
- 各自の作業状況の確認や作業予定の確認、問題の共有、ディスカッションといったコミュニケーションの面でも情報を共有する環境を提供します。