いつもITユニプラをご愛読いただきありがとうございます。
今回は、データレイクを中心とした分析環境構築時の注意点や考え方についてです。
データ活用の現実
総務省の令和2年版情報通信白書を見ると、情報がすこし古いが、データを3年から5年先データの活用をしていきたいと考えている企業が3割程度となっており、データの質(多様性、粒度、頻度等)を向上させたいや分析技術を向上させたいといった回答が多くなっている。
データを活用し、経営などの判断に役立てられている企業は4割程度なのが現状でした。
活用していきたくても壁となる課題についてみていきます。
【参考】https://www.soumu.go.jp/johotsusintokei/whitepaper/ja/r02/html/nd132110.html
データ活用において企業が抱えている課題
- さまざまなデータへの接続
- 誰でも簡単に分析
- 個人利用から大規模までスケールしたい
- リアルタイムデータの利用
- コストの最適化
- セキュリティ・データ管理の一元化
などがあります。
上記のような課題を解決するには、データ活用の下地を作っていくことが必要です。
分析基盤やツールを整備するだけでなく利用すユーザや組織も成長していくことが求められます。
その最初のアプローチがデータの蓄積、いわゆるデータレイクを構築することです。
データの蓄積と分析
データを利用する上で、データの蓄積と分析は分けて考えることで、活用を促進することができると考えます。
データの蓄積のポイント
- 活用したい関連するデータは一箇所に
- 「正」のデータを明確に
- 要件に合わせてデータソースが異なるデータも統一
使いたいデータは、形式を統一し正しいデータを明確に一箇所に集めることで、分析ツールでの利用が円滑になり、またツールが変更になったし時にも容易に切り替えが可能です。
データの疎結合が鍵
データレイクに蓄積したデータの利用は疎結合にすることで、さまざまなシーンで活用に役立てることができます。
その有効な結合手段としてAPI利用があります。
各ツールで用意されているAPIを使用、またウェブアプリ等で独自のAPIを作成し、データレイクにアクセスすることで、利用用途が異なった灰にも蓄積しているデータやその先のデータ元のシステムには影響を与えません。
データを取得したいシステムが増えた場合には、分析側に与える影響も最小限に止めることが可能です。
APIの利用・管理を促進させるiPaaS
iPaaSは、複数のツールで異なるAPIなどのインターフェースの違いを吸収し、今回の場合だとデータレイクのデータアクセスを一元的に管理することができます。
ユニリタグループでは、binditというITスキル不要にデータレイクと分析ツール間のデータのやりとりを自動化するiPaaSツールを提供しております。
データレイクの構築や活用でお困りのことがございましたら
お気軽にお問い合わせください。