いつもITユニプラをご愛読いただきありがとうございます。
データを溜める目的で「データ~」という言葉が色々あります。
今回は、その中でも個人的によく耳にする言葉について整理していきたいと思います。
目次
- データ活用をするプラットフォームの違い
- データ活用のプラットフォームの使分けについて
- 最後に
データ活用をするプラットフォームの違い
システムやアプリ、サービスからデータを収集し管理するプラットフォームの中でもよく耳にしている「データプール」「データレイク」「データウェアハウス」についてみていきます。
- データプール
データプールは色々なデータソースから構造化データを集めるプラットフォームです。
データの収集と分析を目的に使われる考え方です。
特徴
- 様々なデータソースから決めた形式でデータを収集
- データベース化して保存
- 保存したデータの分析可能
-
プールは、池とか水泳をするプールのようなイメージの規模のデータを保存する役割になります。
- データレイク
データレイクは、データの種類問わずデータを集めることができる、主にビッグデータを利用する際に用いられるプラットフォームです。
特徴
- データをファイルとして集める
- 画像や音声等の非構造化データも保存可能
- タグ(メタデータ)とデータを一緒に管理し、多角的な分析が可能
保存する領域は、池よりも大きい湖のようなイメージの役割になります。
- データウェアハウス
定期的にデータを取得し、時系列に集めていくプラットフォームです。
特徴
- 業務を横断してデータ活用可能
- データに一貫性と関連性を持たせた構造化データの保存が可能
- データ活用の目的別に整理・格納します。
データを保存する倉庫の役割になります。
- データレイク
データレイクは、データの種類問わずデータを集めることができる、主にビッグデータを利用する際に用いられるプラットフォームです。
特徴
- データをファイルとして集める
- 画像や音声等の非構造化データも保存可能
- タグ(メタデータ)とデータを一緒に管理し、多角的な分析が可能
- データウェアハウス
定期的にデータを取得し、時系列に集めていくプラットフォームです。
特徴
- 業務を横断してデータ活用可能
- データに一貫性と関連性を持たせた構造化データの保存が可能
- データ活用の目的別に整理・格納します。
データを保存する倉庫の役割になります。
データ活用のプラットフォームの使分けについて
データがどのような形式取得可能か?どのような目的で使いたいかに活用するプラットフォームを使い分けすることで管理や分析など活用を円滑にしたりリソースの有効活用をすることが可能です。
- データプール
データベース化が可能な生のデータを一元的に保存し、柔軟に活用したい場合に適しています。
- データレイク
ビッグデータの分析や未加工データの活用が必要な場合に適しています。
- データウェアハウス
整形されたデータを分析するために利用します。
昨今は、データプール、データレイク、データウェアハウスに保存されたデータを組み合わせて活用することも増えています。
最後に
最近では、ビッグデータという言葉が出てきているように大量のデータであっても活用できるテクノロジーが増えてきています。
それに伴いクラウドでのデータ活用のサービスやリソースの活用も進んでおります。
ユニリタプラスでは、クラウドベースのデータ活用ソリューション「データクラウドプラットフォーム」を提供しております。
「データクラウドプラットフォーム」は、システムやサービス、アプリ、データベースなど様々なデータソースからの収集が可能なインターフェースを備えており、各データでの、日付などの持ち方が異なるデータ差異の吸収や、データを掛け合わせて活用のためのデータを新たに生成すること可能です。これによりデータ毎の特性を吸収し、リソースを節約し目的にフォーカスしたデータ活用が可能となっております。
また、データを管理する中でデータ量や処理量が増えてリソースに負荷が掛かっているデータウェアハウスの改善やデータ活用の幅を広げたいといったニーズにもお応えさせていただいております。
データ活用でお困りの事がございましたこちらまでお気軽にお問合せください。