いつもITユニプラをご愛読いただきありがとうございます。
第八回「データのライフサイクル管理」について記事を投稿していきたいと思います。
データカタログのルール作りや各プロセスを設計した後は、その各フェーズをどのように管理していくかを決めます。
目次
- データカタログとは?
- 前回の内容⑦「データのバックアップと復旧」
- データカタログ作成10ヵ条其の⑧データのライフサイクル管理
データカタログとは?
データカタログは、企業や組織で生成されたデータやメタデータ※を収集し、企業が保有するデータの一覧や詳細を簡単に確認できるようにするシステムです。これにより、必要なデータを素早く見つけ出し、ビジネス戦略や経営の意思決定などに活用することができます。
※メタデータ・・・データを説明するためのデータ。
例:売上金額といったデータがあった場合、その売上月や地域(どのエリアの売り上げか?)、
商品のことを言います
以下の記事でデータカタログの主な機能についてまとめています。
【データ活用】データカタログのポイント
前回の内容⑦「データのバックアップと復旧」
今回の内容にも関わるデータの取得と生成については前回記事にてまとめてます。以下もご確認ください。
データのバックアップと復旧
データカタログ作成の10箇条其の⑧データのライフサイクル管理
データカタログにおけるデータのライフサイクル管理は、データの収集から削除までの全体的な流れを指します。
これにはデータの収集、保存、利用、保管、削除などがあります。
以下に、データカタログにおけるデータのライフサイクル管理に関連する主要な概念と方法をいくつか紹介します。
データの収集
データの収集では、外部のソースからデータをどのように取得しているのか保存するのかを管理します。
以下のようなポイントで管理します。
- データの作成元や作成方法に関する情報の管理
- データの品質や正確性に関する情報の管理
データのクレンジングと変換
収集されたデータは、不正確で不完全な場合があります。
データカタログは、これらのデータをクレンジングし、必要に応じて変換する機能を提供します。
以下のようなポイントを把握することでどのような情報となっていれば良いか管理します。
データの保存と管理
データは適切な形式で保存され、適切なセキュリティ対策が施されなければなりません。
データがどこに格納されているか、アクセス権はどうなっているのかを管理します。
- データの格納先や格納形式に関する情報の管理
- データのアクセス権限やセキュリティポリシーに関する情報の管理
データの利用と分析
データが利用され、分析される段階では、利用目的に合わせデータにアクセスし、傾向(トレンド)や異常値等を得ることができます。
利用可能なデータセットやメタデータに関する情報、利用先を管理します。
- データの利用目的や利用方法に関する情報の管理
- データの利用状況に関する情報の管理
- データの共有先に関する情報の管理
- データの共有方法に関する情報の管理
データの保管
古いデータやアーカイブ化が必要なデータは、適宜対処できるようにしておきます。
これにより、データのアクセスが簡素化され、リソースの最適な利用が可能です。
- データの保管期間・保管先に関する情報の管理
- データの長期保管に必要な条件に関する情報の管理
データの削除と廃棄
データが不要になった場合、データを安全かつ適切に削除する必要があります。
データカタログは、データの削除ポリシーや手順に関する情報を管理します。
- データの破棄方法に関する情報の管理
- データの破棄の記録に関する情報の管理
実データだけでなくメタデータも管理方法に合わせることがポイントです。
データのライフサイクルを適切に管理することで、以下のようなメリットがあります。
- 状況把握がしやすくなる
- 品質が安定する
- セキュリティが向上
- データの活用促進
次回は、データセキュリティ について記載します。