いつもITユニプラをご愛読いただきありがとうございます。
第八回「データのライフサイクル管理」について記事を投稿していきたいと思います。
データカタログのルール作りや各プロセスを設計した後は、その各フェーズをどのように管理していくかを決めます。
データカタログは、企業や組織で生成されたデータやメタデータ※を収集し、企業が保有するデータの一覧や詳細を簡単に確認できるようにするシステムです。これにより、必要なデータを素早く見つけ出し、ビジネス戦略や経営の意思決定などに活用することができます。
※メタデータ・・・データを説明するためのデータ。
例:売上金額といったデータがあった場合、その売上月や地域(どのエリアの売り上げか?)、
商品のことを言います
以下の記事でデータカタログの主な機能についてまとめています。
今回の内容にも関わるデータの取得と生成については前回記事にてまとめてます。以下もご確認ください。
データカタログにおけるデータのライフサイクル管理は、データの収集から削除までの全体的な流れを指します。
これにはデータの収集、保存、利用、保管、削除などがあります。
以下に、データカタログにおけるデータのライフサイクル管理に関連する主要な概念と方法をいくつか紹介します。
データの収集では、外部のソースからデータをどのように取得しているのか保存するのかを管理します。
以下のようなポイントで管理します。
収集されたデータは、不正確で不完全な場合があります。
データカタログは、これらのデータをクレンジングし、必要に応じて変換する機能を提供します。
以下のようなポイントを把握することでどのような情報となっていれば良いか管理します。
データは適切な形式で保存され、適切なセキュリティ対策が施されなければなりません。
データがどこに格納されているか、アクセス権はどうなっているのかを管理します。
データが利用され、分析される段階では、利用目的に合わせデータにアクセスし、傾向(トレンド)や異常値等を得ることができます。
利用可能なデータセットやメタデータに関する情報、利用先を管理します。
古いデータやアーカイブ化が必要なデータは、適宜対処できるようにしておきます。
これにより、データのアクセスが簡素化され、リソースの最適な利用が可能です。
データが不要になった場合、データを安全かつ適切に削除する必要があります。
データカタログは、データの削除ポリシーや手順に関する情報を管理します。
実データだけでなくメタデータも管理方法に合わせることがポイントです。
データのライフサイクルを適切に管理することで、以下のようなメリットがあります。
次回は、データセキュリティ について記載します。