いつもITユニプラをご愛読いただきありがとうございます。
第四回「データの変更と更新」について記事を投稿していきたいと思います。
データの変更や更新はデータカタログを作成後運用していくうえで重要な点と考えています。データが常に活用できるようにしておけるよう、また変更後はなぜ変更したのかを振り返れるようにします。また、その活用できる状態にするには鮮度も大切です。更新のタイミングについても確認していきます。
目次
目次
- データカタログとは?
- 前回の内容③データの保存場所と管理
- データカタログ作成10ヵ条其の④データの変更と更新
データカタログとは?
データカタログは、企業や組織で生成されたデータやメタデータ※を収集し、企業が保有するデータの一覧や詳細を簡単に確認できるようにするシステムです。これにより、必要なデータを素早く見つけ出し、ビジネス戦略や経営の意思決定などに活用することができます。
※メタデータ・・・データを説明するためのデータ。
例:売上金額といったデータがあった場合、その売上月や地域(どのエリアの売り上げか?)、
商品のことを言います
以下の記事でデータカタログの主な機能についてまとめています。
【データ活用】データカタログのポイント
前回の内容②データの取得と生成
今回の内容にも関わるデータの取得と生成については前回記事にてまとめてます。以下もご確認ください。
③データの保存場所と管理
データカタログ作成10ヵ条其の④データの変更と更新
前回は、そのデータをどこに保存するのか?どのように管理するのかについ確認しました。
今回は、データカタログにおけるデータの変更と更新に関するポイントをみていきます。
変更の記録
データが変更された場合、変更内容や変更を行った日時、実行したユーザーなどの情報をメタデータに記録します。変更の理由や状況、変更前後の関係も含め、できるだけ詳細に記録します。
バージョニング
データがバージョン管理されている場合、新しいバージョンが作成されたことを記録します。バージョン番号やバージョニングに関する情報をメタデータに含め、変更の履歴を追跡できるようにします。
更新の頻度とタイミング
データがどのくらいの頻度で更新されるのか、更新がリアルタイムかバッチ処理かなど、更新の頻度とタイミングに関する情報をカタログに含めます。
データ利用者がデータの鮮度を把握するために必要です。
変更の承認プロセス
データの変更には、適切な承認プロセスを設けるがあります。変更を行う前にどのような承認が必要か、変更を承認したユーザーや機関などを記録します。
トランザクション管理
データベースなどのトランザクションを使用している場合、トランザクションが成功したか失敗したか、トランザクションのロールバックやコミットの情報をメタデータに記録します。
※トランザクション:データベースの処理をまとめたもの
データの完全性維持
データが変更された場合に、データの完全性が損なわれないように注意が必要です。変更が行われる際に、制約条件やデータの更新ルールが適切に適用され、データの品質が保たれるようにします。
例えば、データは文字列なのか?数字なのか?またその際の更新条件を明確にすることが必要です。
非破壊的変更
データの保存する構造(スキーマ)が変更される場合、すでにあるデータを維持したまま、変更できるようにすることに注意します。
既存のプロセスやデータの取得方法が影響を受けずに、データの取得や分析をスムーズに行えるようにします。
変更通知
データが変更された場合に、関係者や利用者に変更通知を送信する機能を検討します。
通知機能があることで、データ変更を迅速に周知し、分析・活用を促進します。
これらのポイントを考慮して、データカタログを構築することで、データの変更と更新に関する透明性やデータがどこにあってどのような過程で取得したものか(トレーサビリティ)を確保できます。
※トレーサビリティ:追跡しやすくする機能性
次回は、 データの利用とアクセスについて記載したいと思います。