今では、データが非常に価値があることを誰もが知っています。大企業はデータを使用して、ビジネスを前進させ、より高いレベルの収益性を達成するための意思決定を行います。データベース管理者として、私たちはデータ、特に個人情報(PII)を保護します。システムはデータを取得するためにハッキングされます。データには多くの価値があり、今日これを学ぶには、ことわざの岩の下に住んでいる必要があります。
私がめったに読んでいないこと、そしてこのブログ投稿の主題は、データの価値が時間とともにどのように変化するかです。データの価値は、保持ポリシーを推進するために使用する必要があります。
ほとんどのデータは、古くなるほどその価値を失います。私は最近、アプリケーションのパフォーマンスと、そのパフォーマンスを測定するためにキャプチャするメトリックに関するプロジェクトに取り組んでいました。プロジェクトの一部の人々は、これらのメトリックを5年以上維持したいと考えていました。私は声を上げて、5年前のパフォーマンスメトリクスの値がゼロであることをグループに知らせました。私たちのアプリケーションは、何年にもわたって大きく変化しています。現在のアプリケーションのパフォーマンスを5年前のアプリケーションのパフォーマンスと比較することはできません。リンゴ同士の比較ではありません。
すべてのデータ値が同じ割合で減少するわけではありません。前の段落で示した例では、アプリケーションのパフォーマンスのメトリックデータは5年間でゼロの価値があります。しかし、顧客が5年前におむつを購入したことを示すデータを持っている小売業者は、顧客が今日5〜6歳の子供用の衣類を購入する可能性が高いことを知っています。その子供は小学校に通っている可能性が高く、学用品が必要な場合があります。この場合、5年前のその顧客の購入のデータには、まだある程度の価値があります。データは無価値ではありません。そうは言っても、5年前のすべてのデータポイントは必要ありません。現在および将来の購入について有意義な結論を出すには、その顧客の活動の要約のみが必要です。
多くの場合、人々はデータベースシステムをゴミ捨て場として扱っています。データはそこにダンプされるだけであり、長期的にそのデータをどう処理するかについて多くのことを考える人はほとんどいません。そのデータが長期的にどれだけの価値があるかについて多くのことを考える人はほとんどいません。そのデータの保存にはコストがかかります。データが古くなったためにほとんどまたはゼロの値である場合、そのデータをデータベースに保持するコストに見合う価値がありますか?
古いデータに採用する緩和戦略があります。データベース管理者は、古くて価値の低いデータをより安価なストレージ階層に移動する場合があります。データの値がゼロの場合、データは破棄する必要があります。多くの場合、要約で十分な場合は、その古いデータの完全な詳細は必要ありません。その場合、データを集約して結果を保存します。次に、詳細を取り除きます。
データベース管理者は、データとそれをホストするために必要なリソースの管理者になる責任があります。データが古くなるにつれて、そのデータを管理するために必要な適切な手順を常に尋ねる必要があります。