過去に、不良データのコストなど、データ品質について多くのことを話してきました。しかし、データ品質の基本的な理解にもかかわらず、多くの人々はまだ「品質」が正確に何を意味するのかを完全には理解していません。
たとえば、その品質を測定する方法はありますか?もしそうなら、どのように測定しますか?この記事では、これらの質問などに答えることを目指しています。でもまず…
データ品質の神話を払拭する
決定を下す人
データ品質を確保するための基盤は、基本的な要件が作成されたときに始まります
データ品質に関する最大の神話の1つは、完全にエラーがない必要があるということです。ウェブサイトやその他のキャンペーンが大量のデータを収集しているため、エラーをゼロにすることはほぼ不可能です。代わりに、データは、設定されている標準に準拠する必要があるだけです。 「品質」とは何かを判断するには、まず3つのことを知る必要があります。
要件を作成するのは誰か
要件はどのように作成され、
これらの要件を満たすという点で、どの程度の緯度がありますか
多くの企業には、これらの要件を理解して設定するだけでなく、エラーの許容レベルを決定する人物である、単一の「データスチュワード」がいます。データスチュワードがいない場合、ITは、データの担当者がデータに影響を与える可能性のある欠点を確実に理解できるようにする役割を果たします。
ニール・パテルとの協議
私の代理店があなたのウェブサイトへの大量のトラフィックをどのように促進できるかをご覧ください
SEO-大量のSEOトラフィックのロックを解除します。実際の結果をご覧ください。
コンテンツマーケティング-私たちのチームは、共有され、リンクを取得し、トラフィックを引き付ける壮大なコンテンツを作成します。
有料メディア-明確なROIを備えた効果的な有料戦略。
電話を予約する
あなたはそれを良い、速い、または安いものにすることができます–2つ選んでください
マクドナルド-ジャンクフード
データの収集から会社のニーズに合うようにすることまで、すべてが潜在的なエラーにつながる可能性があります。 100%完全で100%正確なデータを取得することは、法外な費用がかかるだけでなく、時間がかかり、ROIの針をかろうじて動かすだけです。
非常に多くのデータが入ってくるので、意思決定を迅速に行う必要があります。そのため、データ品質は非常に微妙なバランスを取る行為であり、正確性と完全性を調整して判断します。やりがいのある注文のように思われる場合は、狂気への方法があることを知って喜ぶでしょう。最初のステップはデータプロファイリングです。
データプロファイリングとは何ですか?
データ品質
データプロファイリングでは、データベース内のすべての情報を調べて、それが正確または完全であるかどうか、およびそうでないエントリをどう処理するかを判断します。たとえば、会社が製造する製品のデータベースをインポートして、すべての情報が正確であることを確認するのはかなり簡単ですが、競合他社の製品に関する詳細やその他の関連する詳細をインポートする場合は別の話になります。
データプロファイリングでは、データの正確さも確認できます。 2016年7月1日にローンチした場合、システムはそれを1916または2016として記録しますか?取得した情報を調べて、重複やその他の問題を発見する可能性もあります。この方法でデータをプロファイリングすることで、出発点が得られます。使用している情報が可能な限り最高の品質であることを確認するための出発点です。
データ品質の決定
情報が完全で正確であるかどうかを判断するための出発点ができたので、次の質問は次のようになります。エラーや問題を見つけたらどうしますか。通常、次の4つのいずれかを実行できます。
エラーを受け入れる–許容可能な基準(つまり、メインストリートではなくメインストリート)に該当する場合は、エラーを受け入れて次のエントリに進むことができます。
エラーを拒否する–特にデータのインポートでは、情報がひどく破損しているか不正確であるため、修正を試みるよりも、エントリを完全に削除する方がよい場合があります。
エラーの修正–顧客名のスペルミスは、簡単に修正できる一般的なエラーです。名前にバリエーションがある場合は、その名前を「マスター」として設定し、すべてのデータベースでデータを統合して正しく保つことができます。
デフォルト値を作成する–値がわからない場合は、何もしないよりも、そこに何か(不明またはn / a)がある方がよい場合があります。
データの統合
異なるデータベース間で同じデータがある場合、エラーや重複が発生する可能性が高くなります。統合を成功させるための最初のステップは、データがどこにあるかを確認し、一貫性のある方法でそのデータを結合することです。ここでは、データベース間で情報を調整および同期するのに役立つ、実績のあるデータ品質および精度ツールに投資することは非常に価値があります。
データ品質チェックリスト
クリーンデータ
最後に、非常に多くの異なる領域にわたって非常に多くのデータを処理しているため、可能な限り最高品質のデータを使用していることを確認するためのチェックリストを用意しておくと役立ちます。 DAMA UKは、データ品質がどのように決定されるかについての全体像をよりよく理解するために使用できる「データディメンション」に関する優れたガイドを作成しました。
それらのデータ品質の側面は次のとおりです。
完全性–データのパーセンテージt
hatには1つ以上の値が含まれます。重要なデータ(顧客名、電話番号、メールアドレスなど)を最初に完了することが重要です。完全性は重要でないデータにそれほど影響を与えないためです。
一意性–他のデータセットに対して測定した場合、その種類のエントリは1つだけです。
適時性–日付と時刻はデータにどの程度の影響を与えますか?これは、以前の販売、製品の発売、または正確であるために一定期間にわたって信頼されている情報である可能性があります。
妥当性–データはそれに設定されたそれぞれの基準に準拠していますか?
正確性–データは、実際の人物またはそれによって識別されるものをどの程度反映していますか?
一貫性–データは先入観のあるパターンとどの程度一致していますか?米国では標準がMM/DD / YYYYであるのに対し、ヨーロッパやその他の地域ではDD / MM / YYYYの使用が標準であるため、生年月日には共通の一貫性の問題があります。
データ品質の全体像
ご覧のとおり、あらゆるビジネスのあらゆる種類のデータの正確性と完全性を維持するための「万能」アプローチはありません。また、ビッグデータの情報に対する欲求は日々高まっており、データ品質の問題に正面から取り組むことがこれまで以上に重要になっています。圧倒されるように思えるかもしれませんが、データクレンジングツールを利用して、コンピューターが最も得意とすること、つまり数値を処理できるようにすることは価値があります。
あなたが取ることができる最も重要なステップは、単に始めることです。より多くの見込み客が参加し、新しい市場が発見されるにつれて、データは常に増加するため、データ品質の問題に取り組むための「ベストタイム」は決してありません。今すぐ時間をかけて、企業や組織にとってデータ品質が何を意味するのかを理解することで、顧客サービスの向上、顧客体験の向上、コンバージョン率の向上、顧客維持の長期化などの波及効果を生み出すことができます。これらは一種の投資収益率です。どんなビジネスでも心から受け入れること!
著者について:Sherice Jacobは、説得力のあるコピーライティング、ユーザーフレンドリーなデザイン、スマートな分析分析を通じて、ビジネスオーナーがウェブサイトのデザインを改善し、コンバージョン率を高めるのを支援します。 iElectrify.comで詳細を確認し、無料のWebコピーの調整と変換のチェックリストを今すぐダウンロードしてください。