マーケティング専門家集団×開発力【ジャイロン】

名寄せとデータクレンジングのコスト削減と効率化の方法

2023/08/16
向井 重文
  • EFO
名寄せとデータクレンジングのコスト削減と効率化の方法

ビジネスの成功は、効率的に顧客データを収集し、それを有効に活用する能力にかかっています。

さらにビジネスの現場では、マーケティングオートメーションツール(MA)、営業支援ツール(SFA)、顧客関係管理ツール(CRM)など、多岐にわたる顧客管理プラットフォームの活用が増えています。特にマーケティングの領域では、正確な顧客データ分析が不可欠です。

しかし、データの質が低ければ、高度な分析ツールを使用しても得られる結果の信頼性も低くなります。
データの「質」とは、重複や不正確な情報、古い情報などが存在せず、常に最新で正確な情報になっているかどうかを指します。

この、データの質を向上させ、その価値を最大化するためのキーとなる作業が「名寄せ」と「データクレンジング」です。

しかし、この「名寄せ」と「データクレンジング」には、保有しているデータが多ければ多いほど大変な手間とコストがかかるため、あらかじめ最小限の「名寄せ」と「データクレンジング」作業で済むようなデータ収集の仕組みを構築することが重要です。

その方法の一つに、EFOを活用した法人番号の導入があります。
特にB2B事業など、法人を営業対象としている場合に最も効果的です。

本稿では、マーケティングの効率化や分析の精度向上のためのデータ品質管理、そして「名寄せ」と「データクレンジング」の基本について解説します。
さらに、EFOを利用した法人番号の活用により、データ管理のコストを削減する方法についても詳しく説明します。

データクレンジングと名寄せの違い

「データクレンジング」と「名寄せ」は、しばしば混同されることがありますが、それぞれ異なる作業です。

「データクレンジング」はデータの不備を修正する作業を指し、「名寄せ」は重複データを統合する作業を指します。
以下で、それぞれの定義と具体例を詳しく解説します。

データクレンジングとは?

データクレンジング(Data Cleansing)は、文字通りデータを「綺麗にする」作業です。
具体的には、データベース内の誤った情報や重複した情報、不完全な情報などを特定し、それを修正、置換、または削除するプロセスを指します。

データクレンジングの具体的な例

  • スペルミスや誤字の修正
    例:「Tkyo」を「Tokyo」に修正する。
  • 不完全なデータの補完
    例:住所情報が部分的にしか入力されていない場合、それを補完する。
  • 重複データの削除
    例:顧客データベース内で同じメールアドレスを持つ複数のレコードが存在する場合、それらの重複を削除する。
  • 日付や数値のフォーマットの統一
    例:日付が「2023/08/14」と「14-08-2023」の2つの異なる形式で保存されている場合、一方の形式に変換して統一する。
  • 不適切なデータの削除
    例:年齢欄に「ABC」という文字が入力されている場合、それを削除または修正する。
  • カテゴリデータの統一
    例:商品カテゴリが「PC」と「パソコン」として別々に分類されている場合、一方のカテゴリ名に統一する。

データクレンジングを行うことで、入力ミスや欠損値などの不正確なデータによる業務処理のエラーや問題が減少し、業務効率の向上や再処理コストの削減につながります。

名寄せとは?

名寄せ(Data Matching / Record Linkage)は、異なるデータベースやシステムに散在する同一の情報を、一つの統一された情報として一元化する作業です。
名寄せでデータの重複や不整合を解消し、データの一貫性と品質を確保できます。

特に顧客情報管理やマーケティング活動では、正確な顧客のデータを持つことが極めて重要です。
そのため、名寄せもまた重要な作業となります。

名寄せの具体的な例

  • 顧客情報の統合
    例:オンラインショップと実店舗とで別々のデータベースに保存されている顧客情報を、メールアドレスや電話番号などの共通の識別情報を基に統合する。
  • 会社名の統一
    例:「NTT」「エヌティーティー」「日本電信電話株式会社」など同一企業であるが異なる名称・略称で登録された情報を統一する。
  • 住所情報の統一
    例:「東京都新宿区」と「東京都新宿」のように、異なる表記で保存されている住所情報を一つの標準的な形式に統一する。
  • 製品情報の統合
    例:複数のサプライヤーから提供される製品情報を、製品コードやバーコードなどの共通の識別情報を基に統合する。
  • 社員情報の統一
    例:人事部門と給与部門で異なるデータベースに保存されている社員情報を、社員番号や氏名などの共通の識別情報を基に統一する。

重複した顧客データが発生する理由とは?

顧客データ管理において、こうした重複データができてしまうことは、避けがたい問題です。
この問題には、さまざまな原因が考えられます。

データの入力・登録時の問題点

データの入力や登録の手段は、マーケティング施策や事業形態に応じて多岐にわたります。
具体的には、以下のようなケースが考えられます。

  • イベントやセミナーで得た名刺情報
  • マーケティング担当者が入力した情報
  • 営業担当者が入力した情報
  • 架電を受けた受付担当者が入力した情報
  • ウェブサイトのフォームから送信された情報

データの入力や登録は、多くの場合、人の手によって行われます。
この過程で、入力者の独自のルールや慣習に基づいてデータが入力されることが多く、以下のような問題が生じることがあります。

フォームの入力ゆらぎ

同じ顧客情報でも、入力フォームの設計やガイダンス、バリデーション(要件適合)の不足から、異なる形式や表記でデータが入力されることがあります。

例:「株式会社」と「㈱」のような違いや、全角と半角の入力違いなど。

担当者ごとの異なる形式での入力

異なる担当者がデータを入力する際、その担当者の独自のルールや慣習に基づいてデータが入力されることがあります。
また文字変換のミスなどで間違った文字列で登録されることもあります。

例:電話番号のハイフンの有無や、旧字体「齋藤」と新字体「斎藤」の違いなど。

データベースの統合時の問題点

企業が成長する過程で、異なるデータベースやシステムの統合が必要となることがあります。
この統合の際に、問題が生じることがあります。

運用変更前のデータの残存

新しいシステムに移行する際、古いシステムのデータがそのまま移行され、新旧のデータが混在し、重複が生じることがあります。

例:古いシステムでの顧客IDと新しいシステムでの顧客IDが異なる

統合ルールの不備

データベースを統合する際のルールが不十分であると、同じ顧客情報でも異なるデータとして統合されてしまうことがあります。

例:システムAで日付を「YYYY/MM/DD」の形式で保存しているのに対し、システムBでは「MM-DD-YYYY」の形式で保存している

顧客データを適切に統合する重要性

顧客データの価値を最大限に引き出すためには、その適切な管理と統合が欠かせません。
重複データがもたらす悪影響と顧客データを適切に統合することの重要性について詳しく見ていきます。

重複データがもたらす問題点

重複データは、企業の業績や顧客満足度など、あらゆるビジネスの側面において悪影響を及ぼす可能性があります。

データの信頼性の低下

重複データが存在すると、データの正確性や一貫性が損なわれ、データに基づく意思決定や分析の信頼性が低下します。

業務効率の低下とコストの増加

重複データを検出し、修正または削除する作業は時間と労力を要します。
重複データが多いほどその人的コストは増え、他の重要な業務への取り組みが遅れる可能性があります。

分析の誤りや歪み

重複データが存在すると、正確なデータ分析が難しくなります。
例えば、顧客数や売上などの指標が実際と異なって集計された場合、誤った戦略や判断を下すリスクが高まります。

顧客対応の遅延と満足度の低下

重複データが存在することで顧客情報の検索や確認に時間がかかり、顧客対応が遅れる可能性があります。

また、同一顧客に同じ情報やプロモーションを複数回送信するなどの問題が発生すると、顧客の不満を引き起こし、ブランドの評価や顧客満足度を低下させる恐れがあります。

データストレージの無駄

重複データは、不要なデータストレージを消費し、データベースのパフォーマンスも低下する可能性があります。

データを適切に統合するメリット

データを適切に統合することで、以下のようなメリットが得られます。

正確なデータ分析による迅速な意思決定

データが一元化され、可視化されることで、データ分析の結果がより正確になり迅速な意思決定が可能となります。

ストックデータの活用

顧客データを一元化することで、過去の購入履歴や問い合わせ履歴などのストックデータを活用し、顧客のニーズの予測が可能となります。

サービスの質向上

顧客のニーズや傾向を正確に把握することで、より適切なサービスや商品の提供ができるようになります。

クロスセル・アップセルの機会増加

顧客データの一元化により、顧客の購入履歴や興味を基に、関連商品や高額商品の提案が容易となります。

データクリーニングコストの高さ:1-10-100ルール

1-10-100ルールは、元々製造業の品質管理のコストを示すものですが、データクレンジングにも適用されます。

データ登録時に正規化するコストを1とした場合、データ入力後のクリーニングコストは10倍、すでに各事業部で活用されているデータのクリーニングコストは100倍と想定されます。

クリーニングコストを最小限にするためには、データ登録時、できるだけ初期の段階で正確な情報を登録する仕組みが必要です。

EFOと入力アシスト機能の導入によるデータ品質の向上

データの品質を保つための方法は多岐にわたりますが、EFO(Entry Form Optimization)の入力アシスト機能は、データ入力時の品質を確保・向上させるためにも注目される技術の一つです。

EFO導入により、データの入力ミスを大幅に減少させることができ、さらに法人番号などのID情報を自動的に補完することもできます。

EFOの概要とそのメリット

本来EFOは、フォームの入力操作をサポートするツールとして設計されており、入力ユーザーの負担を軽減し、フォームの入力完了率を向上させることを目的としています。

ユーザーがフォーム入力する際に、指定形式以外での入力や、必須項目の未入力などの不備をリアルタイムで検知して指摘することで、入力ミスや入力漏れを予防します。

この結果、ユーザーは入力ミスや表記の揺れなどの問題が大幅に減少してスムーズで正確な入力が可能となります。
そのため入力に伴うストレスも減少してフォームからの途中離脱が減り、コンバージョン率の向上にも寄与します。

データの品質の観点でも、EFOの活用により入力時点でデータの品質が向上するため、後続の業務や分析の精度も高まります。

顧客データ:1年で27.5%の企業情報が変更される

さらに驚くべきデータがあります。
こちらは企業データベースを提供している企業の例ですが、1年が経過すると約27.5%の企業で、なんらかの会社情報が更新されているそうです。

1年の経過で約3割、4年の経過でほぼすべての情報が変わると書かれています。

データの品質を維持・向上させるためには、データの重複や不整合を排除し、正確な情報を保持・運用することが不可欠ですが、時間の経過とともにその情報も古くなり、使用できなくなるデータが増えることがわかります。

企業情報が変更される主な要因としては、次のようなものが挙げられます。

  • 企業のM&A、廃業
  • オフィスの移転
  • 法人名の変更やブランド名の変更
  • 連絡先情報の変更(電話番号、メールアドレスなど)

顧客データベースの最適な管理:法人番号の活用

このように、せっかく取得した顧客データも、1年で3割弱が活用できないデータとなってしまいます。
こうしたデータの損失は、企業にとって大きなコストとなります。

これらの損失コストをカバーし、顧客情報、特に企業情報の更新を自動的かつ正確に行うための方法として、「法人番号」を活用することをおすすめします。

法人番号とは?

法人番号とは、日本の法人番号制度において、各法人に一意に与えられる13桁の番号です。
この制度は、2015年に「法人番号法」に基づき導入され、国や地方公共団体、その他の法人を対象としています。

法人番号は、国が提供する無償の国際標準規格で、企業を特定する識別コードとして国税庁に登録されています。
企業が倒産、廃業するとその番号は閉鎖企業として残るため、重複することもありません。

データクレンジングのコストを削減する方法

データクレンジングのコスト削減のやり方は、顧客データを法人番号で管理することです。
顧客データを「法人番号」で管理すると、企業情報の変更や更新を自動で追跡することが可能となります。

データ収集の段階で法人番号による正規化をしておけば、データの重複や不整合を自動で防ぐことができます。
後続のデータクレンジングの必要性もなくなるため、クレンジングコストの大幅な削減につながります。

入力アシストと法人番号の正規化なら「Gyro-n EFO ×スタンディ」

Gyro-n EFO × ST&E(スタンディ)

Gyro-n EFOは、フォームの入力アシストを提供し、入力フィールドでの適切な形式の入力をサポートします。

さらに「スタンディ(ST&E)」との連携により、法人番号やそれに関連する37項目の情報を自動でデータベースに補完する機能を持っています。

スタンディを通じて以下の37項目を自動で取得できます。

  1. 法人名
  2. 法人名カナ
  3. 代表電話番号
  4. 郵便番号
  5. 都道府県コード
  6. 都道府県
  7. 市区町村コード
  8. 市区町村
  9. 番地
  10. 市区町村番地
  11. 法人番号
  12. 業種コード
  13. 業種区分
  14. 上場コード
  15. 上場区分
  16. 資本コード
  17. 資本区分
  18. 資本金
  19. 売上コード
  20. 売上区分
  21. 売上
  22. 従業員コード
  23. 従業員区分
  24. 従業員数
  25. 本社区分
  26. HP_URL
  27. 代表FAX番号
  28. 登記情報フラグ
  29. 登記郵便番号
  30. 登記都道府県コード
  31. 登記都道府県
  32. 登記市区町村コード
  33. 登記市区町村
  34. 登記番地
  35. 登記市区町村番地
  36. 適格請求書発行事業者登録番号
  37. 学校コード

ABM戦略において、正しい企業情報が欠かせません

ABMとは、 Account Based Marketing(アカウントベースドマーケティング)の略で、マーケティング戦略のターゲットを個別の担当者ではなく、企業や団体(アカウント)全体にしてアプローチする手法です。

この戦略を成功させるためには、正確な企業情報が不可欠です。

ABM戦略では、企業の資本金、従業員数、売上、各事業所の情報など、多岐にわたる正確なデータを必要とします。

スタンディを活用して法人番号をキーとして企業情報を管理することで、これらの属性情報を自動的に更新し、正確で最新のデータにしておくことが可能です。

まとめ

名寄せやデータクレンジングの重要性とそれに伴うコストについて詳しく解説しました。

顧客データの管理において、名寄せやデータクレンジングは欠かせない作業ですが、これらの作業には時間とコストがかかります。
特に、データが増えるにつれて、クレンジングの必要性が増し、そのコストも増えていきます。

法人番号をキーとして顧客データを管理することで、データの正確性を保ちながら、企業情報の自動更新、重複や不整合のデータを効率的にクレンジングすることができ、大幅なコスト削減と業務効率の改善が期待できます。

Gyro-n EFO×スタンディを活用することで、データ取得時点での正規化が可能となります。
クレンジングコストを最小限に押さえ、本来の重要な分析に時間をかけ、ビジネスの成長につなげてください。

データクレンジング・名寄せなど、企業のデータベースをリッチにするGyro-n EFO×ST&E(スタンディ)

Gyro-n EFO製品資料

データクレンジング・名寄せなど、企業のデータベースをリッチにする ST&E(スタンディ)の機能・特徴など、詳しい資料をご覧いただけます。

次の記事
ログ解析レポートから考えられる離脱とエラーの原因について<エラー率編>
前の記事
ログ解析レポートから考えられる離脱とエラーの原因<離脱率編>

データクレンジング、名寄せ 関連ページ

法人番号によるデータ管理ならスタンディ

正規化された会社情報(企業名、郵便番号、住所、電話番号など)を自動入力します。

法人番号によるデータ管理ならスタンディ
EFOならGyro-n

フォーム最適化ツールのGyro-n EFOでフォーム入力をアシストしコンバージョン率を改善します。

EFOならGyro-n
MAツールのフォームにEFOを実装

SATORI、Pardot、マルケト、ハブスポットのMA連携フォームにEFOを実装します。

MAツールのフォームにEFOを実装