マッチングルール
True RecordがSalesforceデータ内の重複レコードを識別する方法を設定します。
マッチングモード
True Recordは、さまざまなニーズに対応する3つのマッチングモードを提供しています。設定 → マッチングルールでマッチングモードを設定してください。
ルールのみ
設定されたウェイトとしきい値を使用した従来のフィールドごとの比較。一貫したフォーマットの構造化データに最適です。
Pros
- + AIクレジット不要
- + 最速のパフォーマンス
- + 予測可能な結果
Cons
- - バリエーション(タイプミス、略語)を見逃す可能性あり
- - 慎重なフィールド設定が必要
AIのみ
AIエンベディングを使用して意味的に類似したレコードを検索します。バリエーションやあいまいマッチの検出に最適です。
Pros
- + タイプミスやバリエーションを検出
- + 略語を処理
- + 多言語マッチング
Cons
- - AIクレジットが必要
- - 偽陽性が発生する可能性あり
ハイブリッド
AI類似性とルールベースのマッチングを組み合わせて最高の精度を実現します。OR論理を使用—AIまたはルールのいずれかが重複を検出した場合にマッチします。
Pros
- + 最高の精度
- + 完全一致とあいまい一致の両方を検出
- + AIウェイトを設定可能
Cons
- - AIクレジットが必要
- - ルールのみよりわずかに遅い
各モードの使いどころ
データ品質と目標に基づいて適切なモードを選択してください。
最初のクリーンアップにはルールのみから始めてください。最終パスや隠れた重複が疑われる場合はハイブリッドを使用してください。
自動ブロッキング
ブロッキングは自動的に行われます。マッチングルールを設定すると、システムは同じフィールドを使用して比較前にレコードをインテリジェントにグループ化し、パフォーマンスを大幅に向上させます。
ベストプラクティス
- より良いブロッキングカバレッジのために複数のマッチングフィールドを設定
- メールドメインブロッキングはB2B連絡先に最適
- 名前と電話フィールドは追加のブロッキング次元を提供
- システムは正規化(大文字小文字、句読点、一般的な接尾辞)を自動的に処理
フィールドウェイト
各フィールドにウェイト(1〜100)を割り当てて、マッチスコア計算における重要度を制御します。
| フィールド | ウェイト | 説明 |
|---|---|---|
| メール | 100 | 最高ウェイト—メールは通常、個人ごとに一意です |
| 名前 | 80 | 高ウェイト—名前は強力な識別子ですが、バリエーションがある可能性があります |
| 電話 | 70 | 良い識別子ですが、共有されたり、異なるフォーマットになる可能性があります |
| 会社 | 60 | 重要なコンテキストですが、人は転職します |
| 市区町村 | 30 | 低ウェイト—コンテキストを提供しますが、多くの人が同じ場所を共有しています |
マッチしきい値
しきい値は、どのペアが潜在的な重複または完全な重複としてフラグ付けされるかを決定します。
70%
潜在的マッチ(70%)
スコアが70〜89%のレコードは潜在的な重複としてフラグ付けされます。これらは手動で確認してください。
90%
完全マッチ(90%)
スコアが90%以上のレコードは強い重複と見なされます。これらは自信を持ってマージできることが多いです。
しきい値は、データ品質要件に合わせて設定 → マッチングルールで調整できます。