AI搭載マッチング
True Recordが機械学習を使用して、ルールベースのシステムでは見逃される重複を検出する方法。
概要
True Recordは、AIベクトルエンベディングと従来のマッチングルールを組み合わせて重複を検出します。このハイブリッドアプローチは、完全一致とあいまい/セマンティック類似性の両方を捕捉します。
テキストだけでなく意味を理解
ミリ秒単位でマッチを検出
最高の精度を実現するAI + ルール
マッチングパイプライン
すべてのスキャンは、潜在的な重複を検出してスコアリングするための多段階パイプラインを通過します。
ベクトルエンベディング
エンベディングはレコードのセマンティックな意味を捕捉し、フィールドのフォーマットが異なる場合や誤字が含まれている場合でも重複を検出できます。
カスタムフィールド選択
設定タブでエンベディングに使用するフィールドを設定できます。最良の結果を得るために、レコードを一意に識別するフィールドを選択してください。
K-NN検索
K最近傍(K-NN)検索は、最も類似したエンベディングを持つレコードを検索します。スケーラビリティのために近似最近傍(ANN)検索を使用しています。
ハイブリッドマッチング
AIのみのマッチングは偽陽性を生成する可能性があります。精度を高めるためにK-NN結果とブロッキングルールを組み合わせています。
K-NN(再現率)
セマンティック類似性を使用して広範囲に検索します。誤字、略語、代替フォーマットを捕捉します。
ブロッキングルール(精度)
完全一致またはルールベースの条件(同じドメイン、同じ電話番号など)を使用して候補をフィルタリングします。
信頼度スコアリング
各マッチは重み付けされたフィールド比較に基づいて0〜100%の信頼度スコアを受け取ります。
慎重に確認
マッチの可能性あり
非常に高い信頼度
エンベディングキャッシュ
エンベディングの生成にはコストがかかります。APIコストを最小限に抑え、スキャン速度を向上させるために積極的にキャッシュしています。
設定
AIマッチング設定はオブジェクトタイプごとに調整できます。