Matching alimenté par l'IA
Comment True Record utilise l'apprentissage automatique pour trouver les doublons que les systèmes basés sur des règles manquent.
Aperçu
True Record combine les embeddings vectoriels IA avec les règles de correspondance traditionnelles pour trouver les doublons. Cette approche hybride capture à la fois les correspondances exactes et les similarités floues/sémantiques.
Comprend le sens, pas seulement le texte
Trouve les correspondances en millisecondes
IA + règles pour la meilleure précision
Pipeline de matching
Chaque scan passe par un pipeline multi-étapes pour trouver et noter les doublons potentiels.
Embeddings vectoriels
Les embeddings capturent la signification sémantique des enregistrements, nous permettant de trouver des doublons même lorsque les champs sont formatés différemment ou contiennent des fautes de frappe.
Sélection de champs personnalisés
Vous pouvez configurer quels champs sont utilisés pour l'embedding dans l'onglet Paramètres. Choisissez des champs qui identifient de manière unique les enregistrements pour de meilleurs résultats.
Recherche K-NN
La recherche K-Nearest Neighbors (K-NN) trouve les enregistrements avec les embeddings les plus similaires. Nous utilisons la recherche approximative du plus proche voisin (ANN) pour la scalabilité.
Matching hybride
Le matching IA seul peut faire apparaître des faux positifs. Nous combinons les résultats K-NN avec des règles de blocage pour la précision.
K-NN (Rappel)
Ratisse large en utilisant la similarité sémantique. Capture les fautes de frappe, abréviations et formats alternatifs.
Règles de blocage (Précision)
Filtre les candidats en utilisant des conditions de correspondance exacte ou basées sur des règles (même domaine, même téléphone, etc.).
Score de confiance
Chaque correspondance reçoit un score de confiance de 0 à 100% basé sur des comparaisons de champs pondérées.
Vérifier attentivement
Correspondance probable
Confiance très élevée
Cache d'embeddings
La génération d'embeddings est coûteuse. Nous les mettons en cache de manière agressive pour minimiser les coûts d'API et améliorer la vitesse de scan.
Configuration
Les paramètres de matching IA peuvent être ajustés par type d'objet.