Retour à l'accueil

Règles de correspondance

Configurez comment True Record identifie les enregistrements en double dans vos données Salesforce.

Modes de correspondance

True Record propose trois modes de correspondance pour répondre à différents besoins. Configurez votre mode de correspondance dans Paramètres → Règles de correspondance.

Règles uniquement

Comparaison traditionnelle champ par champ utilisant les pondérations et seuils configurés. Idéal pour les données structurées avec un formatage cohérent.

Pros
  • + Aucun crédit IA requis
  • + Performance la plus rapide
  • + Résultats prévisibles
Cons
  • - Peut manquer des variations (fautes de frappe, abréviations)
  • - Nécessite une configuration soigneuse des champs

IA uniquement

Utilise les embeddings IA pour trouver des enregistrements sémantiquement similaires. Idéal pour détecter les variations et les correspondances floues.

Pros
  • + Détecte les fautes de frappe et variations
  • + Gère les abréviations
  • + Correspondance multilingue
Cons
  • - Nécessite des crédits IA
  • - Peut faire remonter des faux positifs

Hybride

Combine la similarité IA avec la correspondance basée sur des règles pour une meilleure précision. Utilise une logique OU — correspond si l'IA ou les règles détectent un doublon.

Pros
  • + Meilleure précision
  • + Détecte les correspondances exactes et floues
  • + Pondération IA configurable
Cons
  • - Nécessite des crédits IA
  • - Légèrement plus lent que les règles seules

Quand utiliser chaque mode

Choisissez le bon mode en fonction de la qualité de vos données et de vos objectifs.

Règles uniquement

Données propres et standardisées avec un formatage cohérent. Analyses à grand volume où la vitesse compte. Utilisateurs qui préfèrent moins de correspondances à examiner.

Précision plus élevée, rappel plus faible. Peut manquer des doublons avec des fautes de frappe, des abréviations ou des variations de formatage.

Hybride

Données désordonnées avec des fautes de frappe, des abréviations ou un formatage incohérent. Lorsque l'exhaustivité est plus importante que la vitesse. Détection des cas limites que les règles manquent.

Rappel plus élevé, plus de correspondances à examiner. Peut inclure des faux positifs nécessitant une vérification manuelle.

Commencez avec Règles uniquement pour le nettoyage initial. Utilisez Hybride pour les passes finales ou lorsque vous soupçonnez des doublons cachés.

Blocage automatique

Le blocage est automatique. Lorsque vous configurez des règles de correspondance, le système utilise ces mêmes champs pour regrouper intelligemment les enregistrements avant la comparaison, améliorant considérablement les performances.

Comment fonctionne le blocage

Au lieu de comparer chaque enregistrement avec tous les autres (O(n²)), le blocage regroupe les enregistrements par valeurs de champs partagées et ne compare qu'au sein des groupes. Cela réduit la complexité à O(n × taille_bloc). Le système génère automatiquement des clés de blocage basées sur vos champs de correspondance configurés et leurs types (domaines d'email, suffixes téléphoniques, préfixes de nom, etc.).

Exemple

Si vous faites correspondre sur Nom et Email, le blocage regroupera les enregistrements partageant des préfixes de nom similaires ou des domaines d'email. Un enregistrement « Jean Dupont chez acme.com » sera comparé aux autres enregistrements avec des noms similaires ou le même domaine d'email, pas aux enregistrements sans rapport.

Comment ça fonctionne

  1. 1Configurez vos champs de correspondance dans Paramètres → Règles de correspondance
  2. 2Le système utilise automatiquement les types de champs pour créer des clés de blocage
  3. 3Champs email → regroupe par domaine et préfixe de la partie locale
  4. 4Champs nom → regroupe par préfixe et similarité phonétique (Soundex)
  5. 5Champs téléphone → regroupe par les 4-7 derniers chiffres
  6. 6Champs entreprise → regroupe par préfixe de nom normalisé

Bonnes pratiques

  • Configurez plusieurs champs de correspondance pour une meilleure couverture de blocage
  • Le blocage par domaine d'email fonctionne très bien pour les contacts B2B
  • Les champs nom et téléphone fournissent des dimensions de blocage supplémentaires
  • Le système gère automatiquement la normalisation (casse, ponctuation, suffixes courants)

Pondérations des champs

Attribuez des pondérations (1-100) à chaque champ pour contrôler leur importance dans le calcul du score de correspondance.

ChampPondérationDescription
Email100Pondération la plus élevée — l'email est généralement unique par personne
Nom80Pondération élevée — les noms sont des identifiants forts mais peuvent avoir des variations
Téléphone70Bon identifiant mais peut être partagé ou formaté différemment
Entreprise60Contexte important mais les personnes changent d'emploi
Ville30Pondération plus faible — fournit du contexte mais beaucoup de personnes partagent des localisations

Calcul du score

Le score de correspondance final est une moyenne pondérée : Σ(similarité_champ × pondération) / Σ(pondérations). Les champs avec des valeurs nulles dans l'un ou l'autre enregistrement sont exclus du calcul.

Seuils de correspondance

Les seuils déterminent quelles paires sont signalées comme doublons potentiels ou exacts.

70%

Correspondance potentielle (70 %)

Les enregistrements avec des scores entre 70-89 % sont signalés comme doublons potentiels. Examinez-les manuellement pour confirmer.

90%

Correspondance exacte (90 %)

Les enregistrements avec des scores de 90 % ou plus sont considérés comme des doublons probables. Ceux-ci peuvent souvent être fusionnés en toute confiance.

Les seuils peuvent être ajustés dans Paramètres → Règles de correspondance pour correspondre à vos exigences de qualité des données.

Questions fréquentes

Pourquoi les doublons ne sont-ils pas détectés pour mon type d'objet ?

Le blocage est automatique et basé sur vos champs de correspondance configurés. Assurez-vous d'avoir des champs de correspondance configurés pour le type d'objet dans Paramètres → Règles de correspondance. Le système crée des clés de blocage à partir des domaines d'email, préfixes de nom, numéros de téléphone et autres types de champs. Si aucun champ de correspondance n'est configuré, seul un blocage de secours basique est appliqué.

Dois-je utiliser des pondérations élevées ou faibles pour les champs optionnels ?

Utilisez des pondérations plus faibles (20-40) pour les champs optionnels qui peuvent souvent être vides. Des pondérations élevées sur des champs peu remplis peuvent fausser les scores lorsque le champ est manquant dans un enregistrement.

Puis-je avoir des règles différentes pour différents objets ?

Oui. Chaque type d'objet (Piste, Contact, Compte) a sa propre configuration de correspondance. Configurez chacun dans Paramètres → Règles de correspondance.

Comment gérer les variations de noms comme « Bob » vs « Robert » ?

La correspondance IA gère automatiquement les variations courantes. Pour le mode Règles uniquement, l'algorithme de correspondance floue détecte les variations mineures, mais les mappages de surnoms nécessitent le mode IA.