Matching-Regeln
Konfigurieren Sie, wie True Record doppelte Datensätze in Ihren Salesforce-Daten identifiziert.
Matching-Modi
True Record bietet drei Matching-Modi für unterschiedliche Anforderungen. Konfigurieren Sie Ihren Matching-Modus unter Einstellungen → Matching-Regeln.
Nur Regeln
Traditioneller Feld-für-Feld-Vergleich mit konfigurierten Gewichtungen und Schwellenwerten. Am besten für strukturierte Daten mit konsistenter Formatierung.
- + Keine KI-Credits erforderlich
- + Schnellste Leistung
- + Vorhersagbare Ergebnisse
- - Kann Variationen übersehen (Tippfehler, Abkürzungen)
- - Erfordert sorgfältige Feldkonfiguration
Nur KI
Verwendet KI-Embeddings, um semantisch ähnliche Datensätze zu finden. Am besten zum Erfassen von Variationen und unscharfen Übereinstimmungen.
- + Erfasst Tippfehler und Variationen
- + Verarbeitet Abkürzungen
- + Sprachübergreifendes Matching
- - Erfordert KI-Credits
- - Kann Falsch-Positive liefern
Hybrid
Kombiniert KI-Ähnlichkeit mit regelbasiertem Matching für beste Genauigkeit. Verwendet ODER-Logik – matcht, wenn entweder KI oder Regeln ein Duplikat erkennen.
- + Beste Genauigkeit
- + Erfasst sowohl exakte als auch unscharfe Übereinstimmungen
- + Konfigurierbare KI-Gewichtung
- - Erfordert KI-Credits
- - Etwas langsamer als Nur-Regeln
Wann welchen Modus verwenden
Wählen Sie den richtigen Modus basierend auf Ihrer Datenqualität und Ihren Zielen.
Beginnen Sie mit Nur-Regeln für die erste Bereinigung. Verwenden Sie Hybrid für abschließende Durchläufe oder wenn Sie versteckte Duplikate vermuten.
Automatisches Blocking
Blocking erfolgt automatisch. Wenn Sie Matching-Regeln konfigurieren, verwendet das System dieselben Felder, um Datensätze vor dem Vergleich intelligent zu gruppieren, was die Leistung drastisch verbessert.
Best Practices
- Konfigurieren Sie mehrere Matching-Felder für bessere Blocking-Abdeckung
- E-Mail-Domain-Blocking funktioniert hervorragend für B2B-Kontakte
- Namen- und Telefonfelder bieten zusätzliche Blocking-Dimensionen
- Das System übernimmt die Normalisierung (Groß-/Kleinschreibung, Satzzeichen, gängige Suffixe) automatisch
Feldgewichtungen
Weisen Sie jedem Feld Gewichtungen (1-100) zu, um ihre Bedeutung bei der Berechnung des Match-Scores zu steuern.
| Feld | Gewichtung | Beschreibung |
|---|---|---|
| 100 | Höchste Gewichtung – E-Mail ist typischerweise pro Person eindeutig | |
| Name | 80 | Hohe Gewichtung – Namen sind starke Identifikatoren, können aber Variationen haben |
| Telefon | 70 | Guter Identifikator, kann aber geteilt oder unterschiedlich formatiert sein |
| Firma | 60 | Wichtiger Kontext, aber Personen wechseln Jobs |
| Stadt | 30 | Niedrigere Gewichtung – bietet Kontext, aber viele Personen teilen Standorte |
Übereinstimmungsschwellen
Schwellenwerte bestimmen, welche Paare als potenzielle oder exakte Duplikate markiert werden.
Potenzielle Übereinstimmung (70%)
Datensätze mit Scores zwischen 70-89% werden als potenzielle Duplikate markiert. Überprüfen Sie diese manuell zur Bestätigung.
Exakte Übereinstimmung (90%)
Datensätze mit Scores von 90% oder höher gelten als starke Duplikate. Diese können oft mit Zuversicht zusammengeführt werden.
Schwellenwerte können unter Einstellungen → Matching-Regeln angepasst werden, um Ihren Datenqualitätsanforderungen zu entsprechen.