Matching-Regeln

Konfigurieren Sie, wie True Record doppelte Datensätze in Ihren Salesforce-Daten identifiziert.

Matching-Modi

True Record bietet drei Matching-Modi für unterschiedliche Anforderungen. Konfigurieren Sie Ihren Matching-Modus unter Einstellungen → Matching-Regeln.

Nur Regeln

Traditioneller Feld-für-Feld-Vergleich mit konfigurierten Gewichtungen und Schwellenwerten. Am besten für strukturierte Daten mit konsistenter Formatierung.

Pros
  • + Keine KI-Credits erforderlich
  • + Schnellste Leistung
  • + Vorhersagbare Ergebnisse
Cons
  • - Kann Variationen übersehen (Tippfehler, Abkürzungen)
  • - Erfordert sorgfältige Feldkonfiguration

Nur KI

Verwendet KI-Embeddings, um semantisch ähnliche Datensätze zu finden. Am besten zum Erfassen von Variationen und unscharfen Übereinstimmungen.

Pros
  • + Erfasst Tippfehler und Variationen
  • + Verarbeitet Abkürzungen
  • + Sprachübergreifendes Matching
Cons
  • - Erfordert KI-Credits
  • - Kann Falsch-Positive liefern

Hybrid

Kombiniert KI-Ähnlichkeit mit regelbasiertem Matching für beste Genauigkeit. Verwendet ODER-Logik – matcht, wenn entweder KI oder Regeln ein Duplikat erkennen.

Pros
  • + Beste Genauigkeit
  • + Erfasst sowohl exakte als auch unscharfe Übereinstimmungen
  • + Konfigurierbare KI-Gewichtung
Cons
  • - Erfordert KI-Credits
  • - Etwas langsamer als Nur-Regeln

Wann welchen Modus verwenden

Wählen Sie den richtigen Modus basierend auf Ihrer Datenqualität und Ihren Zielen.

Nur Regeln

Saubere, standardisierte Daten mit konsistenter Formatierung. Hochvolumige Scans, bei denen Geschwindigkeit wichtig ist. Benutzer, die weniger zu überprüfende Übereinstimmungen bevorzugen.

Höhere Präzision, niedrigerer Recall. Kann Duplikate mit Tippfehlern, Abkürzungen oder Formatierungsvariationen übersehen.

Hybrid

Unordentliche Daten mit Tippfehlern, Abkürzungen oder inkonsistenter Formatierung. Wenn Gründlichkeit wichtiger ist als Geschwindigkeit. Erfassen von Grenzfällen, die Regeln übersehen.

Höherer Recall, mehr zu überprüfende Übereinstimmungen. Kann einige Falsch-Positive enthalten, die manuelle Überprüfung erfordern.

Beginnen Sie mit Nur-Regeln für die erste Bereinigung. Verwenden Sie Hybrid für abschließende Durchläufe oder wenn Sie versteckte Duplikate vermuten.

Automatisches Blocking

Blocking erfolgt automatisch. Wenn Sie Matching-Regeln konfigurieren, verwendet das System dieselben Felder, um Datensätze vor dem Vergleich intelligent zu gruppieren, was die Leistung drastisch verbessert.

Wie Blocking funktioniert

Anstatt jeden Datensatz mit jedem anderen Datensatz zu vergleichen (O(n²)), gruppiert Blocking Datensätze nach gemeinsamen Feldwerten und vergleicht nur innerhalb von Gruppen. Dies reduziert die Komplexität auf O(n × block_size). Das System generiert automatisch Blocking-Schlüssel basierend auf Ihren konfigurierten Matching-Feldern und deren Typen (E-Mail-Domains, Telefonsuffixe, Namenspräfixe usw.).

Beispiel

Wenn Sie nach Name und E-Mail matchen, gruppiert Blocking Datensätze, die ähnliche Namenspräfixe oder E-Mail-Domains teilen. Ein Datensatz 'John Smith bei acme.com' wird mit anderen Datensätzen mit ähnlichen Namen oder derselben E-Mail-Domain verglichen, nicht mit unzusammenhängenden Datensätzen.

So funktioniert es

  1. 1Konfigurieren Sie Ihre Matching-Felder unter Einstellungen → Matching-Regeln
  2. 2Das System verwendet automatisch Feldtypen, um Blocking-Schlüssel zu erstellen
  3. 3E-Mail-Felder → gruppiert nach Domain und Local-Part-Präfix
  4. 4Namensfelder → gruppiert nach Präfix und phonetischer Ähnlichkeit (Soundex)
  5. 5Telefonfelder → gruppiert nach den letzten 4-7 Ziffern
  6. 6Firmenfelder → gruppiert nach normalisiertem Namenspräfix

Best Practices

  • Konfigurieren Sie mehrere Matching-Felder für bessere Blocking-Abdeckung
  • E-Mail-Domain-Blocking funktioniert hervorragend für B2B-Kontakte
  • Namen- und Telefonfelder bieten zusätzliche Blocking-Dimensionen
  • Das System übernimmt die Normalisierung (Groß-/Kleinschreibung, Satzzeichen, gängige Suffixe) automatisch

Feldgewichtungen

Weisen Sie jedem Feld Gewichtungen (1-100) zu, um ihre Bedeutung bei der Berechnung des Match-Scores zu steuern.

FeldGewichtungBeschreibung
E-Mail100Höchste Gewichtung – E-Mail ist typischerweise pro Person eindeutig
Name80Hohe Gewichtung – Namen sind starke Identifikatoren, können aber Variationen haben
Telefon70Guter Identifikator, kann aber geteilt oder unterschiedlich formatiert sein
Firma60Wichtiger Kontext, aber Personen wechseln Jobs
Stadt30Niedrigere Gewichtung – bietet Kontext, aber viele Personen teilen Standorte

Score-Berechnung

Der finale Match-Score ist ein gewichteter Durchschnitt: Σ(Feld_Ähnlichkeit × Gewichtung) / Σ(Gewichtungen). Felder mit Null-Werten in einem der Datensätze werden von der Berechnung ausgeschlossen.

Übereinstimmungsschwellen

Schwellenwerte bestimmen, welche Paare als potenzielle oder exakte Duplikate markiert werden.

70%

Potenzielle Übereinstimmung (70%)

Datensätze mit Scores zwischen 70-89% werden als potenzielle Duplikate markiert. Überprüfen Sie diese manuell zur Bestätigung.

90%

Exakte Übereinstimmung (90%)

Datensätze mit Scores von 90% oder höher gelten als starke Duplikate. Diese können oft mit Zuversicht zusammengeführt werden.

Schwellenwerte können unter Einstellungen → Matching-Regeln angepasst werden, um Ihren Datenqualitätsanforderungen zu entsprechen.

Häufig gestellte Fragen

Warum werden für meinen Objekttyp keine Duplikate erkannt?

Blocking erfolgt automatisch und basiert auf Ihren konfigurierten Matching-Feldern. Stellen Sie sicher, dass Sie Matching-Felder für den Objekttyp unter Einstellungen → Matching-Regeln konfiguriert haben. Das System erstellt Blocking-Schlüssel aus E-Mail-Domains, Namenspräfixen, Telefonnummern und anderen Feldtypen. Wenn keine Matching-Felder konfiguriert sind, wird nur grundlegendes Fallback-Blocking angewendet.

Sollte ich hohe oder niedrige Gewichtungen für optionale Felder verwenden?

Verwenden Sie niedrigere Gewichtungen (20-40) für optionale Felder, die oft leer sein können. Hohe Gewichtungen bei spärlichen Feldern können Scores verzerren, wenn das Feld in einem Datensatz fehlt.

Kann ich unterschiedliche Regeln für verschiedene Objekte haben?

Ja. Jeder Objekttyp (Lead, Kontakt, Account) hat seine eigene Matching-Konfiguration. Konfigurieren Sie jeden unter Einstellungen → Matching-Regeln.

Wie gehe ich mit Namensvariationen wie 'Bob' vs. 'Robert' um?

KI-Matching verarbeitet gängige Variationen automatisch. Im Nur-Regeln-Modus erfasst der Fuzzy-Matching-Algorithmus geringfügige Variationen, aber Spitznamen-Zuordnungen erfordern den KI-Modus.