KI-gestütztes Matching
Wie True Record maschinelles Lernen nutzt, um Duplikate zu finden, die regelbasierte Systeme übersehen.
Übersicht
True Record kombiniert KI-Vektor-Embeddings mit traditionellen Matching-Regeln, um Duplikate zu finden. Dieser hybride Ansatz erfasst sowohl exakte Übereinstimmungen als auch unscharfe/semantische Ähnlichkeiten.
Versteht Bedeutung, nicht nur Text
Findet Übereinstimmungen in Millisekunden
KI + Regeln für beste Genauigkeit
Matching-Pipeline
Jeder Scan durchläuft eine mehrstufige Pipeline, um potenzielle Duplikate zu finden und zu bewerten.
Vektor-Embeddings
Embeddings erfassen die semantische Bedeutung von Datensätzen und ermöglichen es uns, Duplikate zu finden, auch wenn Felder unterschiedlich formatiert sind oder Tippfehler enthalten.
Benutzerdefinierte Feldauswahl
Sie können konfigurieren, welche Felder für das Embedding verwendet werden, im Tab Einstellungen. Wählen Sie Felder, die Datensätze eindeutig identifizieren, für beste Ergebnisse.
K-NN-Suche
K-Nearest-Neighbors (K-NN) Suche findet Datensätze mit den ähnlichsten Embeddings. Wir verwenden approximative Nearest-Neighbor (ANN) Suche für Skalierbarkeit.
Hybrides Matching
Reines KI-Matching kann Falsch-Positive erzeugen. Wir kombinieren K-NN-Ergebnisse mit Blocking-Regeln für Präzision.
K-NN (Recall)
Wirft ein weites Netz mit semantischer Ähnlichkeit. Erfasst Tippfehler, Abkürzungen und alternative Formate.
Blocking-Regeln (Präzision)
Filtert Kandidaten mit exakten Übereinstimmungen oder regelbasierten Bedingungen (gleiche Domain, gleiche Telefonnummer usw.).
Konfidenz-Bewertung
Jede Übereinstimmung erhält einen Konfidenz-Score von 0-100% basierend auf gewichteten Feldvergleichen.
Sorgfältig prüfen
Wahrscheinliche Übereinstimmung
Sehr hohe Konfidenz
Embedding-Cache
Die Generierung von Embeddings ist teuer. Wir cachen sie aggressiv, um API-Kosten zu minimieren und die Scan-Geschwindigkeit zu verbessern.
Konfiguration
KI-Matching-Einstellungen können pro Objekttyp angepasst werden.