AIマッチング
ルールでは見つけられないものを検出
AI搭載のセマンティックマッチングがコンテキストと意味を理解し、従来のルールベースシステムが見逃す重複を発見します。
Professional
セマンティックマッチング、最小コスト
エンベディングがレコードを意味ベースのベクトルに変換し、類似性を比較します。
- エンベディング用のフィールド選択が設定可能
- タイプミス、略語、バリエーションを検出
- 言語やフォーマットを超えて動作
- 変更のないレコードの再エンベディングを避けるためキャッシュ
エンベディング設定
セマンティックマッチングに使用するフィールドを制御します。
Professional
プロのヒント: 最良の結果を得るには、説明的で人間が読めるフィールドを使用してください。AIはセマンティックな意味を理解するため、テキストが完全に一致しなくても「Vice President of Sales」は「VP Sales」にマッチします。
多言語マッチング
AIエンベディングは言語や文字セットを超えて意味を理解します。
Professional
- アクセント付き文字(é、ü、ñ)をシームレスに処理
- 音訳された名前をマッチ(Beijing = 北京)
- 国コードのバリエーションを理解(France = FR = FRA)
- 日本語、中国語、韓国語、アラビア語などで動作
エンベディングキャッシュ
変更のないレコードのエンベディングをキャッシュしてコストを節約。
Professional
AIコストを80%以上削減 — エンベディングはキャッシュされ、変更のないレコードに再利用されるため、新規または変更されたレコードの分だけ支払います。
AI説明
自然言語での説明により、2つのレコードがなぜマッチしたかを理解できます。
- 各マッチに2〜3文の要約
- フィールドごとの類似性の内訳
- Claude AI(Anthropic)を使用
- AIクレジットを使用(必要に応じてチャージ)
基盤モデルがカスタムMLに勝る理由
一部のツールはお客様のデータでカスタムMLモデルをトレーニングします。私たちが事前学習済み基盤モデルを使用する理由をご説明します。
基盤モデルの利点
- トレーニング期間不要で即座にフル精度で動作
- 見たことのない重複も検出(意味理解)
- 新規顧客や小規模データセットでも同じ品質
- 汚れたデータパターンから学習するリスクなし
私たちのエンベディングベースのアプローチは、すでに欠陥がある可能性のある顧客固有のパターンから学習するのではなく、意味的類似性を普遍的に理解する事前学習済み基盤モデルを使用します。
従来のルール vs AIマッチング
ルールが見逃すものをAIマッチングが検出する様子をご覧ください。