セマンティック検索 とは
キーワードではなく意味で検索
セマンティック検索——単純なキーワードマッチングではなく、クエリの意味とコンテキストの理解に基づく情報検索技術。
従来の検索との違い
- 同義語の理解 — 「自動車」で「車」「乗用車」も検索
- コンテキスト関連性 — クエリのコンテキストを考慮
- 意図の認識 — ユーザーが探しているものを理解
- 長いクエリの処理 — 自然言語で動作
- 多言語対応 — 異なる言語間で検索
技術
- エンベディング — テキストのベクトル表現
- トランスフォーマー — BERT、GPT、sentence-transformers
- ベクトルデータベース — Pinecone、Weaviate、Qdrant
- コサイン類似度 — ベクトルの近接度を測定
- ハイブリッド検索 — BM25との組み合わせ
ビジネス応用
- 企業検索 — ドキュメントとナレッジベース全体
- Eコマース — 説明による製品検索
- カスタマーサポート — FAQとドキュメントの検索
- 採用 — 要件による履歴書検索
- 法律検索 — 法的文書の検索