アテンションメカニズム とは
ニューラルネットワークが重要な入力部分に注目するメカニズム
アテンションメカニズム (Attention Mechanism)
アテンションメカニズム — 現代のニューラルネットワークの重要なコンポーネントで、入力データの異なる部分の重要性を動的に重み付けできます。
動作原理
- 各要素のアテンション重みを計算
- Query, Key, Value — 3つの計算コンポーネント
- 重要度による値の加重和
- モデルが関連部分を「見る」ことを可能に
アテンションの種類
| 種類 | 説明 | |------|------| | Self-Attention | 単一シーケンス内のアテンション | | Cross-Attention | 異なるシーケンス間のアテンション | | Multi-Head | 複数の並列アテンションヘッド | | Sparse Attention | 最適化されたスパースアテンション |
応用
- NLP — 機械翻訳、GPT、BERT
- コンピュータビジョン — Vision Transformer (ViT)
- マルチモーダルモデル — CLIP、DALL-E
- 推薦システム — パーソナライゼーション
Self-Attention公式
Attention(Q, K, V) = softmax(QK^T / √d_k) × V
利点
- 長距離依存関係の捕捉
- 計算の並列化
- アテンション重みによる解釈可能性