画像セグメンテーション とは
画像をセマンティック領域に分割
画像セグメンテーションは、画像を別々の領域またはオブジェクトに分割するコンピュータビジョンタスクです。各ピクセルにクラスラベルまたはオブジェクトの帰属が割り当てられます。
セグメンテーションの種類
- セマンティック — 各ピクセルの分類(すべての車 = 1つのクラス)
- インスタンスセグメンテーション — 個々のオブジェクトの識別(各車 = 別々のオブジェクト)
- パノプティック — セマンティックとインスタンスセグメンテーションの組み合わせ
モデルアーキテクチャ
- U-Net — スキップ接続を持つエンコーダー・デコーダー
- Mask R-CNN — 検出 + オブジェクトセグメンテーション
- DeepLab — より大きなコンテキストのための拡張畳み込み
- Segment Anything (SAM) — Metaの汎用モデル
応用分野
- 自動運転 — 道路、歩行者、車両検出
- 医療画像 — 臓器、腫瘍のセグメンテーション
- 写真編集 — 背景除去、オブジェクト置換
- ロボティクス — 環境理解