Qué es Visión por Computadora
IA para análisis de imágenes y video
Visión por Computadora — área de inteligencia artificial que entrena computadoras para extraer información de imágenes y video.
Tareas Principales
- Clasificación de imágenes — identificación de objetos en fotos
- Detección de objetos — encontrar y localizar objetos con bounding boxes
- Segmentación — etiquetado de imágenes a nivel de píxel
- Reconocimiento facial — identificación y verificación de personas
- OCR — reconocimiento de texto en imágenes
- Seguimiento de objetos — tracking en flujos de video
Tecnologías Clave
- CNN (redes convolucionales) — base del CV moderno
- YOLO — detección de objetos en tiempo real
- ResNet, EfficientNet — arquitecturas de clasificación
- U-Net, Mask R-CNN — segmentación semántica
- Vision Transformers (ViT) — transformers para imágenes
Aplicaciones Empresariales
- Control de calidad — detección automática de defectos en manufactura
- Retail — reconocimiento de productos, monitoreo de estantes, análisis de colas
- Seguridad — videovigilancia con reconocimiento facial y de acciones
- Salud — análisis de rayos X, MRI, CT para diagnóstico
- Automotriz — autopiloto y sistemas ADAS