Skip to content
AI & Machine Learning

Segmentación de imágenes

El proceso de dividir una imagen en distintas regiones, normalmente identificando y etiquetando diferentes objetos o áreas.

La segmentación de imágenes asigna cada píxel de una imagen a una categoría, produciendo un mapa donde cada región está etiquetada con lo que representa: persona, cielo, automóvil, edificio, árbol, carretera, etc. Esta comprensión a nivel de píxel permite que las herramientas traten diferentes partes de una imagen de manera diferente, aplicando operaciones de forma selectiva según el contenido en lugar de la posición. Hay tres tipos principales: segmentación semántica (etiquetado de categorías de píxeles), segmentación de instancias (que distingue entre objetos individuales del mismo tipo) y segmentación panóptica (que combina ambas).\n\nLos sistemas de vehículos autónomos utilizan la segmentación de imágenes para comprender su entorno en tiempo real. El sistema segmenta cada cuadro de vídeo en superficie de la carretera, marcas de carril, vehículos, peatones, señales de tráfico y obstáculos. Cada región segmentada desencadena diferentes decisiones de conducción. Si bien se trata de una aplicación crítica para la seguridad, lejos de la edición de fotografías, la tecnología subyacente es la misma y los avances en un campo no importan en el otro.\n\nPara la edición de fotografías, la segmentación permite operaciones basadas en el contenido que eran imposibles con las herramientas tradicionales. Un editor puede seleccionar todos los píxeles del cielo para reemplazar el cielo sin afectar los edificios. Un retocador de retratos puede aplicar suavizado de la piel solo en las regiones del rostro mientras mantiene el cabello y la ropa afilados. Un editor de paisajes puede aumentar la saturación del follaje manteniendo intactos otros elementos. Todas estas operaciones requieren que la herramienta sepa qué representa cada píxel.\n\nSegmentación mágica de imágenes Magic Eraser como base de su proceso de edición. Cuando un usuario pasa un pincel sobre un objeto para eliminarlo, la segmentación identifica el límite completo del objeto incluso si el trazo del pincel fue impreciso. EBackground Erasertation de fondo para identificar y separar el sujeto del fondo. AI Enhance utiliza seAI Enhance para aplicar diferentes estrategias de mejora a diferentes regiones de la imagen. El modelo de segmentación procesa imágenes en milisegundos, lo que permite recibir comentarios en tiempo real a medida que los usuarios interactúan con las herramientas de edición, y su exactitud determina directamente la precisión de cada operación posterior en el proceso, lo que lo convierte posiblemente en el componente de IA más crítico en toda la arquitectura del producto.

Herramientas relacionadas