Skip to content
AI & Machine Learning

Segmentazione delle immagini

Il processo di divisione di un'immagine in regioni distinte, in genere identificando ed etichettando oggetti o aree diverse.

La segmentazione delle immagini assegna ogni pixel di un'immagine a una categoria, producendo una mappa in cui ciascuna regione è etichettata con ciò che rappresenta: persona, cielo, automobile, edificio, albero, strada e così via. Questa comprensione a livello di pixel consente agli strumenti di trattare le diverse parti di un'immagine in modo diverso, applicando operazioni selettivamente in base al contenuto piuttosto che alla posizione. Esistono tre tipi principali: segmentazione semantica (etichettatura di categorie di pixel), segmentazione di istanze (distinzione tra singoli oggetti dello stesso tipo) e segmentazione panottica (combinando entrambi).\n\nI sistemi di veicoli autonomi utilizzano la segmentazione delle immagini per comprendere l'ambiente in tempo reale. Il sistema segmenta ogni fotogramma video in superficie stradale, segnaletica orizzontale, veicoli, pedoni, segnali stradali e ostacoli. Ogni regione segmentata innesca diverse decisioni di guida. Anche se si tratta di un'applicazione critica per la sicurezza, lontana dal fotoritocco, la tecnologia di base è la stessa e i progressi in un campo lo sono anche nell'altro.\n\nPer il fotoritocco, la segmentazione consente operazioni basate sul contenuto che sarebbero impossibili con gli strumenti tradizionali. Un editor può selezionare tutti i pixel del cielo per sostituire il cielo senza influenzare gli edifici. Un ritoccatore di ritratti può applicare la levigatura della pelle solo alle regioni del viso mantenendo capelli e vestiti nitidi. Un editor di paesaggi può aumentare la saturazione del fogliame mantenendo intatti gli altri elementi. Tutte queste operazioni richiedono che lo strumento sappia cosa rappresenta ciascun pixel.\n\nLa segmentazione magica delle immagini Magic Eraser come base della sua pipeline di modifica. Quando un utente sfiora un oggetto per rimuoverlo, la segmentazione identifica il contorno completo dell'oggetto anche se il tratto del pennello era impreciso. Sfondo EBackground Erasertation per identificare e separare il soggetto dallo sfondo. AI Enhance utilizza seAI Enhance per applicare diverse strategie di miglioramento a diverse aree dell'immagine. Il modello di segmentazione elabora le immagini in millisecondi, consentendo feedback in tempo reale mentre gli utenti interagiscono con gli strumenti di modifica, e la sua accuratezza determina direttamente la precisione di ogni operazione successiva nella pipeline, rendendolo probabilmente il componente AI più critico dell'intera architettura del prodotto.