Skip to content
AI & Machine Learning

Compréhension sémantique

Capacité d'un système d'IA à comprendre quels objets et scènes sont représentés dans une image, et pas seulement leurs modèles de pixels.

La compréhension sémantique signifie que l'IA sait qu'une région est un visage, un ciel, une table ou un arbre, et pas seulement une collection de pixels colorés. Cette compréhension au niveau conceptuel permet de prendre des décisions d'édition contextuelles. Lorsqu'elle supprime une personne debout sur une plage, l'IA comprend qu'elle doit remplir la zone de sable, d'océan et de ciel dans les proportions et perspectives appropriées, plutôt que de simplement copier la texture des pixels proches. La compréhension sémantique est ce qui donne à l'édition moderne par IA un aspect naturel plutôt que mécanique.\n\nLa restauration de photos démontre pourquoi la compréhension sémantique est importante. Une photo vintage endommagée présente une grande déchirure sur le visage d'une personne. Sans compréhension sémantique, un outil de réparation pourrait remplir la déchirure avec une texture d'arrière-plan proche ou créer une tache floue. Grâce à la compréhension sémantique, l'IA reconnaît que la région endommagée est un visage, comprend la structure et la symétrie du visage, et reconstruit les traits plausibles du visage qui correspondent au contexte environnant : teint, âge approximatif, direction de l'éclairage.\n\nLa compréhension sémantique existe sur un spectre de sophistication. La segmentation de base identifie les catégories d'objets (personne, voiture, arbre). Une compréhension plus profonde reconnaît les relations (la personne est assise sur la chaise, la voiture est garée devant le bâtiment). Les modèles les plus avancés comprennent la physique (les ombres tombent à l'opposé des sources de lumière, les reflets apparaissent sur des surfaces brillantes) et peuvent générer du contenu qui respecte ces règles.\n\n__L'IA de PH0__ démontre une compréhension sémantique dans l'ensemble de ses fonctionnalités. La suppression d'objets génère un contenu de remplissage contextuellement approprié. La suppression de l'arrière-plan identifie les sujets même dans les scènes complexes. AI FilAI Fill propose de nouveaux contenus qui respectent la logique visuelle de la scène. Cette compréhension est ce qui produit des résultats de qualité professionnelle à partir d’interactions simples avec les utilisateurs. La profondeur de la compréhension sémantique de l'IA continue de s'étendre à chaque mise à jour du modèle, permettant des décisions d'édition de plus en plus sophistiquées telles que la compréhension des propriétés des matériaux, la prévision de la manière dont la lumière interagit avec différentes surfaces et le maintien de la plausibilité physique dans les zones reconstruites où les objets projettent des ombres, créent des reflets ou occultent des éléments d'arrière-plan.

Outils associés