L'ère des grands modèles de connaissance visuelle : revue et perspectives

Wenguan WANG ,  

Yi YANG ,  

Yunhe PAN ,  

Abstract

La connaissance visuelle est une nouvelle forme d'expression de la connaissance, dont les racines théoriques sont profondément enracinées dans la science cognitive; la connaissance visuelle vise à fournir un cadre théorique et des méthodes de modélisation unifiés, complets et interprétables pour les éléments clés de l'intelligence visuelle tels que les concepts visuels, les relations visuelles, les opérations visuelles et le raisonnement visuel. Les recherches en sciences cognitives ont démontré que la connaissance visuelle joue un rôle indispensable dans les processus cognitifs humains et le comportement intelligent, ce qui permet de supposer que l'expression et l'apprentissage de la connaissance visuelle auront un impact important sur le développement de l'intelligence visuelle et de l'intelligence artificielle. Au cours des dernières années, l'intelligence artificielle continue de progresser, en particulier les grands modèles d'intelligence artificielle dépassent les modèles traditionnels en termes de niveau d'intelligence, les grands modèles peuvent automatiquement découvrir des règles générales à partir de données massives et coder ces règles dans les paramètres de réseaux neuronaux à grande échelle, ce qui permet d'atteindre l'extraction automatique de connaissances à grande échelle et le stockage de connaissances implicites. Cette nouvelle révolution technologique, dirigée par de grands modèles d'intelligence artificielle, offrira de nouvelles opportunités et défis pour la construction et le développement de systèmes intelligents avancés dotés de connaissances visuelles. À cette fin, cet article analyse en profondeur les bases théoriques de la connaissance visuelle et passe en revue de manière exhaustive l'état actuel du domaine de la connaissance visuelle au cours des dernières années. Dans le même temps, face au développement des grands modèles, il avance des points de vue prospectifs et des prévisions sur le développement de la connaissance visuelle et son rôle clé potentiel.

Keywords

Connaissance visuelle ; Intelligence artificielle ; Modèle de base ; Apprentissage profond

READ MORE