La connaissance visuelle est une nouvelle forme d'expression des connaissances, dont les racines théoriques se trouvent ancrées dans les sciences cognitives ; l'objectif de la connaissance visuelle est de fournir un cadre théorique unifié, complet et explicite et des méthodes de modélisation pour les éléments essentiels de l'intelligence visuelle, tels que les concepts visuels, les relations visuelles, les opérations visuelles et le raisonnement visuel. Les recherches en sciences cognitives ont confirmé l'importance de la connaissance visuelle dans le processus cognitif humain et le comportement intelligent, ce qui permet de conclure que l'expression et l'apprentissage de la connaissance visuelle joueront un rôle important dans le développement de l'intelligence visuelle et de l'intelligence artificielle. Ces dernières années, l'intelligence artificielle continue de progresser, en particulier l'émergence de grands modèles d'intelligence artificielle dépasse le niveau d'intelligence des modèles traditionnels, les grands modèles peuvent automatiquement découvrir des règles générales à partir de grands ensembles de données, et encoder ces règles dans les paramètres de réseaux neuronaux de grande taille, ce qui permet l'extraction automatique de grandes quantités de connaissances et le stockage paramétrique implicite des connaissances. Cette nouvelle révolution technologique de l'intelligence artificielle, entraînée par de grands modèles, apportera de nouvelles opportunités et défis pour la création d'entités intelligentes avancées dotées de connaissances visuelles. Dans cet article, une analyse approfondie des fondements théoriques de la connaissance visuelle est réalisée, et un aperçu du développement des domaines connexes de la connaissance visuelle au cours des dernières années est présenté. Dans le même temps, des perspectives prospectives sur les orientations de développement de la connaissance visuelle à l'ère des grands modèles, ainsi que le rôle qu'ils pourraient jouer, sont proposées.
Keywords
connaissance visuelle; intelligence artificielle; modèle de base; apprentissage profond