Conocimiento visual en la era de los grandes modelos: revisión y perspectivas

Wenguan WANG ,  

Yi YANG ,  

Yunhe PAN ,  

Abstract

El conocimiento visual es una nueva forma de expresión del conocimiento cuyas raíces teóricas se encuentran enraizadas en la ciencia cognitiva; el objetivo del conocimiento visual es proporcionar un marco teórico unificado, completo y explicativo y métodos de modelización para los elementos clave de la inteligencia visual, como los conceptos visuales, las relaciones visuales, las operaciones visuales y el razonamiento visual. Las investigaciones en ciencias cognitivas han confirmado la importancia del conocimiento visual en el proceso cognitivo humano y el comportamiento inteligente, lo que permite concluir que la expresión y el aprendizaje del conocimiento visual desempeñarán un papel importante en el desarrollo de la inteligencia visual y la inteligencia artificial. En los últimos años, la inteligencia artificial continúa avanzando, en particular, la aparición de grandes modelos de inteligencia artificial va más allá del nivel de inteligencia de los modelos tradicionales, los grandes modelos pueden descubrir automáticamente reglas generales a partir de grandes conjuntos de datos y codificar estas reglas en parámetros de redes neuronales de gran tamaño, lo que permite la extracción automática de grandes cantidades de conocimiento y el almacenamiento paramétrico implícito del conocimiento. Esta nueva revolución tecnológica en el campo de la inteligencia artificial, impulsada por los grandes modelos, traerá nuevas oportunidades y desafíos para la creación de entidades inteligentes avanzadas con conocimiento visual. En este artículo, se realiza un análisis profundo de los fundamentos teóricos del conocimiento visual, y se presenta una visión general del desarrollo de los campos relacionados con el conocimiento visual en los últimos años. Al mismo tiempo, se proponen perspectivas futuras sobre las direcciones de desarrollo del conocimiento visual en la era de los grandes modelos y el papel que podrían desempeñar.

Keywords

conocimiento visual; inteligencia artificial; modelo básico; aprendizaje profundo

READ MORE