El conocimiento visual es una nueva forma de expresión del conocimiento, cuyas raíces teóricas se encuentran profundamente arraigadas en la ciencia cognitiva; el conocimiento visual tiene como objetivo proporcionar un marco teórico unificado, completo e interpretable, así como métodos de modelado para los elementos clave de la inteligencia visual, como los conceptos visuales, las relaciones visuales, las operaciones visuales y el razonamiento visual. La investigación en ciencia cognitiva ha confirmado el papel crucial del conocimiento visual en los procesos cognitivos humanos y el comportamiento inteligente, lo que permite concluir que la expresión y el aprendizaje del conocimiento visual jugarán un papel importante en el desarrollo de la inteligencia visual y la inteligencia artificial. En los últimos años, la inteligencia artificial ha progresado constantemente, en especial los grandes modelos de inteligencia artificial superan el nivel de inteligencia de los modelos tradicionales; los grandes modelos pueden descubrir automáticamente regularidades generales a partir de datos masivos y codificar estas regularidades en los parámetros de redes neuronales a gran escala, lo que permite la extracción automática de conocimiento a gran escala y el almacenamiento de conocimiento implícito mediante la parametrización. Esta nueva revolución tecnológica de la inteligencia artificial, impulsada por los grandes modelos, traerá nuevas oportunidades y desafíos para la construcción de agentes inteligentes avanzados con conocimiento visual. En este contexto, este artículo analiza en profundidad los fundamentos teóricos del conocimiento visual, revisa de manera exhaustiva los desarrollos recientes en el campo del conocimiento visual. Al mismo tiempo, este artículo propone perspectivas prospectivas sobre el desarrollo del conocimiento visual en la era de los grandes modelos y el papel clave que podría desempeñar, así como una visión de futuro.