Visuelles Wissen ist eine neue Form der Wissensrepräsentation, deren theoretische Wurzeln tief in der Kognitionswissenschaft liegen; visuelles Wissen zielt darauf ab, einen einheitlichen, umfassenden und interpretierbaren theoretischen Rahmen und Modellierungsmethoden für die Kernkomponenten der visuellen Intelligenz bereitzustellen - wie visuelle Konzepte, visuelle Beziehungen, visuelle Operationen und visuelles Denken. Die Forschung in der Kognitionswissenschaft hat die wichtige Rolle visuellen Wissens in den menschlichen kognitiven Prozessen und intelligenten Verhaltensweisen bestätigt, was darauf hindeutet, dass die Darstellung und das Lernen von visuellem Wissen eine wichtige Rolle in der Entwicklung der visuellen Intelligenz und der künstlichen Intelligenz spielen werden. In den letzten Jahren hat die künstliche Intelligenz stetige Fortschritte gemacht, insbesondere große Modelle künstlicher Intelligenz übertreffen das Intelligenzniveau traditioneller Modelle; große Modelle können automatisch allgemeine Regularitäten aus massiven Daten entdecken und diese Regularitäten in Parameter großer neuronaler Netze kodieren, was eine automatische Extraktion von Wissen im großen Maßstab und die Speicherung von implizitem Wissen durch Parametrisierung ermöglicht. Diese neue, von großen Modellen angetriebene technologische Revolution in der künstlichen Intelligenz wird neue Chancen und Herausforderungen für den Aufbau von fortgeschrittenen intelligenten Agenten mit visuellem Wissen bringen. In diesem Zusammenhang analysiert dieser Artikel ausführlich die theoretischen Grundlagen des visuellen Wissens, untersucht umfassend die jüngsten Entwicklungen im Bereich des visuellen Wissens. Gleichzeitig bietet dieser Artikel einen vorausschauenden Ausblick auf die Entwicklung des visuellen Wissens im Zeitalter großer Modelle und die mögliche Schlüsselrolle, die es spielen könnte, sowie einen Ausblick in die Zukunft.