Visuelles Wissen ist eine neue Form der Wissensrepräsentation, deren theoretische Wurzeln tief in den kognitiven Wissenschaften liegen; das Ziel visuellen Wissens besteht darin, einen einheitlichen, umfassenden und erklärlichen theoretischen Rahmen und Modellierungsmethoden für Kernbestandteile visueller Intelligenz wie visuelle Konzepte, visuelle Beziehungen, visuelle Operationen und visuelles Schlussfolgern zu liefern. Forschungen in den kognitiven Wissenschaften haben die Bedeutung visuellen Wissens im menschlichen kognitiven Prozess und intelligentem Verhalten bestätigt, was den Schluss zulässt, dass die Repräsentation und das Lernen von visuellem Wissen eine wichtige Rolle in der Entwicklung visueller Intelligenz und künstlicher Intelligenz spielen werden. In den letzten Jahren hat die künstliche Intelligenz kontinuierliche Fortschritte gemacht, insbesondere das Aufkommen großer Modelle künstlicher Intelligenz übertrifft das Niveau traditioneller Modelle, große Modelle können automatisch allgemeine Regeln aus umfangreichen Datenmengen entdecken und diese Regeln in die Parameter großer neuronaler Netzwerke kodieren, was die automatische Extraktion großer Wissensmengen und die implizite parametrische Speicherung von Wissen ermöglicht. Diese neue technologische Revolution in der künstlichen Intelligenz, angetrieben von großen Modellen, wird neue Chancen und Herausforderungen für die Schaffung fortschrittlicher intelligenten Entitäten mit visuellem Wissen bieten. In diesem Artikel wird eine eingehende Analyse der theoretischen Grundlagen des visuellen Wissens durchgeführt und ein Überblick über die Entwicklung verwandter Bereiche des visuellen Wissens in den letzten Jahren gegeben. Gleichzeitig werden zukünftige Perspektiven zu den Entwicklungsrichtungen des visuellen Wissens im Zeitalter großer Modelle und zu der Rolle, die sie spielen könnten, vorgestellt.
Keywords
visuelles Wissen; künstliche Intelligenz; Grundmodell; Deep Learning