Визуальные знания в эпоху крупных моделей: обзор и перспективы

Wenguan WANG ,  

Yi YANG ,  

Yunhe PAN ,  

Abstract

Визуальные знания - это новая форма представления знаний, чьи теоретические корни уходят в глубины когнитивной науки; цель визуальных знаний заключается в предоставлении единой, комплексной и интерпретируемой теоретической концепции и методов моделирования для ключевых элементов визуального интеллекта, таких как визуальные концепции, визуальные отношения, визуальные операции и визуальное рассуждение. Исследования в области когнитивной науки подтвердили важную роль визуальных знаний в человеческом когнитивном процессе и интеллектуальном поведении, что позволяет заключить, что представление и изучение визуальных знаний будет играть важную роль в развитии визуального интеллекта и машинного интеллекта. В последние годы искусственный интеллект продолжает развиваться, в частности, появление крупных моделей искусственного интеллекта выходит за рамки традиционных моделей, что позволяет крупным моделям автоматически обнаруживать общие закономерности из крупных объемов данных и кодировать эти закономерности в параметры сверхбольших нейронных сетей, что обеспечивает автоматическое извлечение больших объемов знаний и неявное параметрическое хранение знаний. Новая волна технологической революции в области искусственного интеллекта, которую предполагают крупные модели, создаст новые возможности и вызовы для создания передовых интеллектуальных сущностей с визуальными знаниями. В этой статье проводится глубокий анализ теоретических основ визуальных знаний, обзор развития смежных областей визуальных знаний в последние годы. В то же время предлагаются перспективные взгляды и прогнозы на направления развития визуальных знаний в эпоху крупных моделей и роль, которую они могут играть.

Keywords

визуальные знания; искусственный интеллект; базовая модель; глубокое обучение

READ MORE