Благодаря отсутствию необходимости проектирования сложных компонентов и упрощению процесса обнаружения, внимание в последние годы уделено методу энд-ту-энд обнаружения объектов. Тем не менее, по сравнению с традиционными детекторами, такие методы имеют проблемы медленной сходимости обучения и недостаточной производительности обнаружения, в основе чего лежит ограничение алгоритма на недостаточные сигналы надзора положительных образцов в процессе объединения и выбора. Для решения этой проблемы в настоящей статье предлагается кодер запросов для энд-ту-энд детектора объектов (QSE), который способен повысить скорость сходимости обучения и точность обнаружения. QSE состоит из нескольких слоев кодировщика, и после каждого слоя кодировщика добавляется легковесная сеть для последовательной оптимизации признаков и обеспечения более полного положительного надзора в целях эффективного обучения. Кроме того, в каждый слой кодировщика вводится механизм иерархического внимания к признакам (HFA), включая внутрислойное и межслоевое внимание к признакам, для усиления взаимодействия и объединения признаков различных уровней. HFA может эффективно подавлять похожие представления признаков и усиливать различные представления признаков, ускоряя тем самым процесс выбора признаков. Данный метод может гибко применяться к детекторам на основе сверточных нейронных сетей и детекторам на основе трансформера; многочисленные эксперименты на крупных наборах данных MS COCO, CrowdHuman и PASCAL VOC по обнаружению объектов показывают, что детекторы на основе сверточных нейронных сетей или на основе трансформера, использующие QSE, могут обеспечить более высокую производительность энд-ту-энд обнаружения за меньшее количество обучающих циклов.