Les algorithmes de stéganographie d'images basés sur l'apprentissage en profondeur sont généralement entraînés à l'aide de caractéristiques de domaine spatial ou fréquentiel. Cependant, les caractéristiques individuelles du domaine ne peuvent pas exprimer complètement le contenu total de l'image, et la stéganographie est généralement multi-tâches, ce qui entraîne généralement de mauvaises performances en stéganographie. Pour cette raison, cet article propose un algorithme de stéganographie d'images robuste basé sur un graphique d'évaluation des caractéristiques, appelé Réseau de stéganographie d'image sûr et robuste (SRIS-Net). Tout d'abord, l'algorithme proposé ne dépend pas de la stéganographie dans le domaine spatial, mais utilise des réseaux neuronaux convolutifs pour obtenir des caractéristiques spatiales de surface. Ces caractéristiques disparaissent via la décomposition de pyramide laplacienne dans le domaine fréquentiel, en utilisant une stratégie de dissimulation progressive dans différents sous-bandes de fréquence, ce qui réduit considérablement l'impact de l'information secrète sur l'image traitée, assurant efficacement une insignifiance remarquable et des performances robustes. De plus, un module d'insertion global-local (GLEM) est proposé, ce module réalise l'insertion en tenant compte de la structure globale de l'image et des détails locaux, et une sous-réseau d'agrégation à double échelle (DMSubNet) est proposé pour une reconstruction multi-échelle afin d'améliorer la qualité de l'image porteuse. Pour garantir la sécurité, une structure de discriminateur à double tâche est proposée, évaluant simultanément l'image comme réelle ou fausse, et génère une carte d'évaluation des caractéristiques de la région d'intérêt de l'image porteuse (ROI) afin de guider le module d'insertion pour créer une image porteuse plus invisible et indiscernable. Les résultats des expériences sur BOSSBase montrent que le SRIS-Net proposé dépasse les autres principales méthodes en termes d'invisibilité et de robustesse de plus de 9,2 dB et 3,4 dB respectivement, le niveau de capacité pouvant être augmenté à environ 72-96 bpp.
Keywords
Stéganographie d'images ; robustesse ; invisibilité ; structure de discriminateur à double tâche