Um den Herausforderungen von Online-Angriffen zu begegnen, führen die Menschen Intrusions-Erkennungssysteme ein, um Eindringverhalten zu identifizieren und Computernetzwerke zu schützen. Unter all diesen Intrusions-Erkennungssystemen zeigen traditionelle Methoden des maschinellen Lernens, die auf oberflächlichem Lernen beruhen, eine unbefriedigende Leistung. Im Gegensatz zu den Methoden des maschinellen Lernens sind derzeit die Methoden des Tiefenlernens führend, da sie große Datenmengen verarbeiten können, ohne dass spezifisches Fachwissen in einem bestimmten Bereich erforderlich ist. Im Tiefenlernen können das Langzeit-Kurzzeit-Gedächtnis (LSTM) und zeitliche Faltungsschichten (TCN) Merkmale aus verschiedenen Perspektiven extrahieren, während Faltungsneuronale Netze (CNN) räumliche Merkmale erlernen können. Vor diesem Hintergrund schlägt dieser Artikel ein neues verflochtenes raumzeitliches Tiefenlernmodell (CRGT-SA) vor, das CNN mit gesteuerten TCN- und LSTM-Modulen kombiniert, um raumzeitliche Merkmale zu lernen, und einen Selbst-Aufmerksamkeitsmechanismus einführt, um bedeutende Merkmale auszuwählen. Speziell zerlegt das vorgeschlagene Modell die Merkmalsextraktion in mehrere Stufen mit zunehmender Feinkörnigkeit und führt jede Stufe mit CNN-, LSTM- und gesteuerten TCN-Modulen aus. Das Modell CRGT-SA wurde am Datensatz UNSW-NB15 validiert und mit anderen Methoden verglichen, einschließlich traditioneller Methoden des maschinellen Lernens, Modelle des Tiefenlernens und führende Modelle des Tiefenlernens. Die Simulationsergebnisse zeigen, dass das vorgeschlagene Modell die höchste Genauigkeit und den höchsten F1-Wert aufweist. Die Genauigkeit des Modells bei binärer und multiklassiger Klassifikation beträgt jeweils 91,5% und 90,5%, was seine Fähigkeit bestätigt, das Internet vor komplexen Netzwerkangriffen zu schützen. Darüber hinaus wurden eine Reihe von Simulationen am Datensatz NSL-KDD durchgeführt und mit anderen Modellen verglichen; die Simulationsergebnisse bestätigen zusätzlich die Fähigkeit dieses Modells zur Verallgemeinerung.