• 当期目录
  • 封面文章
  • 过刊浏览
  • 专题浏览
  • 优先出版
MORE
Volume 26  Issue 4,2025 2025年26卷第4 Issue
  • 常规文章

    Multiagent reinforcement learning (MARL) has emerged as a promising new frontier in reinforcement learning, with vast potential across numerous applications. This review, introduces its research progress in the field of MARL. Expert xx meticulously reviews the application of simulation environments in cooperative scenarios, which provides solutions to solve complex multiagent problems and lays a foundation for the construction of harmonious multiagent systems.

    杨涛, 史鑫昊, 曾庆含, 杨玉林, 徐成, 刘宏哲

    2025, 26(4): 479-509. DOI: 10.1631/FITEE.2400259
    Abstract:近年来,多智能体强化学习已成为强化学习领域一颗耀眼的新星,展现了其在众多应用场景的巨大潜力。奖励函数通过建立评估标准和反馈机制,引导智能体在其环境中探索并做出最优决策。同时,宏观层面的协作目标为智能体的学习提供了轨迹,确保个体行为策略与整体系统目标的高度一致性。奖励结构与协作目标之间的相互作用,不仅增强了个体智能体的有效性,还促进了智能体之间的协作,为群体智能的发展和多智能体系统的和谐运行提供了动力和方向。本文深入探讨了多智能体强化学习中奖励结构的设计方法及协作目标的优化策略,详细审视了这些领域的最新科学进展。此外,对协作场景中的仿真环境应用进行了深入评述,讨论了该领域的未来发展趋势及潜在研究方向,为后续研究提供了前瞻视角与灵感。  
    Keywords:Multiagent reinforcement learning (MARL);Cooperative framework;Reward function;Cooperative objective optimization   
    48
    |
    9
    |
    0
    <HTML>
    <网络PDF><Meta-XML>
    <Citation> <Bulk Citation> 99550234 false
    Updated:2025-05-06
  • 常规文章

    面向自动驾驶系统的物理对抗脆弱性综述 Enhanced Publication AI Introduction

    In the field of autonomous driving systems, a comprehensive survey of physical adversarial vulnerabilities has been conducted. Expert researchers established a taxonomy for adversarial defenses, which provides solutions to address the security challenges in autonomous driving systems.

    赵帅, 张博渊, 石育澄, 翟洋, 韩亚洪, 胡清华

    2025, 26(4): 510-533. DOI: 10.1631/FITEE.2300867
    Abstract:自动驾驶系统(ADS)在机器学习领域受到广泛关注。借助深度神经网络(DNN),这些系统在面对环境重大不确定性时不仅展现满意性能,还能在没有外部干预情况下纠正系统故障。然而,由于深度神经网络易受对抗样本攻击,自动驾驶系统的脆弱性成为研究焦点。本文详细调查了当前自动驾驶系统存在的物理对抗漏洞。首先,根据部署限制将物理对抗攻击和防御方法分为3类:现实世界、仿真世界及数字世界。分析自动驾驶系统中不同传感器的对抗攻击,将其分为基于摄像头的攻击、基于激光雷达(LiDAR)的攻击及基于多传感器融合的攻击。根据交通元素将攻击任务分类。对于物理防御,以图像预处理、对抗检测和模型增强防御为基础,为深度神经网络模型建立一个全面的防御体系。最终讨论了该研究领域面临的挑战,并展望未来发展方向。  
    Keywords:Physical adversarial attacks;Physical adversarial defenses;Artificial intelligence safety;深度学习;Autonomous driving system;Data-fusion;Adversarial vulnerability   
    20
    |
    2
    |
    0
    <HTML>
    <网络PDF><Meta-XML>
    <Citation> <Bulk Citation> 99550236 false
    Updated:2025-05-06
  • 常规文章

    In the field of natural language processing, event extraction research has made significant progress. Experts have proposed an adaptive learning method with a reward-penalty mechanism to address the challenges of polysemy in triggers and arguments, laying a foundation for the construction of an event extraction system.

    李海莉, 田植良, 王晓东, 周云彦, 潘世龙, 周杰, 徐秋波, 李东升

    2025, 26(4): 534-555. DOI: 10.1631/FITEE.2400220
    Abstract:事件抽取是一项复杂的自然语言处理任务,旨在从非结构化文本中识别触发词和论元并分类。触发词和论元的多义性是影响事件抽取准确性的关键挑战之一。现有方法通常认为触发词和论元中多种语义是均衡分布的。然而,在实际应用场景中,同一触发词或论元中不同语义的样本数量存在差异,导致语义分布具有偏向性。这种偏向性为事件的准确抽取带来两个挑战:低频语义的漏判和高频语义的误判。为解决这些挑战,提出一种自适应的语义学习方法,通过采用奖惩机制平衡多义触发词和论元的语义分布。奖惩机制通过奖励正确分类和惩罚错误分类减小高低频语义之间的差异程度,同时扩大目标语义和非目标语义之间的差距,以平衡语义分布。此外,提出句子级事件情境感知机制,引导编码器准确学习句子中提及的事件知识,为多义触发词和论元提供准确的预测事件语义增强。最后,针对不同任务中的各种语义,提出特定任务的语义解码器,精确识别该语义的预测触发词和论元的边界。在ACE2005及其变体以及ERE基准上的实验结果表明,本文的方法优于所有单任务和多任务事件抽取基线。  
    Keywords:事件抽取;Polysemous triggers;Polysemous arguments;Semantic imbalance;Reward–penalty mechanism   
    11
    |
    3
    |
    0
    <HTML>
    <网络PDF><Meta-XML>
    <Citation> <Bulk Citation> 99550233 false
    Updated:2025-05-06
  • 常规文章

    In the field of semi-supervised sound event detection, researchers have proposed an efficient semi-supervised class distribution learning method through dynamic prompt tuning, named prompting class distribution optimization (PADO). PADO dynamically incorporates independent learnable prompt tokens to explore prior knowledge about the true distribution, achieving class distribution optimization while maintaining model generalization, leading to a significant improvement in the efficiency of class distribution learning.

    高利剑, 朱青, 沈雅馨, 毛启容, 詹永照

    2025, 26(4): 556-567. DOI: 10.1631/FITEE.2400061
    Abstract:半监督声音事件检测任务通常利用大规模无标签数据和合成数据提升模型的泛化能力,从而有效降低模型在少量有标注数据上的过拟合。然而,泛化训练过程通常伴随伪标签噪声和域知识差异造成的干扰。为缓解半噪声干扰类分布学习的问题,提出一种基于动态提示优化的半监督类分布学习方法(PADO)。具体而言,当给定真实标签数据时,PADO动态嵌入一组可学习的独立参数(类令牌)以挖掘真实分布的先验知识,作为额外提示信息,与带噪后验分布知识动态交互,从而实现类分布知识的优化,并保留模型泛化性能。基于此,PADO能够显著提升类分布学习效率。在DCASE 2019、2020及2021数据集上的实验结果表明,PADO明显优于当前先进方法,且易于迁移至其他主流模型。  
    Keywords:Prompt tuning;Class distribution learning;半监督学习;Sound event detection   
    18
    |
    3
    |
    0
    <HTML>
    <网络PDF><Meta-XML>
    <Citation> <Bulk Citation> 99550235 false
    Updated:2025-05-06
  • 常规文章

    In the fiercely competitive landscape of product-oriented operating systems, including the Internet of Things (IoT), efficiently managing a substantial stream of real-time tasks coexisting with resource-intensive user applications embedded in constrained hardware presents a significant challenge. Bridging the gap between embedded and general-purpose operating systems, we introduce XIRAC, an optimized operating system shaped by information-theory principles. Expert established the XIRAC system, which provides solutions to solve the problem of efficiently managing real-time tasks coexisting with resource-intensive user applications embedded in constrained hardware.

    Alireza ZIRAK

    2025, 26(4): 568-587. DOI: 10.1631/FITEE.2400102
    Abstract:在受限硬件环境下,包括物联网在内的面向产品的操作系统面临着难以同时高效管理海量实时任务并执行资源密集型应用的重大挑战。为弥补该类嵌入式操作系统与通用操作系统的性能鸿沟,在信息论指导下,本文构建了一种优化的实时操作系统XIRAC。XIRAC利用香农信息论来调节处理器的工作负载,最大限度减少上下文切换,并通过最大化系统熵容限实现进程抢占。与以往仅将信息论用于任务优先级匹配的方法不同,XIRAC将最大熵集成到实时操作系统(RTOS)与调度算法的内核中。随后,将若干常见的无限制任务从应用层迁移至系统内核,以优化海量的系统参数。描述了这种架构转变的优势,包括优化的系统性能、可扩展性和适应性。从这种集成中衍生出一种新兴编程范式,称为“对象模拟编程”。XIRAC在多种产品中的实际应用展示了更多优势,包括缩短学习曲线、消除对库函数和线程的依赖、优化芯片潜能、提高产品开发的竞争力。本文对上述优势进行了全面总结,并通过实际案例与应用探讨了其影响。  
    Keywords:任务调度;信息论;Embedded real-time operating system (RTOS);Maximum entropy;负载均衡   
    17
    |
    3
    |
    0
    <HTML>
    <网络PDF><Meta-XML>
    <Citation> <Bulk Citation> 99179933 false
    Updated:2025-05-06
  • 常规文章

    In the field of grant-free massive machine-type communication systems, sparsity-based joint active user detection and channel estimation algorithms are crucial. Expert proposed an efficient difference-of-convex function algorithm based JADCE algorithm with multiple measurement vector frameworks, promoting the row-sparsity of the channel matrix, which provides solutions to solve active user detection and channel estimation problems.

    朱丽君, 刘开晖, 万良田, 孙璐, 熊一枫

    2025, 26(4): 588-604. DOI: 10.1631/FITEE.2400035
    Abstract:在免授权的大规模机器类型通信(mMTC)系统中,基于稀疏的联合活跃用户检测和信道估计(JADCE)算法至关重要。传统的压缩感知算法适用于非相干通信系统,其中任意两个测量之间的相关性尽可能小。然而,现有的基于稀疏的JADCE方法在强相干系统中可能无法达到最佳性能,尤其是在少量导频子载波的情况下。为解决这一问题,通过利用大规模多输入多输出正交频分复用(MIMO-OFDM)系统中毫米波信道的块状行稀疏结构,我们将JADCE建模为一个基于多测量向量(MMV)框架的联合稀疏信号恢复问题。然后,从凸差(DC)优化视角提出一种基于凸差算法(DCA)的高效JADCE方法。为进一步降低算法的计算复杂度,引入一种近端算子实现了基于DCA的快速JADCE算法,该算法采用低复杂度的交替方向乘子法(ADMM)直接解决优化问题。仿真实验结果表明,与现有基于压缩感知的JADCE方法相比,本文所提出的两种凸差算法实现了有效的活跃用户检测和精确的信道估计。  
    Keywords:Joint active user detection and channel estimation;Massive machine-type communications;Difference-of-convex function algorithm;Alternating direction multiplier method   
    10
    |
    3
    |
    0
    <HTML>
    <网络PDF><Meta-XML>
    <Citation> <Bulk Citation> 99550298 false
    Updated:2025-05-06
SEE MORE

视频资源

  • 2023年第1期 国家并行计算机工程与技术研究中心 何晓斌、陈鑫等| 面对E级超算系统的可扩展性和效率挑战:神威E级原型系统并行支撑环境的实践 00:02:51

    2023年第1期 国家并行计算机工程与技术研究中心 何晓斌、陈鑫等| 面对E级超算系统的可扩展性和效率挑战:神威E级原型系统并行支撑环境的实践

    2023-12-30
    Play Total: 22
  • 2023年第6期 北邮张平、许晓东等 | 面向语义通信的模分多址技术 00:02:30

    2023年第6期 北邮张平、许晓东等 | 面向语义通信的模分多址技术

    2023-12-30
    Play Total: 11
  • 2022年第10期 清华季新生、邬江兴等 | 6G网络内生安全新范式探讨 00:02:15

    2022年第10期 清华季新生、邬江兴等 | 6G网络内生安全新范式探讨

    2023-12-30
    Play Total: 0
  • 2022年第12期 国防科大苏金树、赵宝康等 | 大规模高效网络计算中的网络技术发展趋势 00:02:22

    2022年第12期 国防科大苏金树、赵宝康等 | 大规模高效网络计算中的网络技术发展趋势

    2023-12-30
    Play Total: 2
  • 2022年第6期 国防科大邵明天、卢凯等|面向高性能计算的自部署运行环境 00:02:48

    2022年第6期 国防科大邵明天、卢凯等|面向高性能计算的自部署运行环境

    2022-08-03
    Play Total: 7
  • 2022年第2期 浙大魏斌、况琨等 | 一种智慧法院的全流程智能化审判系统 00:02:24

    2022年第2期 浙大魏斌、况琨等 | 一种智慧法院的全流程智能化审判系统

    2022-05-17
    Play Total: 7
  • 2022年第3期 数学工程与先进计算国家重点实验室麻荣宽、魏强等 | 基于动态污点分析的工业控制系统协议自动逆向工程分析 00:02:37

    2022年第3期 数学工程与先进计算国家重点实验室麻荣宽、魏强等 | 基于动态污点分析的工业控制系统协议自动逆向工程分析

    2022-05-17
    Play Total: 4
  • P1 段宝岩院士致辞 00:05:36

    P1 段宝岩院士致辞

    2022-04-17
    Play Total: 9
  • P2 西电盛敏教授致辞 00:02:27

    P2 西电盛敏教授致辞

    2022-04-17
    Play Total: 6
  • P3 西电李云松教授致辞 00:02:37

    P3 西电李云松教授致辞

    2022-04-17
    Play Total: 10
SEE MORE

0