2026年5月18-21日,第47届IEEE安全与隐私学术会议(IEEE Symposium on Security and Privacy,IEEE S&P)在美国加州旧金山市召开。我院助理教授秦悦作为共同通讯作者,与浙江大学、中关村实验室和清华大学合作完成的论文“Breaking Free from Ivory Tower: Evaluating and Enhancing Real-world Chinese Underground Adversarial Jargon Detection”已在IEEE S&P 2026正式发表。
论文聚焦于中文网络地下黑话通过对抗扰动规避内容审核、进而掩盖诈骗、赌博和非法交易等活动所带来的现实安全问题。针对既有研究主要围绕预算约束下的算法生成攻击展开、难以刻画真实地下生态中复杂规避策略的局限,本文构建了首个大规模真实场景中文对抗黑话数据集,揭示了此类黑话扰动强度高、变形形式多样、结构破坏严重等特征,以及由此引发的可读性下降、分词失效和检测困难等挑战。本文进一步发现,先进大语言模型如GPT-4o在真实对抗黑话识别、还原和非法内容检测任务中仍存在明显局限。为此,本文提出JADE框架,基于真实标注数据归纳对抗扰动模式分类体系,并融合数据增强、外部知识检索与内部参数微调,增强大语言模型对地下黑话扰动变体隐蔽语义的理解能力。此外,本文验证了该框架在有害文本检测与欺诈检测等下游任务中的迁移能力,体现了将结构化对抗知识与大语言模型推理能力相结合,以提升真实平台安全防御能力的应用价值。
会议介绍:
IEEE S&P(又称“Oakland”)是国际公认的网络与信息安全领域顶级学术会议,与ACM CCS、USENIX Security 和 NDSS 并称网络安全领域的“四大顶会”,被中国计算机学会(CCF)列为网络与信息安全领域 A 类国际会议。根据官方公布信息,IEEE S&P 2026录用率约为12.68%。
作者介绍:
秦悦现为中央财经大学信息学院助理教授,博士毕业于美国印第安纳大学伯明顿分校。其研究方向为人工智能安全,致力于通过数据驱动的方法识别和刻画人工智能系统以及复杂网络系统中的关键安全与隐私风险,并设计具备鲁棒性与隐私保护能力的实际可部署解决方案。相关成果已发表于多项国际高水平期刊与会议。
撰稿:秦悦
审核:高胜