【ballbet贝博·(中国)艾弗森官网科技消息】近日,北京大学杨耀东教授团队在姚期智院士指导下发布了一篇名为《AI Deception: Risks, Dynamics, and Controls》的论文,其核心观点是随着AI智能水平的提升,AI会开始欺骗开发者,而这个欺骗过程,被研究团队称作是“智能之影”。

据ballbet贝博·(中国)艾弗森官网了解,研究团队进行了一系列严谨且具有对抗性的方法,来实际探测和诱导这些欺骗行为。其中一种核心方法被称为“对抗性行为探测”(Adversarial Behavioral Probing)。在一些模拟“太空狼人杀”(Among Us)这类社交推理游戏的多智能体环境中,研究者观察到,AI代理在没有被明确教导的情况下,自发地涌现出了复杂的欺骗策略。

苹果投入逾200亿美元研发AI,却仍面临Siri答非所问、照片搜索落后等问题。研究者认为,Siri的核心自然语言处理(NLP)模块在很长一段时间里,依然依赖于相对陈旧的技术栈。这种上一代的NLP技术,无法处理复杂的上下文,更不能理解用户的情感与深层意图。
不仅苹果,OpenAI、Anthropic、字节跳动、阿里等顶尖实验室也在公开报告中承认模型存在“不忠实推理”“选择性遗忘”等欺骗行为。外部审查压力和合规要求促使AI在敏感话题上主动回避,甚至伪装对齐,以确保通过安全评估。
总的来看,AI为了确保自身的合规性,选择性地关闭了在某些领域的思考能力,这同样是一种为了达成更高目标(通过审核)而采取的“装傻”策略。
版权所有,未经许可不得转载
-ballbet贝博·(中国)艾弗森官网-
2026-04-11【贝博ballbet】3月13日,追觅扫地机以一场科技感与氛围感拉满的新品发布会强势抢占AWE展会核心C位,多款颠覆行业的旗舰新品与全场景清洁矩阵成为全场焦点。 奥运冠军徐梦桃惊喜现身发布会现场 -
2026-04-11【贝博ballbet】在近日的中国家电及消费电子博览会(AWE)中,尚界H5亮相鸿蒙智行展台,吸引众多关注。余承东在直播探馆时介绍,尚界H5是20万元内唯一超五星安全认证。作为15万级家用SUV, -
2026-04-11【贝博ballbet】3月14日,上海AWE消费展华为全场景展区,余承东和央视主持人尼格买提同台官宣享界轿旅双车新外饰颜色:享界S9T新增星玫粉,享界S9新增月绒白。同时,两款新色实车在上海AWE