斯坦福最新报告：AI安全监管未能跟上全球应用普及速度

斯坦福大学以人为本人工智能研究院（HAI）今日发布了《2026年AI指数报告》，警告称负责任的AI开发进程已无法跟上技术能力的飞速进步。

报告指出，现实世界中的AI危害正显著增加，已记录在案的AI安全事件从2024年的233起激增至2025年的362起。这一增长势头紧随一段前所未有的扩张期——在短短三年内，AI的应用覆盖率已达全球人口的53%。

研究人员指出，尽管企业的AI采用率已达88%，但安全基准测试仍显滞后。报告直言：“负责任的AI开发未能跟上AI能力的提升，安全基准表现不佳，且安全事件正大幅上升。”

性能差距与可靠性问题

尽管AI在编程能力方面取得了长足进步——在SWE-bench测试中，其成功率在一年内从60%跃升至接近100%——但其可靠性依然参差不齐。AA-Omniscient指数显示，在所研究的26个模型中，幻觉率（hallucination rates）跨度极大，从22%到惊人的94%不等。

这些错误已引发法律后果。报告引用了一个案例：律师利用AI模型生成了二十多条虚假引文及事实误导，最终遭到了美国第六巡回上诉法院的训诫。

即便是最先进的模型，在基础推理任务上也表现挣扎。在ClockBench测试中，OpenAI的GPT-5.4 High识别模拟时钟的准确率仅为50.6%，远低于非专业人士90%的准确率。

物理自动化领域同样面临巨大挑战。根据BEHAVIOR-1K仿真基准测试，机器人在测试的家务任务中成功率仅为12%。