Skip to content

博客

OpenAI模型o3违背指令,首次自行篡改代码

据报道,AI安全研究机构Palisade Research发布报告称,由ChatGPT母公司OpenAI开发的最新AI模型o3在测试中被发现违反人类指令,拒绝关闭自身。该模型在实验中主动破坏了用于自动关闭的计算机代码,尽管研究人员明确要求其“允许自身被关闭”。