Comment: OpenAI、Anthropic互评对方AI模型：GPT存在谄媚行为，Claude不易产生幻觉

评论：OpenAI、Anthropic互评对方AI模型：GPT存在谄媚行为，Claude不易产生幻觉

内容简介：8 月 28 日消息，据外媒 Engadget 今日报道，OpenAI 和 Anthropic 共同宣布，同意评估彼此公开系统的安全对齐情况，并共享分析结果。总体来看，两家公司产品各有缺陷，也提供了改进未来安全测试的思路。 Anthropic 表示，它评估了 OpenAI 模型在谄媚、告密、自我保护、支持人类滥用，以及破坏 AI 安全评估和监管相关能力方面的表现。评估显示，OpenAI 的 o3...

用户评论

科技前沿网

chucklefeed

脉脉：中国AI工程师工作性价比高于美国同行

Google发布Gemini 3大模型，性能远超GPT

一周AI大事件：谷歌“杀红了眼”夺回王座，奥特曼罕见承认：正在追赶

TikTok 将开放用户设置，减少短视频信息流中的 AI 内容

外骨骼机器人“助老”效果如何？知乎答主评审团做了一场硬核评测

绚星智慧科技发布《AI驱动的组织与业务重构白皮书》