OpenAI 发布 GPT-4o 模型卡：概述 AI 安全和风险缓解措施

OpenAI 发布 GPT-4o 模型卡：概述 AI 安全和风险缓解措施快讯

IT之家 2024-08-10 13:22

分享到：

导读

除了针对 GPT-4 和 GPT-4V 进行的安全评估和缓解措施外，OpenAI 表示 GPT-4o 模型的核心就是准备框架（Preparedness Framework），OpenAI 在模型和系统层面都实施了保障措施。

IT之家 8 月 10 日消息，OpenAI 公司于 8 月 8 日发布报告，概述了 GPT-4o 模型的系统卡（System Card），介绍了包括外部红队（模拟敌人攻击）、准备框架（Preparedness Framework）在内的诸多细节。

OpenAI 表示 GPT-4o 模型的核心就是准备框架（Preparedness Framework），这是一种评估和降低人工智能系统相关风险的系统方法。IT之家从报道中获悉，该框架主要用于识别网络安全、生物威胁、说服和模型自主性等领域的潜在危险。

除了针对 GPT-4 和 GPT-4V 进行的安全评估和缓解措施外，OpenAI 还针对 GPT-4o 的音频功能开展了更多安全工作。

评估的风险包括扬声器识别、未经授权的语音生成、受版权保护内容的潜在生成、无根据推断以及不允许的内容。基于这些评估结果，OpenAI 在模型和系统层面都实施了保障措施。

OpenAI 还与 100 多名外部红队人员合作，在向公众发布模型之前对其进行评估。红队人员将进行探索性的能力发现，评估模型带来的新的潜在风险，并对缓解措施进行压力测试。

模型评估 OpenAI GPT- 系统

分享到：

1.TMT观察网遵循行业规范，任何转载的稿件都会明确标注作者和来源；
2.TMT观察网的原创文章，请转载时务必注明文章作者和"来源：TMT观察网"，不尊重原创的行为TMT观察网或将追究责任；
3.作者投稿可能会经TMT观察网编辑修改或补充。