Anthropic发文称,Claude Fable 5 将于明天全球重新上线。在与美国政府进行一系列富有成效的对话后,我们将使用一组新的分类器重新部署该模型,以针对并阻止更多网络安全任务。在短期内,一些常规任务如编码和调试将回退至 Opus 4.8。我们将在未来几周继续优化这些分类器,以减少误报,并更好地区分真正的滥用与合法请求。我们还已开始起草一个共识框架——与亚马逊、微软、谷歌以及其他 Glasswing 合作伙伴一起——用于评估 AI 越狱的严重程度,以及 AI 开发者应如何应对。我们邀请其他行业合作伙伴和模型提供商加入这项努力。最后,我们正在扩大与美国政府在模型测试和防护措施方面的合作。这将包括模型和防护措施的预发布访问权限,用于评估;关于越狱和滥用的信息共享;以及联合研究的专用资源。感谢我们的用户们的耐心,以及政府、行业和研究社区的合作伙伴们,他们与我们并肩工作,使 Fable 5 能够重新上线。
行业
Anthropic:Claude Fable 5 将于明天全球重新上线
Anthropic发文称,Claude Fable 5 将于明天全球重新上线。在与美国政府进行一系列富有成效的对话后,我们将使用一组新的分类器重新部署该模型,以针对并阻止更多网络安全任务。在短期内,一些常规任务如编码和调试将回退至 Opus 4.8。我们将在未来几周继续优化这些分类器,以减少误报,并更好地区分真正的滥用与合法请求。我们还已开始起草一个共识框架...