Anthropic发布Claude 3.5,AI安全性和可控性达到新高度

AI安全领域的领军企业Anthropic发布了Claude 3.5模型,这是一个在安全性和可控性方面达到新高度的大语言模型。

Claude 3.5采用了Anthropic独创的Constitutional AI训练方法,通过让AI模型学习一套价值观和行为准则,显著提升了模型的安全性和可信度。

Anthropic CEO达里奥·阿莫代表示,"Claude 3.5不仅能力强大,更重要的是安全可靠"。在安全性测试中,该模型的有害内容生成率比同类模型降低了90%。

Claude 3.5在保持强大性能的同时,拒绝回答不当问题的准确率达到了98.5%。模型还具备了更好的价值观对齐能力,能够在复杂的道德判断场景中做出合理的决策。

该模型已经在多个对安全性要求极高的领域开始应用,包括医疗咨询、法律服务、教育辅导等。业界专家认为,Claude 3.5的发布为AI安全研究树立了新的标杆,将推动整个行业更加重视AI安全问题。

返回AI新闻列表