Claude 3.5采用了Anthropic独创的Constitutional AI训练方法,通过让AI模型学习一套价值观和行为准则,显著提升了模型的安全性和可信度。
Anthropic CEO达里奥·阿莫代表示,"Claude 3.5不仅能力强大,更重要的是安全可靠"。在安全性测试中,该模型的有害内容生成率比同类模型降低了90%。
Claude 3.5在保持强大性能的同时,拒绝回答不当问题的准确率达到了98.5%。模型还具备了更好的价值观对齐能力,能够在复杂的道德判断场景中做出合理的决策。
该模型已经在多个对安全性要求极高的领域开始应用,包括医疗咨询、法律服务、教育辅导等。业界专家认为,Claude 3.5的发布为AI安全研究树立了新的标杆,将推动整个行业更加重视AI安全问题。