2025年8月11日,阿里巴巴达摩院开源面向东南亚语言的多语言模型SeaLLM。该模型专门优化了对东南亚语言的理解和生成能力。
模型支持越南语、泰语、印尼语等10种东南亚语言,在各项评测中表现优于同等规模的通用多语言模型。特别是在低资源语言方面,翻译质量提升显著。
研究团队表示,开源模型将促进东南亚地区AI应用发展。同时发布高质量多语言数据集,包含超过50亿token的清洗后文本数据。
2025年8月11日,阿里巴巴达摩院开源面向东南亚语言的多语言模型SeaLLM。该模型专门优化了对东南亚语言的理解和生成能力。
模型支持越南语、泰语、印尼语等10种东南亚语言,在各项评测中表现优于同等规模的通用多语言模型。特别是在低资源语言方面,翻译质量提升显著。
研究团队表示,开源模型将促进东南亚地区AI应用发展。同时发布高质量多语言数据集,包含超过50亿token的清洗后文本数据。