字节跳动发布豆包大模型商业版,主打多模态应用

9月11日,字节跳动正式发布豆包大模型的商业版本,该版本重点强化了多模态处理能力,能够同时处理文本、图像、音频和视频等多种类型的输入。

豆包商业版的核心优势体现在内容创作领域,特别是短视频制作、图文创作、音频生成等方面。该模型能够根据用户描述自动生成视频脚本、配音、字幕和背景音乐,大幅提升内容创作效率。

在技术指标方面,豆包商业版在多模态理解任务中的准确率达到了92.3%,在视频内容理解方面表现尤为突出。该模型还支持实时处理,能够实现低延迟的多媒体内容生成。

字节跳动AI Lab负责人表示,豆包商业版将优先服务于内容创作者和媒体机构,预计在2024年底前将有超过1万名创作者使用该平台。业界认为,这将进一步推动AI在创意产业的应用发展。

返回AI新闻列表