谷歌Bard集成Gemini Pro,多模态AI助手能力全面升级

11月4日最新消息,谷歌正式宣布将其最新的Gemini Pro模型集成到Bard AI助手中,这标志着谷歌在多模态人工智能领域的重大突破。新版Bard现在可以同时理解和生成文本、图像、音频和视频内容。

据谷歌AI部门负责人介绍,集成Gemini Pro后的Bard在图像理解任务中的准确率提升了40%,能够准确识别图片中的复杂场景、文字和对象。用户现在可以上传图片并要求Bard进行详细分析、生成相关内容或回答相关问题。

在实际测试中,新版Bard展现出了强大的跨模态推理能力。它不仅能够描述图像内容,还能基于图像信息进行创作和问答。例如,用户可以上传一张风景照片,Bard能够生成相应的诗歌、故事或旅游攻略。

业内分析师指出,这一升级将显著提升谷歌在AI助手市场的竞争力,特别是在教育、创意设计和商业分析等需要多模态交互的场景中。谷歌表示,新功能将在未来几周内向全球用户逐步开放。

返回AI新闻列表