11月19日重磅发布,Google DeepMind正式发布Gemini Ultra模型,这是目前最强大的多模态AI系统之一。Gemini Ultra在文本理解、图像识别、代码生成等多个领域都达到了业界领先水平,标志着多模态AI技术的重大突破。
在标准化测试中,Gemini Ultra在MMLU(大规模多任务语言理解)基准上获得了90.0%的得分,成为首个超过人类专家水平的AI模型。在代码生成、数学推理和多模态理解等任务中也表现出色,全面超越了现有的AI系统。
Gemini Ultra的一个突出特点是其原生多模态设计,能够无缝处理文本、图像、音频和视频等多种输入形式。这使得模型在复杂的现实世界任务中表现更加出色,例如能够理解包含图表的科学论文、分析视频内容等。
DeepMind CEO德米斯·哈萨比斯表示,Gemini Ultra代表了通向通用人工智能的重要一步。该模型将首先通过Google的Bard Advanced服务向用户提供,并将逐步集成到Google的各项产品和服务中。这一发布预示着AI技术正朝着更加智能和通用的方向发展。