DeepMind发布Gemini Ultra,多项基准测试超越GPT-4

    **谷歌DeepMind正式发布Gemini Ultra**,这一最新的大语言模型在多项权威基准测试中超越了GPT-4,标志着AI大模型竞争进入新阶段。

    **Gemini Ultra**采用了革命性的**多专家混合(MoE)架构**,拥有超过**1.5万亿参数**,在推理能力、创造力和多模态理解方面都达到了新的高度。

    **基准测试成绩:**
    • **MMLU测试**:准确率达到90.0%(GPT-4为86.4%)
    • **代码生成**:HumanEval得分74.4%
    • **数学推理**:GSM8K准确率94.4%
    • **阅读理解**:多项测试均创新纪录

    特别值得注意的是,Gemini Ultra在**多模态任务**中表现卓越,能够同时处理文本、图像、音频和视频输入,并生成高质量的**跨模态内容**。

    **DeepMind CEO德米斯·哈萨比斯**表示:"Gemini Ultra代表了我们在**通用人工智能**研究方面的最新成果,它展现出了接近人类专家水平的能力。"

    **实际应用测试**显示,Gemini Ultra在**科学研究、创意写作、复杂推理**等领域都表现出了超越以往AI系统的能力。特别是在处理**多步骤复杂问题**时展现出了强大的逻辑思维。

    **商业化计划**:谷歌宣布Gemini Ultra将首先通过**Google Bard Advanced**向付费用户开放,月费**20美元**。

    **行业震动**,OpenAI、微软等竞争对手纷纷表示将加快下一代模型的研发进度。分析师认为这将引发新一轮的**AI军备竞赛**。
返回AI新闻列表