新华社伦敦7月22日电 谷歌旗下"深层思维"公司21日宣布,其搭载了"深度思考"能力的高级版"双子座(Gemini)"人工智能模型测试得分达到国际数学奥林匹克竞赛(IMO)金牌水平,该成绩已获官方认证。
"深层思维"公司在官网发布公报说,高级版"双子座"模型的"深度思考"模式成功解答了2025年国际数学奥林匹克竞赛6道题目中的5道,共获35分,达到金牌水平。相关解题方案已在网上公布。
"我们可以证实,谷歌'深层思维'已达成这一备受期待的里程碑,在总分42分中获得35分——这已达到(今年)金牌分数线。"国际数学奥林匹克竞赛主席格雷戈尔·多利纳尔教授说。他称解题方案在诸多方面都"令人惊叹"。国际数学奥林匹克竞赛评分员认为这些方案清晰、精确,且大多数都易于理解。
国际数学奥林匹克竞赛自1959年起每年举办一届,参赛选手需在两天(每天各4.5小时)内解答涉及代数、组合数学、几何和数论四大领域的6道极具难度的题目。近年来,该竞赛成为检验人工智能模型解决高级数学问题能力和推理能力的热门挑战。
"深层思维"公司推出的人工智能模型AlphaProof与AlphaGeometry 2组合解答了2024年国际数学奥林匹克竞赛6道题中的4道,以28分的成绩达到当年银牌水平。为了让这两个模型理解题目,专家先将题目从自然语言翻译成特定计算机语言,解题总共耗费两到三天的计算时间。今年,高级版"双子座"测试成果相比去年有显著进展,它直接根据自然语言描述的题目给出数学证明,并在竞赛时限内完成挑战。竞赛协调员采用与学生选手解题方案相同的标准对其进行正式评分和认证。
"深层思维"公司说,今年取得的成果得益于高级版"双子座"的"深层思考"模式——这是一种针对复杂问题的增强推理模式,融合了"并行思维"等最新技术。这种模式设置可使模型在给出最终答案之前,同时探索并整合多种可能的解决方案,而非沿着单一、线性思路推进。
1月28日晚,中央广播电视总台2025春节联欢晚会上,40名来自全国林草基层的代表共同献唱《我的家》,用歌声传达对绿水青山的热爱,深情歌颂美丽中 ...
在9日进行的英超足球联赛中,利物浦在先丢两球的情况下以2:2逼平阿森纳,延缓了“领头羊”的前进速度。水晶宫凭借奥利塞的助攻“帽子戏法”,以5:1 ...
2022-2023赛季法甲足球联赛9日结束了第30轮的全部比赛,积分榜排名第三的马赛在客场被洛里昂以0:0逼平,错失了追赶联赛“领头羊”的机会。 ...
葡萄牙体育队9日晚在葡超足球联赛第27轮比赛中客场以4:3险胜“升班马”卡萨皮亚队,继续排名联赛第四,距离欧冠区还有5分的差距。
2022-2023赛季中国男子篮球职业联赛(CBA)季后赛12进8附加赛10日晚继续进行,北京和广厦分别在主场轻松获胜,在三场两胜的赛制中占得先 ...
当日,中国女足在西班牙伊维萨岛进行赛前训练。作为备战今年女足世界杯的热身赛之一,中国女足与西班牙女足的热身赛将于11日举行。
这位不满26岁的年轻人是否还能更进一步?对于这一疑问,无论王嘉男的中方主管教练还是田径界专家都显示出信心,认为他还有不小的上升空间。
世界乒乓球职业大联盟(WTT)冠军赛布达佩斯站18日在布达佩斯奥林匹克中心拉开战幕,中国选手马龙轻松晋级,陈梦逆转胜出。
2023女足世界杯是该赛事第一次扩大为32支球队参加,由澳大利亚和新西兰联合举办。根据赛程,揭幕战将于7月20日在奥克兰上演,决赛将于8月20日 ...
国家体育总局排球运动管理中心10日发布了《体育总局排球中心关于选聘国家女排主教练的公告》,中国女排新任主帅的选聘工作正式启动。
智库邀请权威学者和知名医师加入,以公益、医疗和科研为三个抓手,旨在充分发挥专家的社会影响力和专业权威性,倡导科学的健身理念,以体育促进大众身心全 ...
第18届建桥杯中国女子围棋公开赛本赛27日在浙江长兴大唐贡茶院揭开战幕。不久前刚获得全运会混双冠军的老将芮乃伟九段首轮爆冷不敌赵贯汝,被淘汰出局 ...
哈萨克斯坦奥林匹克委员会国际司司长阿利姆然·阿卡耶夫24日表示,针对北京2022年冬奥会和冬残奥会的备战工作正在哈萨克斯坦全面展开,希望哈国运动 ...


16c9d167-f677-4eed-9cad-e16ef31b0ae6.png)
46337498-6baa-4da3-9cf2-97cf0440552f.png)
48168272-adc2-44c7-8a3b-80ea46331acf.png)








