这段时间,一款名叫ChatGPT的人工智能聊天系统就像平地起春雷,突然刷爆网络。
“从目前普遍的对话感受来看,ChatGPT的最大亮点就在于其优秀的意图识别与语言理解能力,这令人意识到人工智能的交互能力已经实现了跨越式进展。”易观智慧院高级分析师陈晨评价。
有问必答,侃侃应对。这种神奇的人机互动体验,勾起人们绞尽脑汁向ChatGPT提问的热情,并为其带来惊人的用户量:该系统在两个多月前由美国人工智能研究公司OpenAI推出,今年1月便已达到1亿月活跃用户,用户增长速度堪称史无前例。
这款产品大受欢迎,其重要幕后功臣是被业内称为预训练模型的技术。面对ChatGPT的爆火,国内科技机构和企业纷纷“亮剑”。据最新消息,中国版ChatGPT将于下个月与公众见面。
参数规模从几百万狂飙至几千亿
“目前,预训练技术是人工智能研究的重要突破口。”阿里研究院未来技术中心负责人苏中解读,传统的研究方法中,标注成本一直是阻碍人工智能算法推向更大数据集合的障碍,而预训练技术不依赖数据标注,就可以训练出一个大规模深度学习模型。
科技日报记者了解到,由于不需要数据标注,预训练模型往往可以使用更大的数据集,因而可以选择更大的模型规模——这就催生了预训练大模型。
“与以往的人工神经网络相比,预训练大模型最大的不同在于它规模足够大,深度学习网络的层数多、连接多、参数多。”IDEA研究院(粤港澳大湾区数字经济研究院)认知计算与自然语言研究中心讲席科学家张家兴接受记者采访时介绍,2012年前后的深度学习网络只有几百万参数;2018年前后主流的预训练模型达到1亿参数;目前被证明非常有效的大规模预训练模型已有几千亿参数,短短几年时间提升了几千倍。
量变引起质变。苏中分析,在对预训练模型各种不同的技术评测中,算法性能展示了一个规律:数据规模越大、预训练模型参数越多,算法输出精度往往也越高。
除了规模大以外,张家兴谈到,目前的预训练大模型由于采用了新的结构模型,非常适合并行训练。同时,在训练方式上,人工神经网络的预训练任务类似“解题”,比如把一句话的某个词或前半句去掉,让预训练模型利用海量大数据对句子进行恢复,这样训练下去,预训练模型的“解题”能力就会越来越好。而且,在大语言模型的基础上,引入指令学习,可以远超模型微调带来的收益。在此基础上,人类的反馈可以帮助模型更好地理解人类意图和接收信息,人机对话也就越来越流畅。
“ChatGPT在底层数据、核心技术、用户体验等各方面都可以说是里程碑式的人工智能产品。”旷视研究院基础科研负责人张祥雨表示,ChatGPT的核心技术是人工智能语言大模型,其关键是如何让人工智能模型具备逻辑推理能力,以及如何让人工智能学习全互联网的知识。这些ChatGPT基本都做到了,因此在决策和知识环节有了很大的突破。
国内多家科技机构已布局相关领域
据外媒报道,多家国外科技巨头正重金投入预训练模型和人工智能生成内容(AIGC)赛道。记者了解到,国内已有不少科技机构和企业布局相关领域。
张家兴告诉记者,IDEA研究院认知计算与自然语言研究中心在此方向上布局已久,该中心拥有国内最大的开源模型体系——封神榜,已开源的98个模型正在全力支持中国AIGC的发展,探索研发适配各个领域的个性化可定制模型,支持全部自然语言处理(NLP)任务。
“很高兴能在深度学习高速发展的第十年节点上,看到AIGC和ChatGPT的出现,今天所有这些自然语言处理任务正在被统一到ChatGPT模式下,我们也正在整合之前的模型和技术,推出我们的类ChatGPT模型。”张家兴说。
记者从百度获悉,百度已投入开发类似ChatGPT的相关技术,该项目名字确定为文心一言,英文名ERNIE Bot,3月份完成内测后面向公众开放。目前,文心一言在做上线前的冲刺。
“ChatGPT主要涉及自然语言处理相关技术,属于认知智能领域的应用之一,科大讯飞在该方向的技术和应用方面具备长期深厚的积累。”2月8日晚,科大讯飞在投资者互动平台回应称,公司已面向认知智能领域陆续开源了6大类、超过40个通用领域的系列中文预训练语言模型,并于去年12月启动生成式预训练大模型任务攻关,人工智能学习机将成为该项技术率先落地的产品,今年5月将进行产品级发布。
此外,360公司2月7日在投资者互动平台表示,该公司也计划尽快推出类ChatGPT技术的原型版产品。“AIGC技术除了在搜索引擎的应用之外,还可以辅助数字安全能力的提升。”360公司称。(记者 刘园园)(记者操秀英、刘艳对此文亦有贡献)
2024年闽台艺术青年音乐会开幕,本次音乐会由省文旅厅主办,是第九届福建艺术节和两岸艺术青年欢乐汇的重要配套活动。
8月19日,民族歌剧《山海情》点映座谈会在福州举行。演出第一幕,一段混声合唱就将观众带到了贫瘠的戈壁滩。
日前,福建京剧院新编现代京剧《连家灯火》在福州凤凰剧院上演,用京剧艺术的形式推动党的二十届三中全会精神深入人心,讴歌新中国成立75年来的辉煌成就 ...
在9日进行的英超足球联赛中,利物浦在先丢两球的情况下以2:2逼平阿森纳,延缓了“领头羊”的前进速度。水晶宫凭借奥利塞的助攻“帽子戏法”,以5:1 ...
2022-2023赛季法甲足球联赛9日结束了第30轮的全部比赛,积分榜排名第三的马赛在客场被洛里昂以0:0逼平,错失了追赶联赛“领头羊”的机会。 ...
葡萄牙体育队9日晚在葡超足球联赛第27轮比赛中客场以4:3险胜“升班马”卡萨皮亚队,继续排名联赛第四,距离欧冠区还有5分的差距。
2022-2023赛季中国男子篮球职业联赛(CBA)季后赛12进8附加赛10日晚继续进行,北京和广厦分别在主场轻松获胜,在三场两胜的赛制中占得先 ...
当日,中国女足在西班牙伊维萨岛进行赛前训练。作为备战今年女足世界杯的热身赛之一,中国女足与西班牙女足的热身赛将于11日举行。
这位不满26岁的年轻人是否还能更进一步?对于这一疑问,无论王嘉男的中方主管教练还是田径界专家都显示出信心,认为他还有不小的上升空间。
世界乒乓球职业大联盟(WTT)冠军赛布达佩斯站18日在布达佩斯奥林匹克中心拉开战幕,中国选手马龙轻松晋级,陈梦逆转胜出。
2023女足世界杯是该赛事第一次扩大为32支球队参加,由澳大利亚和新西兰联合举办。根据赛程,揭幕战将于7月20日在奥克兰上演,决赛将于8月20日 ...
国家体育总局排球运动管理中心10日发布了《体育总局排球中心关于选聘国家女排主教练的公告》,中国女排新任主帅的选聘工作正式启动。
根据赛程,四个小项的短节目和韵律舞比赛将于14日展开,15日进入自由滑和自由舞比拼,16日则将按照国际赛事惯例进行表演滑。
智库邀请权威学者和知名医师加入,以公益、医疗和科研为三个抓手,旨在充分发挥专家的社会影响力和专业权威性,倡导科学的健身理念,以体育促进大众身心全 ...
“看人,要找人防守,上来阻挡一下。”在广西天等县小山乡中心小学的运动场上,体育老师张世强盯着队员们训练时的跑动情况,不时提醒。
第18届建桥杯中国女子围棋公开赛本赛27日在浙江长兴大唐贡茶院揭开战幕。不久前刚获得全运会混双冠军的老将芮乃伟九段首轮爆冷不敌赵贯汝,被淘汰出局 ...
哈萨克斯坦奥林匹克委员会国际司司长阿利姆然·阿卡耶夫24日表示,针对北京2022年冬奥会和冬残奥会的备战工作正在哈萨克斯坦全面展开,希望哈国运动 ...