简繁互换
设为首页
设为收藏
手机版
东南网 / 新闻频道 / 天下 / 即时新闻 / 正文

小词元撬动智能经济大市场

2026-04-03 08:58 人民日报 责任编辑:吴静

我国日均词元调用量突破140万亿,企业为提升效率付费意愿较强

小词元撬动智能经济大市场

词元(Token),大模型处理信息的最小信息单元。我国日均词元调用量大幅增长,不仅折射智能经济的澎湃活力,也意味着一套新型商业逻辑正在加速演进。智能时代,有了可计量、可定价、可交易的词元,人工智能有望成为像水、电一样支撑社会运转的基础资源。

用户端,查资料、写代码、改文案;企业端,金融风控、智能客服、代码修正……如今,人工智能应用落地的每一个场景,都离不开对词元(Token)的海量调用。

词元,大模型处理信息的最小信息单元。今年3月,中国日均词元调用量突破140万亿,两年增长超千倍。怎么理解词元?词元和人工智能产业的关系是什么,未来发展趋势如何?记者进行了采访。

词元调用量爆发性增长,背后是模型能力提升

有人疑惑,词元和常见的数据有何不同?

“人工智能大模型的本质是一套复杂的数学运算系统,它无法像人类一样直接读懂文字、听懂声音、看懂画面。”中国移动研究院网络与IT技术研究所副所长唐华斌说,人工智能大模型必须先将各类原始数据转化为自己能识别的“语言”,再通过运算输出结果,词元就是这套“语言”中最基础的单元。

具体来看,文字词元像“乐高积木”,一个单词或一个汉字被拆成一块块词元;音频词元像“乐谱上的音符”,一段声音被切成极短的时间片段,每一片包含音调、音量;视频词元像“拼图碎片”,每一帧画面被切成一个个小方格,并且还要考虑时间上的连续性……

“在大模型看来,三种模态的词元完全没有差别。在模型眼里,它不觉得自己是在读文字或看视频,它只觉得自己是在处理一串极其复杂的数字序列。”火山引擎智能算法负责人吴迪表示。

一个个基础的词元,构成了智能经济运行的“细胞”。今年3月,中国人工智能大模型周词元调用量连续3周占据领先地位,成为全球大模型应用活跃度最高的国家之一。

“词元调用量爆发性增长,最直接的原因是模型能力的提升。每一次模型能力的提升,就会解锁更多应用场景,从而使大模型词元调用量进一步激增。”吴迪介绍,以Seedance(豆包视频生成模型)2.0为例,生成1分钟视频大约会消耗超过100万个词元。

同时,新的应用形态、新的商业模式,也会驱动大模型词元调用量大幅上涨。唐华斌表示,最近兴起的智能体和传统单轮问答不一样,它的运行往往意味着更长的上下文、更频繁的模型调用、更多轮次的任务拆解,以及工具执行过程中的持续反馈。

“简单任务,如果只需要单轮或几轮工具调用就能搞定,消耗词元只需要几千;如果需要几十轮工具调用,则需要至少消耗几万词元乃至更多。”吴迪说,智能体等新业态的涌现,让词元调用量又进入了一个快速增长的通道。

词元调用集中在信息密度高、迭代周期快的领域

60亿,是爱问答科技创始人李加义过去一年的词元调用量。

走进位于北京海淀区的AI原点社区,一间约16平方米的工作室里,李加义团队正在调试刚刚设计完成的AI玩具。

“这个玩具要具备交互能力,离不开相应的软件系统。放在以前,同等体量的软件系统开发至少要半年,还得多人共同配合。”李加义说,在AI大模型与辅助编程的深度赋能下,消耗数亿词元,开发周期被压缩至两个月。

2025年初,非计算机科班出身的李加义接触AI辅助编程工具后,借助新技术打破了软件开发的专业壁垒。“一年间,我们高效地完成了两款APP和一个AI玩具的开发设计。前不久,我们还将自研的AI硬件产品推向了国际消费电子展(CES)。”李加义说,AI助力不仅让开发成本大大降低,也让小微企业的创新探索有了更多可能。

软件开发,是人工智能应用落地的典型场景之一。总体看,词元调用量的分布呈现出鲜明的行业与场景特征,主要集中在那些信息密度更高、产品迭代周期更快以及模型与生产系统之间联系更紧密的领域。

以豆包大模型2.0为例,吴迪介绍,从行业分类看,互联网行业词元调用比例最高,消费电子、金融、新零售和商务服务紧随其后。

从场景来看,非结构化信息的处理和分析占比最大;教育、内容创作和“搜索与推荐”次之。

观察未来的发展趋势,软件开发、深度研究、个人助理等智能体应用场景或将成为词元调用量爆发的重要领域。“特别是软件开发,当前人工智能正从简单写代码转向理解整个项目,不仅能排查错漏、自动优化,甚至能通过智能体自主完成整个开发任务。代码上下文长、交互轮次多,企业为提升效率的付费意愿较强,这将成为一个巨大的需求增长点。”唐华斌说。

词元可计量,人工智能有望成为社会运转基础资源

“今年1月底以来,有的模型企业创下20天收入超越2025年全年总收入的业绩纪录。这组数字背后,是一套以词元计费为基础的新型商业逻辑正在加速演进。”国家数据局局长刘烈宏表示。

回顾人工智能产业发展历程,过去一段时期,行业聚焦于模型性能的比拼,技术创新与商业落地之间缺乏可量化的衔接桥梁,难以形成“技术迭代—价值产出—持续投入”的良性循环。

“词元本身具备可计量、锚定算力能耗、跨模态通用结算的特点,使其能够成为连接技术供给与商业需求的结算单位。打个比方,大模型输出的智能好比电,智算中心好比发电厂,电用千瓦时来计量,智能调用就用词元来计费。”联想中国基础设施业务群战略管理总监黄山表示,展望未来的智能社会,人工智能有望成为像水、电一样运转的基础资源,随取随用,用多少买多少。

从词元的视角出发,打造智能经济新形态,我国有何优势?有哪些发展着力点?

算法创新持续实现突破,国产大模型通过底层架构优化,与全球顶尖技术的代差逐渐缩小。吴迪说,我国的大模型厂商做了非常多的算法创新,在推理成本、响应速度上不断优化,能以更少的词元完成复杂任务。

基础设施具备领先优势。每生成一个词元,都在调用数据中心的算力,伴随着电力消耗。我国已建成全球门类最全、规模最大的能源体系,电源足、电网强、市场活。唐华斌表示,我国发电供给持续提升、电力成本不断降低,能够有效降低词元调用成本。

“能耗和算力是词元调用的两个关键成本。让每个词元用更少的算力和更少的能耗生产出来,体现的是智算中心等基础设施的生产能力和效率。”黄山表示,要构建起安全、高效、普惠的人工智能基础设施,持续提升大模型推理效率、降低单个词元成本,让人工智能最大程度走向规模化应用落地。(记者 王云杉)




本网转载内容出于更直观传递信息之目的。该内容版权归原作者所有,并不代表本网赞同其观点和对其真实性负责。如该内容涉及任何第三方合法权利,请点击投诉按钮,我们会及时反馈并处理完毕。
投诉
新闻中心
  • 快讯
  • 国内
  • 国际
  • 娱乐
  • 体育
点击加载更多>>>
点击加载更多>>>
点击加载更多>>>
点击加载更多>>>
点击加载更多>>>

关注东南网微信

扫码关注,了解福建

排行榜
  • 日排行
  • 周排行
  • 月排行
关于我们 | 广告服务 | 网站地图 | 网站公告
国新办发函[2001]232号 闽ICP备案号(闽ICP备05022042号) 互联网新闻信息服务许可证 编号:35120170001 网络文化经营许可证 闽网文〔2019〕3630-217号
信息网络传播视听节目许可(互联网视听节目服务/移动互联网视听节目服务)证号:1310572 广播电视节目制作经营许可证(闽)字第085号
网络出版服务许可证 (署)网出证(闽)字第018号 增值电信业务经营许可证 闽B2-20100029
福建日报报业集团拥有东南网采编人员所创作作品之版权,未经报业集团书面授权,不得转载、摘编或以其他方式使用和传播
职业道德监督、违法和不良信息举报电话:0591-87095403(工作日9:00-12:00、15:00-18:00) 举报邮箱:jubao@fjsen.com 福建省新闻道德委举报电话:0591-87275327