简繁互换
设为首页
设为收藏
手机版
东南网 / 新闻频道 / 天下 / 环球新闻 / 正文

全球人工智能峰会呼吁保护语言模型文化身份

2024-09-13 16:50 新华网 责任编辑:陈曦

新华社利雅得9月13日电 随着生成式人工智能的发展,对大语言模型的需求越发明显。日前在沙特首都利雅得举行的第三届全球人工智能峰会上,沙特数据与人工智能局发布了目前最大规模的阿拉伯语大语言模型,与会代表探讨如何让人工智能技术赋能阿拉伯世界,在全球化中保护语言、身份和文化的多样性。

沙特数据与人工智能局介绍说,该机构研发的拥有70亿个参数的阿拉伯语大语言模型ALLaM已经上线微软的云平台,训练数据集包含5千亿个阿拉伯语基本文本单元。

与会嘉宾表示,在发展大语言模型中保护文化身份,首先还是来自高质量数据集的挑战。要收集多样化的数据集,包括方言、习语和文化的细微差别。这种数据的多样性使人工智能不仅可以作为一种技术工具,也可以作为跨越文化鸿沟的桥梁。模型训练过程中,需要聘请来自不同文化的数据标注者,尽管这是一个复杂且昂贵的过程,但对于确保人们平等受益于大型语言模型带来的技术进步,保证人工智能的普惠性非常重要。

人工智能公司Emotech首席执行官庄宏斌在此次大会的主旨演讲中,介绍了“小语言模型”的概念。小型语言模型,是大型语言模型的紧凑版本。它们旨在高效执行语言相关任务,同时消耗较少的计算资源。与可能由数千亿个参数组成的大型语言模型不同,小型语言模型的特点是参数数量较少,适合数据资源有限的方言语言模型,适合部署在移动设备或边缘计算设备等资源受限的环境中。

与会嘉宾表示,随着人工智能技术的发展,其在调整和塑造人类互动文化方面的潜力也在增长。然而,挑战在于如何确保这些技术的开发具有包容性,尊重全球用户的语言和文化多样性。技术的包容性和语言文化的多样性应作为未来真正全球人工智能格局的基础。

第三届全球人工智能峰会于10日至12日在利雅得举行,峰会主题是“利用人工智能造福人类”。




本网转载内容出于更直观传递信息之目的。该内容版权归原作者所有,并不代表本网赞同其观点和对其真实性负责。如该内容涉及任何第三方合法权利,请点击投诉按钮,我们会及时反馈并处理完毕。
投诉
新闻中心
  • 快讯
  • 国内
  • 国际
  • 娱乐
  • 体育
点击加载更多>>>
点击加载更多>>>
点击加载更多>>>
点击加载更多>>>
点击加载更多>>>

关注东南网微信

扫码关注,了解福建

排行榜
  • 日排行
  • 周排行
  • 月排行
关于我们 | 广告服务 | 网站地图 | 网站公告
国新办发函[2001]232号 闽ICP备案号(闽ICP备05022042号) 互联网新闻信息服务许可证 编号:35120170001 网络文化经营许可证 闽网文〔2019〕3630-217号
信息网络传播视听节目许可(互联网视听节目服务/移动互联网视听节目服务)证号:1310572 广播电视节目制作经营许可证(闽)字第085号
网络出版服务许可证 (署)网出证(闽)字第018号 增值电信业务经营许可证 闽B2-20100029 互联网药品信息服务(闽)-经营性-2015-0001
福建日报报业集团拥有东南网采编人员所创作作品之版权,未经报业集团书面授权,不得转载、摘编或以其他方式使用和传播
职业道德监督、违法和不良信息举报电话:0591-87095403(工作日9:00-12:00、15:00-18:00) 举报邮箱:jubao@fjsen.com 福建省新闻道德委举报电话:0591-87275327