写稿机器人“小南”是“智媒体实验室”推出的首个研究应用成果。“智媒体实验室”由南方都市报社、凯迪网络和北京大学计算机科学技术研究所联合成立,欲在推动媒体智能化技术研发、促进自然语言处理等科学领域的发展、探索媒体智能化产品服务的新运营模式等方面开展深度合作。 里约奥运会让“张小明”名噪一时,这部写稿机器人6天写出400多篇稿件,它与击退全部国外照排系统的“方正电子出版系统”师出同门,均诞生于北京大学计算机科学技术研究所(以下简称北大计算机所)。 这个被认为可以“让记者下岗”,引领媒体行业进入全新时代的“新闻机器人”此后分身有术,在体育、财经、春运甚至时政类新闻报道中屡现“身影”—— 2017年春运,北大计算机所和南方都市报社合作的“小南”,在一票难求时通过与12306打通技术连接,秒级播报广州旅客和列车情况;2017年两会,它又化身“阿同”,最快速度解读几十万字的两会六大报告,最快“敲黑板”“划重点”。 “过去35年,我们始终传承王选精神,发展王选事业。”5月28日,在接受科技日报记者专访时,北大计算机所所长郭宗明介绍,“顶天立地”是计算机所一直秉持的王选精神之一,“顶天指的是最先进的科学技术,立地就是大范围科技成果的应用。研究要面向应用,哪怕是短期没有应用前景,长期有应用前景的,我们也坚持研究。” 研究的步子要走在需求前面 “黑白的排版印刷系统,用户都是排着队来买的。”郭宗明回忆,1989年,激光照排系统获得成功,新华社报道“我国印刷技术将开创新纪元”。 面对“黑白排版”红得发紫的市场,当彩色出版系统关键技术的研发课题提出时,企业侧很多人是反对的。“一方面,研发部门和市场部门的同事已经疲于应付超饱和的市场需求,另一方面,高企的业绩让人甘于满足。”郭宗明回忆,“但是,王选老师顶住压力,坚持要搞彩色出版。” 1992年6月1日,《科技日报》在中国大陆首家采用方正彩色出版系统出版彩报。随后高档彩色出版系统这一科研成果迅速进入东南亚和北美,占领了海外80%的华文报业市场。 研究是对未知的探索,是永远不满足于已经获得和已经达成。新时代的王选“接班人”们同样走在市场需求之前,力求让科研成果符合要求,顺利落地。 “以前文本信息是网络信息中的主流类型。”北大计算机所多媒体信息处理研究室主任彭宇新教授说,近几年图像、视频等多媒体数据铺天盖地而来,已经占据大数据的80%以上。 然而对于图像、视频数据类型的分析技术,北大计算机研究所早在2005年前后就已经开始布局。 研发要基于市场需求,却不是被市场牵着鼻子走,郭宗明认为,对研究发现的把握要有前瞻性,是要牵着市场的鼻子走。在研发阶段就要对以后的应用市场心里有数,让科研成果转化的工作走在前面。 “随着硬件的发展,数据类型就会发生巨大变化,智能识别的任务将发生变化。”彭宇新就是这样“看三步”地确定了团队的研究方向——为人工智能的数据库中加上图像、视频。 团队创新性地发明了基于注意力模型和深度增量学习的识别方法,并6次参加国际权威评测TRECVID的视频样例搜索比赛均获第一名,在与卡内基梅隆大学、牛津大学、IBM Watson研究中心等参赛队伍的较量中胜出。 技术的“抽丝剥茧”,让图像、视频中的信息如文本一般精确透明。“我们是瞄着应用去的,准确率、处理速度都经过多年优化,并已落地应用。”彭宇新介绍,这项技术不仅帮助新闻媒体等行业进行数据管理和检索,还在助力互联网管理部门对大数据进行分析与监测。 联手企业重新定义媒体 2017年春节的假期还没走远,广州日报的紧急任务就找上了门。 “希望让写稿机器人进行全国两会的报道,这是首次尝试敏感的时政话题,”北大方正电子有限公司新媒体产品事业部总经理霍为兵回忆,当时,广州日报领导带领团队亲自上门商讨合作。 这次的挑战是双重的:一方面时政话题“容错率”几乎为零,这对技术是一个很高的挑战;另一方面,从需求提出到两会召开,只有不到一个月的时间。 “我们还是决定接受挑战。”霍为兵回忆,北大计算所研究员万小军团队紧急“应战”,并和方正电子研发团队快速对接。“当时已经不是海量算法的训练阶段,而是有针对性地对机器人进行训练,包括对历史数据的文案进行分析、形成适合时政的文风,最后确定了综述和简讯两类写作类型。”霍为兵说,“机器人跑两会”在各方的共同努力和把关下,在两会期间快速写出了十几篇分析文章。“这次实践引起了轰动。” 霍为兵表示,越来越多研究成果转化为实际应用的成功案例,帮助方正电子打开了新媒体市场的大门。新闻机器人不再局限于写稿,它出现了更多的应用场景,“媒体”也跟着被重新定义。此外用机器人进行新闻创作线索的发现、实现新闻的精准分发都在逐步投入应用。 成长为教学研用的“全优生” “发论文一度是我们不擅长的。”作为研究所的带头人,郭宗明曾有过与其他研究所领导不同的苦恼——别人苦于成果转化不出去,而他苦于好成果写不出对应的好论文。 1995年,为了方正电子在港股上市,北大计算机所划入方正集团,倾尽所有科研实力为企业服务,当时约定10年为期。 “10年期满,我们觉得还是选择独立的研究之路。”郭宗明回忆,不惟市场的研究能恢复研究“天马行空”的自由,找回自我,也能产出更多前瞻性的科研成果。 从服务别人的“B角”转变为自主科研的“A角”,从企业走出来的研究员们一时间还跳不出“唯用至上”的思路,并不热衷于写论文。“但是学校会考核我们,标准变了。”郭宗明说,为了推动科研人员在思想上转变,当时所里还出台了论文奖励办法,鼓励科研人员发表论文。 当全国都在讨论“科技成果转化率低”“只发论文没有转化”等科技经济两张皮的问题时,北大计算机所却正好相反。“好的论文意味着你要有好的成果,好的研究内容,更要有好的写作能力。”郭宗明说,“进入企业的十多年,让我们和学校老师在学术论文的表达上有很大的差距。” 失之东隅,收之桑榆。北大计算机所的人均专利是北京大学这所高等学府专利持有量的5倍之多。2017年,北大计算机所与方正电子签约合同额超过900万元,是前几年的数倍,郭宗明认为,经过几年的刻苦努力,北大计算机所从一个科研能力特别强的“特长生”,成长为教学、科研、产业应用等全面优秀的“全优生”,并开始批量产出研究成果。 不只与方正集团,在科技成果转化方面,阿里、优酷、央视、国家部委等都是北大计算机所成果落地的合作伙伴。 “我们对市场摸得太熟了。”郭宗明此前也在方正集团担任过技术总监的职务,有了十年来锤炼的市场基因,加上探索研究的情怀,对于新时代的王选接班人来说,“顶天立地”间,有更广阔的施展空间。 “随着新成果转化法的落地实施,我们在期待细则的进一步落地,相信未来将有更多的能够产生技术变革和产业颠覆的创新落地。”郭宗明说。 下一篇4 |
相关阅读:
- [ 05-31]北大“白求恩”:见证中国25年发展历程 愿为城镇化做贡献
- [ 05-05]校庆演讲读错“鸿鹄”发音,北大校长林建华发道歉信
- [ 05-03]15句话感受习近平在北大对青年和教育的殷切希望
- [ 05-03]再到北大,习近平这些话语重心长
- [ 05-03]扎根人民、奉献国家——习近平总书记的考察在北大师生中引起热烈反响
打印 | 收藏 | 发给好友 【字号 大 中 小】 |
信息网络传播视听节目许可(互联网视听节目服务/移动互联网视听节目服务)证号:1310572 广播电视节目制作经营许可证(闽)字第085号
网络出版服务许可证 (署)网出证(闽)字第018号 增值电信业务经营许可证 闽B2-20100029 互联网药品信息服务(闽)-经营性-2015-0001
福建日报报业集团拥有东南网采编人员所创作作品之版权,未经报业集团书面授权,不得转载、摘编或以其他方式使用和传播
职业道德监督、违法和不良信息举报电话:0591-87095403(工作日9:00-12:00、15:00-18:00) 举报邮箱:jubao@fjsen.com 福建省新闻道德委举报电话:0591-87275327