写一篇新闻稿或是运动会开幕辞,您最快需要多长时间?5分钟,10分钟?而机器写新闻仅需要1秒。
5月21日上午,首都师范大学北京语言智能协同研究院在北京举行2016中国汉语智能写作成果发布会,发布了其最新研究成果——汉语智能写作系统,填补了国内外此研究领域的空白。
“智能写作是利用计算机完全自动地对收集的文档进行整理、提取、过滤、筛选、组装、写作,自动地生成一篇相关的文章。”首都师范大学副校长、北京语言智能协同研究院院长周建设介绍说,“我们通过对受限语体,即有一定的特定使用场合,相对来说结构、格式比较固定的语体的海量数据进行挖掘,提出了一种基于大数据的汉语表达智能模型,研发出了汉语受限语体智能写作系统。”
据了解,周建设教授作为汉语智能写作项目的首席专家,在上世纪九十年代就提出语言智能的科学构想,近年连续发表了《面向语言处理的计算与认知取向》、《基于大数据的汉语表达智能模型及其理论基础》等多篇重要文章,策划了受限语体的智能写作等多个项目,并取得了多项重大成果。
汉语智能写作是北京语言智能协同研究院言语生成研究方向的历史性突破,是国内外智能写作领域的标志性成果。为了使这项意义重大的研究成果早日面世,北京语言智能协同研究院特聘北京信息科技大学教授吕学强担任这个项目组的带头人,经过研究院专家们和项目组几年间的反复沟通、多次交流,最终才使这一任务圆满完成。
吕学强教授介绍说,汉语智能写作系统,是基于大数据和相关知识库,根据需求自动生成文章。如在发布会现场演示的运动会开幕辞智能写作,即是在运动会语体大数据和相关的开幕辞模板基础上,输入关键词,如时间、运动会类型、参加的领导等,系统1秒钟就自动生成一篇内容流畅、语意准确的实时稿件。
吕学强教授认为,汉语智能写作系统写作速度快,可以满足不同模式的写作需求,尤其在NBA赛事新闻智能写作领域,准确率几乎达到了100%。尽管由系统写出来的文章在语意和情感上还无法与人脑相比,但依然可以辅助人们完成写作,在原文的基础上稍加修改即可,从而节省大量的人力物力,提高工作效率。
在听了汉语智能写作的成果发布后,与会的专家教授普遍看好这一研究成果。
中国科学技术信息研究所研究员张寅生评价称,“在知识的集成、抽取上,汉语智能写作系统实现了很多突破,是一个标志性成果。未来如果在知识库构建、相关领域和场景设置上继续深入和拓展,会有很大前景。”
暨南大学华文学院教授刘华同样认为,“未来在金融新闻领域,智能写作将会大有可为,可以基于相关成果,对股票行情等进行预测。”
北京师范大学文学院副院长王立军则对该项研究的定位做出了高度评价,“人与机器可以协作,而不是人与机器的对立,机器可以进行大数据的搜索,人可以在文采和情感方面发挥特长,这一定位很好。”
另据北京语言智能协同研究院副院长史金生教授介绍说,北京语言智能协同研究院是2013年6月经北京市语言文字工作委员会批准成立的语言智能前沿技术科研基地,目标是围绕教育资源均衡化发展问题和国家文化战略,开展具有国际前沿高端水平的“语言理解-表达-评价智能模型”和“技术应用系统”研究,并转化为语言智能系列产品,为人才培养和文化交流提供优质服务。
研究院以理论突破、技术突破和产品突破为推进方向,借助语言为媒介识别语言图像进而识别人脑意象,寻找人类语言学习的认知规律,通过信息技术打造智能产品,均衡教育资源,提升学习效率。研究方向跨越中国语言文学、外国语言文学、心理学、应用数学及计算机学科。
目前,该院最新研究成果---汉语智能写作平台可以完成NBA赛事新闻智能写作、运动会开幕辞和高校学术活动总结稿件的智能写作,这一研究成果是北京语言智能协同研究院言语生成研究方向的历史性突破,同时填补了国内外此研究领域的空白。
这次会议由北京市语委办主任贺宏志主持,北京市社科联学术活动部主任李志东、北京市科协学会部部长李金涛、北京大学计算语言学研究所所长王厚峰、北京大学语言信息工程系副系主任俞敬松、中国社会科学院研究员周庆生等几十位专家学者出席了会议。(刘荣梅、傅星纳) |