“青蒿素”“细胞免疫疗法”“靶向治疗”……即便你不知道这些医学名词的英语,只要在人工智能机器狗的帮助下,同样能畅游海外的网站——这是人工智能产品在搜索领域带来的最新成果。
1月14日,搜狗索索宣布将原先的搜狗英文搜索全面升级为海外搜索,旨在帮助不精通英文的中国人能够搜索和阅读全世界的医疗,科技,人文信息。
解放日报·上观新闻试用发现,当用户通过搜狗海外搜索的搜索栏输入中文时,相关词汇被自动翻译成英语,继而显示出海外网站上的相关信息。这些海外网站上的信息同样能利用机器自动翻译成中文。记者尝试了“青蒿素”“细胞免疫疗法”“靶向治疗”等多个医疗词汇,以及“LadyGaga”“三体”等文化科技词汇,发现搜索引擎的翻译和搜索结果总体比较准确。
“这是全球第一次把深度神经元网络翻译系统与搜索相结合而打造的全新产品。搜狗搜索也成为全球独家拥有此功能的搜索引擎。”搜狗CEO王小川表示,搜索引擎是人工智能应用的重要领域,因为人工智能能够帮助人们实现跨语言沟通,“改写通天塔的故事”。
王小川
具体来说,搜狗海外搜索背后的技术支持来自搜狗自主研发的“搜狗机器翻译引擎”。这是一种基于“神经网络机器翻译技术”(End-to-End Neural Machine Translation,简称NMT)的人工智能机器翻译引擎。基于此技术,搜狗海外搜索可以做到中英双语的大数据搜索挖掘,通过大规模数据处理技术,实现超过8000万个中英文词汇的双语互译数据。
对于海外搜索的意义,王小川引用了《圣经·旧约》“巴比伦通天塔”中的故事:“人类希望通过建造一个通天塔来与上帝对话,上帝却认为建造通天塔是藐视他的权威。因此上帝让不同人、不同民族开始说不同的语言。当人类沟通存在障碍,他们就失去了建造通天塔的能力。正是这种信息不对称,使得我们难以合力完成一件伟大的事情,语言就是其中重要的一个因素。”
他觉得,如果能够跨语言进行沟通,这样的技术进步重要性将与电的发明等同: “如果能做到跨语言的沟通,地球的文明会重新改写,战争会变得更少,不同民族之间的交流会带来新的一种新文明的产生。”
在王小川看来,人工智能正在重新定义我们生活的地球,重新定义人的价值。机器的技术进步使得人从精确的分工中解放出来,有机会去创造更大的价值。但是,人工智能的发展也面临挑战。比如,有的“人工智能”没有技术含量,产品就很难落地;有的人工智能很高级,却缺乏用户规模,导致即便有产品,也缺乏商业化基础;此外,即便技术、用户两者皆备,也不一定具有商业价值或能对世界有所贡献。
例如,语音识别、人脸识别等人工智能技术相对成熟。却因为“技术只是技术”,无法做判断、做选择,所以其实际带来的社会价值依旧有限;而无人驾驶虽然具有巨大的潜力客户群体,且商业价值优厚,但真正能够平稳落地的产品还没有面世。这也是为什么搜狗选择在搜索引擎和输入法领域发展人工智能的重要原因——要让人工智能出现在每个人身边,看得见并用得上。
王小川也承认,目前搜狗的人工智能产品也并非十全十美,而是通过深度学习进一步完善,属于“摸着石头过河”。目前,搜狗的主产品中大量使用到深度学习的方法,比如输入法中就应用了语音识别和图像识别,搜索同样依靠深度学习在不断对搜索引擎排序进行优化。因为翻译工作本身非常细腻,有些前沿的词汇并没有做到中英文的对应,做搜索引擎需要持续不断地迭代产品。
为此,搜狗于2016年4月捐赠1.8亿元,与清华大学联合成立天工智能计算研究院,共同致力于人工智能前沿技术的研究。最新的计划通过与清华合作,并投入更大的机器资源,继续优化海外搜索的翻译品质,实现机器自动翻译多级页面,并将海外搜索结果整合至网页搜索结果中,“让用户用中文搜索、也用中文能看到整个世界”。
(文中图片由作者提供。题图来源:视觉中国 图片编辑:朱瓅 编辑邮箱:sh_chuangke@163.com)