“科技巨头谷歌希望其核心产品能够从人类语言中推断出含义、回答多部分问题,并且看起来更像Google Assistant的声音。人工智能的大型语言模型的搜索引擎可提出建议、检索文档、回答问题并完成广泛的任务,但依然存在偏见的风险。”
在谷歌一年一度举办的开发者大会I/O上,这家公司经常会向世人展示令人惊叹的人工智能。
2016年谷歌推出内置Google Assistant的Google Home智能音箱;2018年为企业接听电话和安排议程的Duplex首次亮相。
按照这一传统,上个月谷歌首席执行官桑达尔·皮查伊推出LaMDA,一款“可就任何话题展开对话”的人工智能。
皮查伊演示了同纸飞机及天体冥王星交流是什么感觉。LaMDA会用三至四个句子回应每一次问询,就像两个人进行的自然对话。
皮查伊说:“LaMDA将会慢慢地融入到谷歌其他产品之中,比如Assistant和Workspace及最关键的搜索,LaMDA的自然对话功能会使信息和计算从根本上更易于访问和使用。”
LaMDA的推出得以一窥Google搜索的未来,未来的搜索已超越了链接列表,并可能改变数十亿人网络搜索的习惯。
以人工智能为主导,可推断人类语言的含义,参与到对话当中,并像专家一样回答由多方面问题。
谷歌还推出另一款名为多任务统一模型(Multitask Unified Model,MUM)的人工智能,可在搜索时将文本和图像考虑在内。
谷歌副总裁普拉巴卡·拉加表示用户在不远的将来可拍下一双鞋的照片,然后向搜索引擎提问能否穿它攀登富士山。
MUM能够生成75种语言的搜索结果,谷歌称这样可以让它对世界理解的更为全面。
用户提问“我爬过亚当斯山了,明年秋天想爬富士山,该怎么做?”后,这样的搜索同我们今时今日的搜索表述大不相同,因为MUM会减少查找答案所需的搜索次数。
MUM既能概括文本也能生成文本;它会将亚当斯山与富士山进行比较,并且告知用户为富士山之旅可能需要相关的健身训练、登山装备推荐及天气预报方面的搜索结果。
上个月一篇名为《重新思考搜索:从半吊子到专家》的论文中,谷歌四位工程师将搜索比喻成同人类专家对话。比如目前搜索“红酒的好处和坏处是什么?”,谷歌会回复一个要点列表。
该论文表示未来搜索引擎的回复可能看起来更像是一段话,比如红酒可促进心血管健康,但会弄脏你的牙齿,还会完整显示提及的信息来源与链接。
回复是文本形式,但也会变成口头回复,就像现在Google Assistant的体验一样。
但过度依赖人工智能破解文本也存在风险,因为语言的微妙复杂仍让计算机难以理解。
作为生成文本或回复问题等最先进人工智能的大型语言模型已显示出放大偏见、生成不可预测或有害文本等倾向。
其中一个名为OpenAI的GPT-3模型已被用于在动画角色中创建互动故事,但在一款在线游戏中也生成了涉及儿童性场景的文本。
麻省理工学院、英特尔及Facebook的研究人员发现,大型语言模型表现出基于种族、性别、宗教、职业的刻板印象。
自然语言处理伦理学博士、语言学家拉切尔·塔特曼表示,这些大型语言模型生成的文本会越来越具有说服力,人们会相信正跟理解自己所表达意义的人工智能交谈,但其实它们对世界并没有常识性的理解。
但人工智能生成对残疾人或穆斯林有害的文本或告诉人们去自杀时就会产生问题。
塔特曼回忆起一位图书管理员曾经教过自己如何判断谷歌的搜索结果是否有效,如果是将大型语言模型同搜索结合起来,用户就得学会评估同AI专家的对话。
谷歌搜索是一家建立在PageRank之上的公司,PageRank曾是一种算法,由联合创始人拉里·佩奇和谢尔盖·布林在1990年代后期研究创建。
PageRank依赖于索引,是使用算法对网站进行排序和评估的过程。随着时间的推移,谷歌又将庞大的事实库知识图谱融入到搜索结果里面。
最近谷歌将语言模型融入到搜索反馈。2019年谷歌曾将一种BERT模型植入到搜索中以回复对话式搜索查询、建议搜索并对出现搜索结果下方的文本概括。
BERT还为微软的Bing提供搜索结果。当时,谷歌副总裁潘杜·纳亚克称这是搜索领域五年来取得的最大进步,也是搜索历史上最大的飞跃。
BERT的横空出世使得各科技巨头展开了一场竞赛,竞相创造出规模更大的语言模型,希望语言理解或回答问题等方面在GLUE等流行表现排行榜上胜出。
百度推出Ernie,Nvidia推出Megatron,微软推出T-NLG,OpenAI推出GPT-3。工程师们会通过深度学习系统中人工智能神经元之间的连接参数变量评估这些模型。
BERT包含数亿个参数,GPT-3参数则高达1750亿。今年一月谷歌公布1万亿参数的语言模型。副总裁拉加称参数上MUM比BERT强大1000倍。
谷歌研究人员称索引是现代搜索的主力军,但希望今后通过利用能理解更多问题,更为庞大的语言模型将索引取消。
比如知识图谱能就事实性问题提供答案,但只在网络的一小部分进行训练。如果使用基于更广泛的网络构建的语言模型,将使搜索引擎提出建议、检索文档、回答问题并完成广泛的任务,这种方法会带来“思维的变革性转变”。
但这样的模型并不存在。事实上可能需要创造出通用人工智能,或在信息检索和机器学习等领域取得进步才能实现。而且,这种新方法还能从多个角度提供权威答案,清晰地解释来源,且不带偏见。
谷歌一位发言人将LaMDA和MUM称为自家公司下一代语言模型研究的一部分,并且表示MUM目前正在进行内部试验查询数十亿个主题。
Google Research并没有为谷歌产品设定方向,谷歌产品的机器学习通常是作为补充而不是取代现有产品。
谷歌搜索算法的任何变化都将不可避免地影响其核心广告业务,该业务去年为谷歌创造 1470亿美元收入。
搜索顾问迈克尔表示关于MUM登山靴的搜索回复演示表明,谷歌希望商业与消费者的连接方面发挥更大作用。
上个月的另一个显著变化是谷歌引入Shopify集成,将170万商家的商品带到搜索结果中。外卖公司DoorDash和Postmates在2019年已进入搜索结果。
谷歌搜索结果已从由PageRank提供的链接列表演变为将广告、知识面板、地图、视频和增强现实纳入在内。
这样的转变造成部分人所称零点击搜索(zero-click)的兴起。零点击搜索是指不再点击网站来完成网络搜索,这样谷歌能在不需要用户离开访问的情况下获得广告收入。
数字数据公司Similarweb估计,去年近三分之二搜索当中用户都没有点击进入到另一个页面;在移动设备上点击率(click-through rates)格外低。
迈克尔说:“在我看来,谷歌的野心要比向全世界卖广告大多了,他们喜欢连接各方进行交易,因此我认为这一点得到极大增强。”
通过自然语言或图像进行搜索可能会使用户的注意力分散,不在关键字上,而且还会损害价值数十亿美元的搜索引擎优化业务,目前各大企业仍竞相依靠这一业务让自己位于搜索结果顶部。
一些搜索引擎优化公司一直在为自然语言的未来准备。
总部位于美国阿拉巴马州伯明翰的初创公司Copysmith.ai 通过GPT-3为网站生成SEO元标签。
首席执行官赫恩·奥特兰表示,谷歌最近的举措不是一种威胁,而是整个人工智能领域又向前迈出一步。这表明我们正在朝着正确方向前进。
迈克尔表示:谷歌的公布可能需要数年才能实现,谷歌想要的不仅仅是事实和链接的集合,而是希望自己更像是一位能够回答复杂问题的专家。唯一的问题就是时间。
谷歌将大型语言模型作为商业战略和研究重点的策略在公司内部也引发了冲突。谷歌前AI伦理团队的两位前领导人在共同撰写一篇此类模型担忧的论文后就被迫宣布离职。
此外,大型语言模型会延续对人类的偏见和刻板印象,并可能造成气候变化。
随着语言模型越来越庞大,数据标记的贫乏和管理实践的缺失会酿成更大问题。更重要的是,大语言模型对社会造成的危险最有可能施加在边缘化社区身上。
今年1月,另一篇抨击大型语言模型的人工智能研究论文的作者称谷歌法律和政策团队的干预“阴险至极”。
3月,谷歌DeepMind研究人员发现,大型语言模型可通过传播刻板印象、散播失业和虚假信息,在创作者没有任何恶意的情况下造成社会危害。