每晚七点,一名汽车领域、拥有几十万粉丝的主播,都会在直播软件上接受连麦提问。
有人问三元锂电池和磷酸铁锂电池哪个好?
有人问电车能不能买,电池是不是不经用?
……
一次连麦提问持续不到一分钟,但麦序上整整排了上千位对汽车有疑问的观众。
午夜十二点一到,主播直接关闭了直播软件,下播休息。留下麦位上还在排队的几百位观众面面相觑——他们已经举着手机,排了一个多小时的队,却没能解决自己的疑问。
类似的情况比比皆是:问旅游的、问母婴的、问兼职的、问教育的……
所有提问共同制造了一个十分矛盾的叠加态:社区里的意见领袖越来越多,但被解决的问题却越来越少。
这事儿的最大的原因之一在于,大部分有价值的信息,都是需要在网络上,进行高强度检索和筛选的。而不同领域的信息,检索渠道通常都不同。普通人不但很难判断意见领袖们的专业度,也几乎不可能随时随地的自由提问。
更常见的情况是,一些看似日常,但实则不易回答的博物学问题,往往出自还在上幼儿园的“好奇宝宝”之口,孩子随口一问,父母哑口无言,或者无暇应接孩子层出不穷的问题。
这是为什么最近很多人开始尝试利用AI来解决自己的问题。
笔者最近观察到,很多博主对华为小艺进行测评。
有人问,问界M5和M7车型对比,小艺会直接罗列一张横向对比的表格,非常直观;有人问非上海户口,在上海能办香港签注吗?小艺会准确回答,列举办理流程、注意事项,并罗列信息来源,排在前面的都是本地宝这种可信的参考来源。
还有之前奥运会期间,很多人去问小艺比赛谁会胜出,小艺神预测居然全部猜中了。
作为一个智慧助手,小艺似乎正成为了一个新物种——用户可以随时提问各类稀奇古怪的问题,而小艺的回答非常专业、实用、可靠。
01
“专业助理”的升级之路
大模型与语音助手的深度结合,使传统语音助手的听、说、思考能力都直接翻倍,能完成十分口语化的对话,并习惯于旁征博引。
小艺在2023年8月HDC上就官宣接入盘古大模型,可以理解模糊意图和复杂命令,走在了行业前头。
随着大模型预训练的算法、数据和工程化方法,都越来越完善,且在很大程度上解决了“大模型幻觉”的问题。
早期的大模型产品,很有天赋,数学、地理、文学,好像什么都懂,但也很难依赖,偶尔会胡说八道,产生某种“这是事实”的幻觉。
幻觉产生的原因,是训练大模型的数据本身存在错误,叫做噪声数据。
行业内普遍的解决方案,是分两步走,一步是从源头开始,尽量采用可信来源的训练数据;一步是在大模型推理的过程中,检索相关文档,利用外部知识,减少幻觉。
其实数据合作一直是大模型公司的“软肋”——大模型训练所需要的训练数据是海量的,参数规模动辄达到万亿级。华为目前已和多个权威机构达成了数据上的合作,并会在回答中按可信度列举参考来源。
比如,对小艺提问“二里头夏都遗址博物馆介绍一下”,小艺会展示博物馆的位置、介绍、馆藏文物、开放情况等,而且回答的第一条参考来源是中国大百科全书。
如果对小艺提问“上海近5年的GDP发展趋势”,小艺不仅会引用国家统计局的数据,还能给出图文并茂的趋势图,更加方便用户阅读理解。
这看起来已经是个完全值得信赖的“专业助理”角色了,尤其是来自统计局的数据,令人咋舌——上网自己找报告,再制作表格,还不如直接问问小艺。
小艺甚至在问答体验上,更进一步,围绕生态合作,实现使用体验上的连续服务。你可以问问小艺,甄嬛传里翠果掌嘴是在第几集,而小艺除了加粗并准确回答问题,还会推送甄嬛传的播放链接。
华为曾发布过一个服务叫做“HarmonyOS意图框架”,这种对用户意图的理解和连续服务,就是这个意图框架的效果演示。
可以说,在小艺身上,华为过去十年在AI领域的积累展露无遗。背靠盘古大模型的华为小艺,其问答能力还远没有被媒体博主们测试出边界,相信医学、气象等专业领域,小艺未来都能给出专业回答。
02
不止于“听”与“说”
要媲美真人专家,光靠“能听”“会说”也不够,还必须好用。