资讯-淘券派

“AI的商业化路线已经清晰” 2023京东“赶考”千亿级产业大模型

每经记者:王郁彪 每经编辑:刘雪梅

2023年的春天,AI迫不及待地“破土”了。

英伟达创始人黄仁勋说,我们正处于AI的“iPhone时刻”。言语间,难掩兴奋。根据瑞银分析,ChatGPT使用了约1万颗英伟达GPU来训练AI模型。而外界普遍预计,ChatGPT的商业化将需要应用超过3万颗。

此岸彼岸,AI持续澎湃。即便入局的门槛如此之高,大模型的应用与尝试,却还是像颗陨石一样溅落大洋,激起阵阵涟漪。

“AI引发新一轮生产力革命,主要源自多方面的进步。”京东集团副总裁、京东科技智能服务与产品部负责人何晓冬博士在接受《每日经济新闻》记者采访时表示,“包括硬件、摩尔定律和GPU等的进步,算力提升、数据迅速增加,还有像Transformer这样的模型结构的发明。”

两年前,何晓冬在接受记者采访时曾预判,“未来5年是AI落地产业化窗口期”。如今仅过去三年时间,新的想象便提前降临。5月6日,被誉为“中国智能科技最高奖”的吴文俊人工智能科学技术奖颁发,京东云旗下的言犀团队凭借“任务型智能对话交互关键技术及大规模产业应用”斩获科技进步奖,何晓冬获吴文俊人工智能科学技术奖杰出贡献奖。

言犀团队“任务型智能对话交互关键技术及大规模产业应用”获得吴文俊人工智能科学技术奖科技进步奖。 图片来源:企业供图

“今年的规划是要发布面向产业的言犀大模型,预计参数量千亿级,会在京东内部生态落地实践后再对外开放。”何晓冬透露。京东做的是生长在数智供应链上的产业AI,和所有人一道,共赴这场AI在春日的圆梦。

人机对话70年飞跃:从ELIZA到ChatGPT

新一轮AI革命的热潮由ChatGPT开启,就像是一场命运的定数。因为人工智能魔方的开启,也要从人机对话说起。

1950年,图灵发表了一篇划时代的论文,文中预言了创造出具有真正智能的机器的可能性。由于注意到“智能”这一概念难以确切定义,他提出了著名的“图灵测试”(注:如果一台机器能够与人类展开对话而不能被辨别出其机器身份,那么称这台机器具有智能。)

受“图灵测试”启发,16年后,1966年,美国麻省理工学院人工智能实验室的约瑟夫·维森鲍姆等人开发了最早的人机对话机器人ELIZA,关于聊天机器人的新时代就此来临。

但当时的ELIZA只是简单模仿人的行为,谈不上智能。到上世纪90年代,人机对话才进入了一个新的发展阶段,大家开始讨论怎么让计算机理解人类意图与执行命令。

记者注意到,2012年以来,苹果的Siri、谷歌的Google Assistant、微软小冰、亚马逊的Alexa等为代表的智能对话机器人走进“寻常百姓家”。这些机器人不但能完成人下达的任务,还能逐渐跟用户建立情感上的联系。

而伴随人机对话交互技术的成功应用,其也逐渐成为整个AI赛道绝对炙手可热的领域。

何晓冬从技术演进的角度回顾ChatGPT时表示,这几十年走过了一个比较长的周期,但在最近几年,迎来了爆发式增长。

“上个世纪50年代是基于规则,80年代是基于统计模型,到了本世纪深度学习崛起以后,开始向神经网络、替代模型崛起。特别是到了2017年Google的Transformer发表以后,之后又分出了一个系列,直到今天的GPT4。”何晓冬如此解释。

的确,在过去近10年时间里,人工智能模型经历了从小模型到以Transformer为代表的大模型的转变。

而指数级的增长,速度与规模的递进,更令人震惊。“三年前说大模型,这个‘大’是10亿级别的,现在则已经升至千亿级别。三年之内,关于大模型大的定义已经涨了100倍。”何晓冬表示。