最近,360创始人周鸿祎又点评了互联网圈:在ChatGPT领域美国领先者我们,中国公司和科研人员要奋起直追。
ChatGPT确实让国内互联网公司有点火。2月8日,为了抵御ChatGPT带来的冲击,谷歌仓促推出人工智能聊天机器人巴德。演讲,百度宣布在3月初推出“文心一言”,其他家互联网公司也争先恐后。
2月10日,宣布有类ChatGPT技术储备、准备发布并已经发布类ChatGPT产品服务的国内大厂有:阿里巴巴、腾讯、华为、字节跳动、京东、360、科大讯飞、快手、网易有道等,超过10余家互联网大厂进军火热的ChatGPT。
风口吹来,泥沙混杂。国内率先官宣进军ChatGPT的互联网企业,其实是奢侈品交易平台寺库,ChatGPT概念股让其股价应声上涨120%。很多网友吐槽,不是寺库主动发声,还想不起来寺库对消费者的欠款。
另外,互联网垂类变革企业也有参与者,Tech星球独家获悉,好未来将在未来引入类ChatGPT技术,目前正着手着手筹备研究ChatGPT的教育项目。商汤也探索搭建通用型AIGC模型正在进行中,该项目由商汤研究院牵头。
中小科技公司在蹭热度,大公司也并非轻松掌控“ChatGPT”。比如谷歌巴德发布时,演示视频中犯了一个事实性错误,首秀大“翻车”,导致谷歌股价大跌,目前市值已经跌去了1700亿美元。
放眼国内互联网企业,谁在做ChatGPT更多实力科研?谁在真刀真枪的首发研发,谁在追风口、蹭热点概念?
01
扎堆入局ChatGPT竞赛
在搜索和AI领域积累最深的百度,自然被市场寄予厚望。
百度计划在今年3月推出与ChatGPT类似的人工智能聊天机器人服务,该项目名称确定为“文心一言”,中文名ERNIE Bot,3月份完成内测后,将面向公众开放。不同的是,最初版本将嵌入其搜索服务中。这个工具将允许用户获得对话式的搜索结果。
去年9月,百度CEO李彦宏判断人工智能的发展在“技术层面和商业应用层面,都有方向性改变”。据推测,百度就开始做“文心一言”,另外按照谷歌和微软的节奏,“文心一言”开放内测还有可能提前。
尽管没有最先发布ChatGPT,但在相关技术方面,百度同时具备人工智能所需的算力、算法和数据,在芯片、框架、模型、应用层技术栈上进行布局,是国内少数具备AI全栈能力的企业。
相比百度的技术储备,阿里和字节跳动可能是另外两个较早布局的玩家。
2月9日,阿里内测中的达摩院版ChatGPT提前曝光。新产品可实现的功能包括知识问答、AI绘画、代码生成、小说续写、文案撰写、写诗作词等。从人工问答的水平来看,达摩院版ChatGPT也实现了相对真实的回答,而且也实现了多轮问答。
事实上,在2022年5月份,在超大规模多模态预训练模型M6的发布之后,阿里就曾公布过相应的能力,在AIGC方面,生成的实景图片已经十分丰富。
据阿里方面公布的数据介绍,M6将模型参数规模扩大了十万亿,平均单卡可承载200亿参数。根据阿里方面公布的数据介绍,M6在同等参数规模中视线前端标杆的1%,极大降低大型模型训练参数。
字节在研发训练ChatGPT的道路上,虽然栈技术不是很突出,但在方面走的比较靠前。技术项目说明,从去年年底开始,字节就在研发类ChatGPT项目,目前已在内部上线了全测试插件,由AI Lab主导,目前正在探索。而在此时,字节的AML团队内部开发了火山发动机大模型框架veGiantModel。这个模型类似于为ChatGPT提供支持的GPT-3.5系列模型。
而在GPT-3.5之前,一款火山引擎的前开发人员告诉Tech星球,很早之前就着手研究基于GPT2、GPT3的训练模型和产品,并且数十年来推出的火山引擎也在NLP(自然语言处理)应用方面有研究积累。
目前,字节对话机器人、机器翻译、机器写作上有大量的研究,特别是针对内容创作这一块。在ChatGPT被用来写文章之前,字节跳动就研发了小明机器人自动写稿平台,自2016年上线以来,已经累计写了60万篇,覆盖了17项体育赛事,支持6种语言。
近期,快手也对外表示,正在开展大规模语言模型(LLM Large Language Model)相关研究,并启动了相应专项,覆盖LLM模型训练、文案自动创作与生成、对话系统开发等领域。
此外,京东云言犀也宣布将推出产业版ChatGPT:ChatJD,预计参数量为千亿级,主要应用在零售和金融2个领域。
02国内大厂为何没能抢得先机?
大厂扎堆涌入,但有实力的玩家并不多。
有研究估测,训练1750亿参数语言大型模型GPT-3,需要有上万个CPU/GPU2小时4间不间输入数据,需配备警报驱动地球和月球,万一一次就要耗费个450美元(约3000万元)。
高昂的研发成本意味着,主要的大模型只能由大型科技公司或少数研究机构掌握。
从参数数量来说,百度的文心大模型有2600亿参数,远比GPT-3的1700亿参数。但参数数量并不代表模型结果。国内并不缺数据,百度、字节跳动这样的公司都有海量的数据积累,不过后续包括数据标注、标注以及模型的结构设计、训练、推理等都需要时间积累。这可能是国内大模型表现结果不如国外替代的原因重要。
拉开差距的关键时间点是在2020年中,因为GPT3.0刚刚出来时。同期的专家纪要显示,当时可能很多人觉得GPT3.0不仅仅是技术,体现了AI模型的发展新理念,因为ChatGPT的蓝牙OpenAI对这一块有技术的独到之处,也领先了国外的Google,大概Google比OpenAI差了半年到一年的时间,国内公司差了两年的时间。
这与很多科技企业认为,ChatGPT不是革命性的技术也有关系。ChatGPT是OpenAI在2020年发布的GPT-3模型仿真后开发出的对话机器人,严格来说,ChatGPT面临着底层模型的显着突破,它巧妙地采用了理解、生成和交互相结合的方式,基于人类反馈进行强化训练,在体验上带来了人智能的感觉。
Meta首席人工智能科学家Yann LeCun,不久前在一次小媒体和高管在线聚会上发表了自己对ChatGPT的看法:“就底层技术而言,ChatGPT并是什么特别的创新,也不是革命性的东西。许多研究实验室正在使用相同的技术,开展相同的工作。”
一位百度员工告诉科技星球,其实国内很多大厂做了很久,但都不是GPT方向,而是其他产业方向。2022年很多开发者基于百度文心做的应用,多是心理咨询、寻医药、高考志愿等场景。阿里「通义」大模型也覆盖200+服务场景,包括AIGC、智能对话都有,但也不算明显。
没有认识到ChatGPT对现有搜索模式的革新,没有准确预测ChatGPT对脑力劳动者产生的很多关系替代方案。问题的关键在于,互联网企业认为“聊天”是一个很浅薄的应用,从现在的场景来看,是一个更强的聊天机器人,有一定的问答属性,暂时看不到一点。
有上述看法的国内一位NPL算法工程师告诉科技星球,ChatGPT是一个缺口性极高的项目,国内没有成功先例,如果真的全力以赴,上面不一定能提供资源,更别说提上优先级。另外,的技术是能力有限,比如尝试一个大模型,缺的不仅仅是资金,还有人力和基础模型,对于互联网大厂这样的商业公司而言,存在增量的需求。
不仅存在睡眠,技术上的睡眠也有。
目前,ChatGPT 的信息已经到了 2021 年,这意味着如果把它当做搜索工具使用,显然无法获得实时信息。一位百度员工表示,百度现在正在解决信息实时性的问题。同时,ChatGPT 已经在准备推出基于 GPT-4 的迭代产品,国内企业又有新的目标需要追赶。
03跟风热潮中,谁在硬蹭热点?
“有大模范的企业能做ChatGPT,没有的皮在蹭热点。”
前阿里云大模型负责人杨红霞犀利点评了当前互联网公司,蜂拥扎堆做ChatGPT的现状。她认为:“大模型只有达到100B以上的水平,才有GOT能力(或者提供较难推理问题的答案)。”
从这方面看,百度有20多万企业用户的飞桨平台,也有文心大模型,预计能做出最接近ChatGPT水平的对话产品;阿里有“通义”大模型,目前已经实现了那么多参数训练,在产业端M6开发的应用场景也比较丰富;华为在2020年大模型开始有布局,2021年发布了鹏城盘古大模型,是采用首个千亿级生成和中文NLP大模型来理解。
相比之下,目前宣布进军ChatGPT的一些互联网企业,技术研发和计划则要加入第二梯队。比如,360有深度学习平台Xlearning,但没有相关大模型。同样宣布进军ChatGPT的网易有道,是AI芯片、深度学习框架、AI大模型都没有,只是有应用场景在线教育,这与传出涉及ChatGPT的学与思类似,企业只有学习机的应用场景,但没有相关技术储备。
还有一些企业则被认为是追风口概念。汉王科技受益于ChatGPT概念股,在1月30日开始了七个涨停板。根据2022年半年报显示,接近chatGPT的文本大数据业务份额为7797.95万,仅占总份额的14%,不仅份额较小,还其次为7.14%。企业其发展困难,却借助ChatGPT概念实现了股价一飞冲天。
这还不算最受关注的,2月6日,寺库宣布将探索将AIGC和ChatGPT技术查找奢侈品相关业务。当天,寺库股价上涨124.4%。实际这家企业已被纳入“老赖”名单,不少供应商欠款和消费者退款均未即时结算,多次被市场监管总局查获失信名单。
与这些主动蹭ChatGPT的热度企业不同,也有什么都没做的企业,借助ChatGPT躺赢。2月8日,微软集成ChatGPT技术的新版必应上线,答案中有大量来自知乎的答案,当天午后知乎股价一度涨超56%。由于ChatGPT可能与社区问答出现对话,所以知乎对ChatGPT相关一直保持沉默。但也受到市场热捧,送上股价增长增量。
当然,有行业人士表示,很多中小企业没有技术,也可以借助开源实力的Transformer大模型,一定程度实现ChatGPT功能服务。
达摩院专家告诉Tech星球,现在大规模预训练的基于变压器的模型虽然能够很好地解决认知智能相关任务,但缺乏提出设计的纯变压器模型,然而无法完成用于实现智能认知的基本尝试。
正如数十万跳动的情况,科技星球向火山引擎的售前支持人员咨询火山引擎有类ChatGPT的产品吗?对方表示,平台并没有该产品,但可以通过“机器学习平台”结合自家产品,经过二次开发,能够实现类ChatGPT的效果。
Tech星球还发现,在ChatGPT爆火后,前美团“2号人物”王慧文疑似复出,所得要带资5000万美元入局人工智能。同时,与NPL、AIGC等相关的岗位受到人们的强烈关注,算法岗成为了新的求职方向。在脉脉的岗位热度排名中,前十位中,有8个是和算法相关的岗位。
包括腾讯、阿里、字节、小红书、菜鸟等互联网公司,已经在NPL算法工程师等相关招聘岗位中,加入了从业人员需了解熟悉GPT-3等相关模型的要求。而招聘月薪多在4万元左右,最高可达10万元。
2023年,ChatGPT点燃的这把火,可以淬炼出真金的企业和人才,也可以吸掉虚妄的概念。
邮件:siyushenqi@gmail.com
工作时间:周一至周五,9:30-20:30,节假日休息