周鸿祎点评ChatGPT:美国领先,中国公司需奋起直追,10余家互联网大厂进军
来源 |科技星球
文字|王琳、陈巧慧、杨小荷
近日,360创始人周鸿祎在互联网圈评价:美国在ChatGPT领域领先于我们,中国企业和研究人员必须迎头赶上。
ChatGPT确实让国内外互联网公司有些愤怒。 2月8日,为了抵御ChatGPT的影响,谷歌匆忙推出了人工智能聊天机器人Bard。国内方面,百度于3月初宣布推出“问心一言”,其他互联网公司也纷纷效仿。
截至2月10日,国内已宣布拥有类ChatGPT技术储备并准备发布或已经发布类ChatGPT产品和服务的主要厂商包括:阿里巴巴、腾讯、华为、字节跳动、京东、360、科大讯飞、快手、网易有道等10余家主流互联网公司已入局热门ChatGPT。
出风口下,泥土和沙子混合在一起。中国最早正式宣布入驻ChatGPT的互联网公司其实是二手奢侈品交易平台寺库。 ChatGPT概念股导致其股价上涨120%。不少网友抱怨,不是寺库主动发声,他们记不清寺库欠消费者什么了。
此外,还有互联网垂直赛道公司的参与者。 Tech星球独家获悉好未来未来将推出类似ChatGPT的技术,目前正在准备开发ChatGPT的教育项目。商汤科技也在探索通用AIGC模型的构建。该项目由商汤科技研究院牵头。
中小型科技公司正在享受人气,大公司想要控制“ChatGPT”并不容易。比如,谷歌巴德发布时,演示视频出现事实错误,首发“翻车”,导致谷歌股价暴跌,目前市值已缩水1700亿美元。
放眼国内互联网公司,谁有科研实力打造ChatGPT?谁在投资真正的研发,谁在追逐潮流和热门概念?
参加 ChatGPT 竞赛
在搜索和AI领域积累最深的百度自然被市场寄予厚望。
百度计划于今年3月推出类似ChatGPT的人工智能聊天机器人服务。项目名称已确定为“文心一言”,英文名称为ERNIE Bot。 3月份内测完成后,将向公众开放。不同的是,初始版本将嵌入其搜索服务中。该工具将允许用户获得对话式搜索结果。
去年9月,百度CEO李彦宏判断人工智能的发展“无论是技术层面还是商业应用层面都出现了方向性变化”。据推测,百度当时就开始做“文心一言”。另外,按照谷歌和微软的节奏,《闻心一言》可能会更早开放内测。
虽然不是第一个发布ChatGPT的,但在相关技术方面,百度也拥有人工智能所需的计算能力、算法和数据。在芯片、框架、模型、应用四层技术栈上都有布局。是国内少数拥有全栈人工智能的企业之一。有能力的企业。
与百度的技术研发储备相比,阿里巴巴和字节跳动可能是另外两家较早布局的玩家。
2月9日,正在进行内测的阿里巴巴达摩院版ChatGPT提前曝光。新产品可以实现的功能包括知识问答、AI画画、代码生成、小说续写、文案、诗歌填词等。从人工问答层面来看,达摩院版本的ChatGPT也实现了相对真实的答案,并且还实现了多轮问答。
事实上,2022年5月,超大规模多模态预训练模型M6发布后,阿里巴巴就公布了相应的能力。就AIGC而言,生成的现实生活图片已经非常逼真了。
据介绍,M6将模型参数规模扩展至10万亿,平均单卡可承载200亿个参数。根据阿里巴巴公布的数据,M6在相同参数规模下的能耗仅为此前行业基准的1%,大大降低了大模型训练的门槛。
在开发ChatGPT的道路上,Byte的全栈技术并不是很出色,但在商用方面却是比较先进的。 Tech星球了解到,Byte从去年底开始就一直在开发类似ChatGPT的项目。目前已经在内部推出了由AI Lab牵头的测试插件,并且仍在探索中。而此前,Byte 的 AML 团队内部开发了 Volcano Engine 大模型训练框架 veGiantModel。该模型类似于为 ChatGPT 提供支持的 GPT-3.5 系列模型。
在GPT-3.5之前,一位火山引擎前开发者告诉Tech星球,Byte很早就开始研究基于GPT2和GPT3的训练模型和产品,并且Byte的火山引擎也在开发NLP(自然语言处理)积累了研究经验在应用中。
目前,关于字节对话机器人、机器翻译、机器写作的研究很多,特别是在内容创作领域。在使用ChatGPT进行文章写作之前,字节跳动开发了小明机器人自动文章写作平台。自2016年上线以来,已累计撰写文章60万篇,涵盖17个体育赛事,支持6种语言。
近日,快手还表示正在开展大规模语言模型(LLM Large Language Model)相关研究,并启动了相应专项项目,涵盖LLM模型训练、自动文案生成、对话系统开发等领域。
此外,京东云延禧还宣布将推出ChatGPT的工业版:ChatJD,预计参数量数千亿,主要应用于零售和金融两个领域。
国内各大厂商为何未能抓住机遇?
大厂商纷纷涌入,但有实力的玩家并不多。
有研究估计,训练1750亿参数语言大模型GPT-3需要数万个CPU/GPU每天24小时输入数据。所需能源消耗相当于在地球和月球之间来回行驶,单次操作成本达450万。美元(约3000万元人民币)。
高昂的研发成本意味着主流大型模型只能由大型科技公司或少数研究机构掌握。
从参数数量来看,百度文心大模型有2600亿个参数,远高于GPT-3的1700亿个参数。但参数的数量并不代表模型的结果。中国并不缺乏数据。百度、字节跳动等公司积累了大量数据。但后续的数据清洗、标注、模型结构设计、训练、推理等步骤都需要时间的积累。这或许是国产大车型性能成绩不如国外惊艳的重要原因。
拉开差距的关键时间点是2020年中期,也就是GPT3.0刚问世的时候。一位流传的专家会议记录显示,当时很多人可能已经觉得GPT3.0不仅仅是一项技术,而且体现了AI模型开发的一个新理念,因为ChatGPT的开发者OpenAI对这项技术在国外也领先于谷歌。 ,谷歌大概落后OpenAI半年到一年,国内企业则落后两年。
这也与国内外不少科技公司认为ChatGPT并不是一项革命性技术有关。 ChatGPT是OpenAI对2020年发布的GPT-3模型进行微调后开发的对话机器人。严格来说,ChatGPT在底层模型上并没有取得重大突破。它巧妙地将理解、生成和交互结合起来。基于人类反馈的强化训练让人在体验中产生智能感。
Meta首席人工智能科学家Yann LeCun在不久前的一次媒体和高管在线小型聚会上表达了他对ChatGPT的看法:“就底层技术而言,ChatGPT并不是特别创新或革命性的。 。许多研究实验室正在使用相同的技术并进行相同的工作。”
一位百度员工告诉Tech星球,其实国内很多大厂商早就在做这方面的工作了,只不过不是往GPT的方向,而是往其他行业的方向。 2022年,很多开发者会基于百度问心来做应用,多用于心理咨询、求医、高考志愿者等场景。阿里巴巴的“统一”大模型还覆盖了包括AIGC在内的200多个服务场景。它也有智能对话,但不是很强。
他们没有意识到ChatGPT会颠覆现有的搜索模式,也没有准确预测ChatGPT会取代脑力劳动者。问题的关键在于,很多互联网公司认为“聊天”是一个非常肤浅的应用。从目前的场景来看,它是一个更强的聊天机器人,具有一定的问答属性,暂时没有商业用途。
一位与上述观点相同的Byte NPL算法工程师告诉Tech星球,ChatGPT是一个不确定性较高的项目,国内还没有成功的先例。如果真的是All-in来做的话,上面不一定会提供资源。更不用说将其作为优先事项。另外,国内技术能力确实有限。比如你想做一个大模型,你不仅缺乏资金,还缺乏人力和基础模型。这对于各大互联网公司等商业公司来说是非常困难的。
不仅在认知层面存在局限性,在技术层面也存在局限性。
目前,ChatGPT 上的信息截至 2021 年,这意味着如果将其用作搜索工具,显然无法获取实时信息。一位百度员工表示,百度现在正在解决实时信息的问题。与此同时,ChatGPT已经准备推出基于GPT-4的迭代产品,国内企业也有了新的追赶目标。
跟风趋势中,谁在趁热点?
“拥有大型模型的公司可以做ChatGPT,而没有大型模型的公司只是想博取人气。”
阿里云前大模型负责人杨红霞对目前互联网公司蜂拥建设ChatGPT的现状做出了尖锐的评价。她认为:“只有当大模型达到100B以上的水平时,它才能具备GOT能力(或者提供更难的推理问题的答案)。”
从这个角度来看,百度拥有超过20万企业用户的飞票平台,也拥有文心大模型,有望打造出最接近ChatGPT水平的对话产品;阿里巴巴有“统一”大模型,目前已实现万亿参数训练,M6开发在工业侧的应用场景也比较丰富;华为从2020年开始规划大模型,并于2021年发布了鹏程盘古大模型,这是业界第一个千亿级生成和理解的中国NLP模型。模型。
相比之下,一些宣布加入ChatGPT的互联网公司则处于技术研发和进展的第二梯队。比如360有深度学习平台Xlearning,但没有相关的大模型。同样宣布加入ChatGPT的网易有道,没有AI芯片、深度学习框架或大型AI模型。它只有在线教育的应用场景。这与据报道正在参加ChatGPT的学而思类似。公司只有学习机的应用。场景,但没有相关技术储备。
也有一些公司被认为是追逐潮流的概念。汉王科技受益ChatGPT概念股,1月30日开盘七涨停。2022年半年报显示,其接近chatGPT的文本大数据业务营收为7797.95万,仅占总营收的14% 。不仅收入占比较小,还同比下降了7.14%。公司发展艰难,但借助ChatGPT理念,股价一路飙升。
这还不是最引人注目的事情。 2月6日,寺库宣布将探索AIGC和ChatGPT技术在奢侈品相关业务中的应用。当日,寺库股价上涨124.4%。事实上,这家公司已经被列入“老叛徒”名单了。不少供应商欠款和消费者退款未立即结清,多次被国家市场监管总局列入失信企业名单。
与这些积极利用 ChatGPT 的热门公司不同,也有一些公司什么都不做,却借助 ChatGPT 取得了胜利。 2月8日,微软新版Bing集成ChatGPT技术上线。很多答案都来自知乎。当天下午,知乎股价一度涨幅超过56%。由于ChatGPT可能颠覆社区问答,知乎一直对ChatGPT相关事宜保持沉默。但也受到了市场的青睐,搭上了股价增长的列车。
当然,也有业内人士表示,很多中小企业不具备技术实力,因此也可以在一定程度上利用开源的Transformer大模型来实现ChatGPT功能服务。
不过,达摩院专家告诉Tech星球,目前基于Transformer的大规模预训练模型虽然能够很好地解决认知智能相关任务,但缺乏设计良好的纯Transformer模型,基本无法完成认知智能实现的尝试。智力。 。
就像字节跳动的案例一样,Tech星球向火山引擎的售前支持人员询问火山引擎是否有类似ChatGPT的产品?对方表示,平台没有这个产品,但可以通过“机器学习平台”与自家产品结合,通过二次开发,可以实现类似ChatGPT的效果。
Tech星球还发现,ChatGPT火爆后,前美团“二号”王慧文疑似卷土重来,声称投资5000万美元人工智能。与此同时,NPL、AIGC等相关职位吸引了很多人的关注,算法职位成为新的求职热门。在脉脉的职位热门榜单中,前十名中有8个是算法相关职位。
注:脉脉职位热门榜。
包括腾讯、阿里巴巴、字节跳动、小红书、菜鸟等相关招聘岗位均在NPL算法工程师等相关招聘岗位中增加了从业者需要熟悉GPT-3等相关模型的要求。招聘月薪大多在4万元左右,最高可达10万元。
2023年,ChatGPT点燃的火,可以锤炼真金企业和人才,也可以蒸发虚假概念。