半岛电竞官网塑料模具厂家
首页 > 产品中心

张红甫_谁将胜出在大语言模型中国赛道拭目以待

发布时间:2023-12-09 18:12:47   来源:半岛电竞官网
    随着全球科学技术巨头谷歌的发展、微软等先后公开推出了类ChatGPT聊天机器人计划,更有不少中国
  • 产品概述

  随着全球科学技术巨头谷歌的发展、微软等先后公开推出了类ChatGPT聊天机器人计划,更有不少中国公司和组织宣布紧随其后,但是关于怎么落地的问题,都没有披露详情。

  中国内地及中国香港手机号都不能登记ChatGPT帐号。另外,尽管OpenAI应用程序编程接口(API)在161个国家或地区公开,但是,中国内地及中国香港除外。

  在ChatGPT非常有可能不向中国内地开放市场的情况下,各方就类ChatGPT项目是不是能够进行了讨论,及如何登陆中国内地市场,亦衍生出相当大的探讨。

  市民最关注,中国是否能成长为一个有国际竞争力的国家、比较适合在中国市场上使用大语言模型?如何通过语言推广提升国家软实力和塑造文化自信?在类ChatGPT项目发展过程中,中国企业有没有实力或者特有的优势作为后盾?在“一带一路”倡议背景下,如何实现语言经济价值与商业价值之间的平衡?什么样的中国企业终于可以走出来,可以登陆商业赛道了?

  本论文力图通过对国内外多位资深法律,科技学者和投资人及行业分析师和企业代表的访谈逐一回答上述问题。

  根本问题在于,中国能否落地ChatGPT相关技术?是否能够将其成功运用到下一代网络中去?与ChatGPT相似,由中国本土开发的大型语言模型,和国际间的距离几何?

  一位不愿透露姓名的美国高级法律人士对财经E法记者说,ChatGPT并没有对中国内地和中国香港的用户注册开放,也许这就是OpenAI在考虑了各种因素之后做出的商业决策。其中特别是OpenAI及微软法务人员对美国外贸管制法规或是“国家安全”事务处理的说明。

  南开大学法学院陈兵副院长在财经E法的分析中表示,ChatGPT不向中国内地及中国香港的使用者开放,也许是出于两方面的考虑。一方面OpenAI或许出于保护大语言模型类技术及商业秘密。

  另一方面则可能是“数据跨境”所致。中美两国在数据规则上存在差异,ChatGPT在算法上其实也在不断更新与革新,且算法运行需依赖于数据。所以在数据跨境流通过程当中,数据必须能够互联互通,否则就不具备可持续发展能力。若数据不能互通,则数据跨境流通存在诸多的问题与难题。

  在陈兵看来,ChatGPT在短期内进入中国的可能性很小。他指出:一方面,ChatGPT是一个语言模型,在进行语义分析时,可能抓取部分与国家安全相关的信息;另一方面,ChatGPT实际上是AIGC(人工智能生成式内容)的工具,人工智能所产生的内容,其本身就具有较强的价值传输性质。如果将其应用于意识形态领域,则有可能导致某些人滥用该工具来达到目的。其结果是除商业利益外采用ChatGPT、内容的传递可能对价值观与主流观点产生冲击,甚至牵涉到国家的安全。

  上述在美法律高级人士提出的2022年10月12日前,拜登政府在《美国国家安全战略》中明确提出了人工智能、半导体芯片,大数据,中美双方争夺的一个重要方面,将实行严格管制。美国头部人工智能企业考虑到运营风险,在可以预见的将来,只要不改变这一方针,有可能进入中国内地和中国香港市场“应该是挺低的”。

  整体上,中国政府对于国内企业创造相关的产品成持支持的态度。比如,2月13日北京市经济和信息化局发布的《2022年北京人工智能产业发展白皮书》提出,2023年,全面打牢人工智能行业发展的基础,支持头部企业创建对标ChatGPT大型模型,注重开源框架与通用大模型应用生型建设。

  科技创始人冯大辉曾撰文指出:“ChatGPT的出现,对于这个领域的中国参与者而言,其意义在于验证了LLM(大语言模型)的可能性。”在他看来,“大模型是一个可以实现大规模商业应用的工具。”在冯大辉看来,中外企业在技术层面并没有太大差距。国内企业实际上正在大模型的方向上穷追猛追。因为他们有足够多的经验和资源来支持模型开发、测试和应用。若仅就模型参数的大小而言,目前有万亿参数,甚至更高,实际相差不到1年,“技术方向上并不存在高不可攀的技术门槛。”

  至于哪一家企业能异军突起,冯大辉认为,可从五个方面加以评价。第一是技术能力,第二是业务模式的选择,第三是商业模式创新,第四是组织结构和人员架构优化,第五是战略落地。即算法,算力,数据和产品、情景这5个层面。

  按照冯大辉的分析,百度从算法,算力,数据等方面、在情景上皆有优势,也可从产品化能力方面进一步提高。“我觉得现在最重要的就是让用户去体验和使用,这不是一个简单的过程。”这一点,李彦宏还公开表示:“怎么把这么酷的技术变成人人都需要的产品,这一步其实才是最难的。”从互联网企业到传统行业企业,在大数据时代下如何做好内容分发?而且产品化能力也是各方面面临的一个难题。

  前经纬创投副总裁庄明浩认为,类ChatGPT这一AI交互方式下的产物,大概率仍是百度的首创之作,但牵涉到大模型的问题,和把大模型用在你的生意中,那么就有较大的可能性了。

  百度在2019年3月份首次推出了预训练模型ERNIE1.0,以及行业大模型的提出,搭建大模型的工具和平台,探索产品和社区。经过一年多时间的研发和实践,文心大模型正式上线。当前百度已经搭建文心大模型层,包括36个大模型,形成基础,完成使命、产业的三级模型体系。其中,文心大模型是一个基于多数据源的数据驱动的学习和建模过程。当前百度自研绘制多源异构知识图谱,具有5500亿多项知识,纳入文心大模型预训练。文心大模型是以文本为核心数据的结构化学习模型,具有强大的数据分析能力和建模效率。文心大模型已经在百度搜索,信息流,智能驾驶,百度地图,小度等等产品中得到了运用;其成果已经成为国家创新驱动战略的重要组成部分。通过百度智能云的制造,能源,金融,城市等、传媒和其他产业广泛使用;并将其嵌入到“文心一语”的人工智能知识库建设之中。借助大型模型工具平台、开源和开放模型和服务,文心大模型已被将近百万开的发者所采用。在人工智能领域,文心大模型是一个重要分支,它为人工智能技术的研究提供了丰富而有效的数据和知识基础。先于“文心一句”,百度也就是已经发布了生成式的AI产品“文心一格也”。

  华为云在2022年4月份推出盘古系列超大型预训练模型,其中包括中文语言(NLP)、视觉(CV)大型模型、多模态、科学计算的大模型。

  腾讯“混元”AI大模型于2022年4月份正式发布。它将为人工智能发展带来新契机。2022年9月2日,阿里巴巴推出最新“通义”系列大模型。这两个模型是人工智能领域最重要的成果之一。以达到融会贯通大模型,阿里达摩院搭建AI统一底座,达到模态表示,任务表示的目的、统一模型结构。

  艾媒咨询CEO、首席分析师张毅对财经E法记者说:中国,在ChatGPT上进行布局的公司分为两类:一是互联网传统大公司,第二种是一些初创企业。

  在发稿之前,已有百度、阿里、腾讯和京东等、网易和其他头部公司也陆续披露了加盟该赛道。许多创业家,还宣布加盟并期望打造与OpenAI对标中国企业。

  2月20日,复旦团队发布了国内首个类ChatGPT模式MOSS,邀请市民参加内测。该项目旨在为人工智能领域提供一种新的人机交互方式——基于自然语言处理和机器学习方法的非监督型建模与计算工具。MOSS能够直接进行对话的产生,编程、事实问答和其他系列工作,开辟了使生成式语言模型了解人类意图,具备对话能力的完整技术路径。

  中国企业为何会这么活跃?庄明浩说ChatGPT的问世,向中国企业证明按这一方向和途径去做就能取得成果,这也是他们密集加入的原因,并且宽容了一些沉没的代价。

  2月7日百度(NASDAQ:BIDU,9888:HK)是首家公开宣布要公布大语言模型产品文心一言和落地时间表的中国公司。由于百度针对“文心一句”(英文名ERNIE Bot)的落地计划,相当类似微软。随着微软商业变现计划渐渐清晰,还引起了各方面对百度“文心一句”中国潜在商业前景的推测。

  之前就有知情者对财经E法表示,在ChatGPT类型技术面前,谷歌就是一个受威胁的人,并以百度为受益者。一方面是技术方面,在中国,能够做大语言模型运用的企业寥寥无几。AI技术架构主要分为芯片层和框架层、模型层与应用层。其中,平台级芯片在国内还没有成熟,但已经可以量产。百度全部进行全栈布局;另一方面,大语言模型产品目前最好的商业应用是搜索,这恰好就是百度历来的基本盘。

  2月22日百度公布了截止2022年12月31日第四季度和全年未经审计财务报告。

  财报显示2022年,百度实现营收1236.75亿元,归属百度净利润(非美国通用会计准则等)为206.8亿元,比上年增长10%。四季度,百度实现营业收入330.77亿元,归属百度净利润(非美国通用会计准则等)为53.71亿元,比上年增长32%。2022财年百度核心已经连续4个季度表现超出市场预期。

  与前几年分散推介各业务线颇不一样的是,今年的财报总体上都集中在“文心一句”上。

  向百度全员内部财报信时,李彦宏发布消息称百度要把握即将出现AI拐点,规划融合了众多主流业务和下一代大语言模型——“文心一句”,其中包括搜索,智能云,Apollo自动驾驶等、小度智能设备等等。另外百度还将推出“文心一句”的大模式,支持更多的公司建设各自的模式与应用,为运输,能源赋能、制造和其他实体经济领域,达到了生产效率大大提高。同时,“文心一言传天下”也是今年最重要的战略举措之一。当天晚上8点半开始举行业绩报告会,李彦宏也给落地时间。“我们要用一年左右的时间完成所有的工作任务,文心一言是一个很好的开始,我希望它能够让大家对人工智能有更好地了解。”“会将‘文心一言’与百度搜索相连接,并于3月向公众开放。”

  李彦宏来信说:“中国AI市场即将迎来爆发性的需求增长,其商业经济价值的释放将是前所未有的、指数级的。”

  财报公布当天晚上,业绩报告会,分析师对ChatGPT及百度的“文心一句”提出了密集的质疑。百度管理层对此表示,从技术上讲,IT技术中技术栈主要有4层,芯片层和框架层、模型层与应用层。其中,模型层为算法提供支持,并负责与客户之间沟通和交流。”百度是人工智能公司,全栈布局,并引领了国内语言模型人工智能的发展方向。在未来,我们希望把语音识别、语义理解、知识图谱等技术都集成在一个平台上来实现应用场景。以及从商业机遇的角度,通过把“文心一句”融入百度的服务,用户粘性就会加大,为百度提供了更大的机遇。“文心一言以语音识别为基础,可以帮助客户快速获取相关信息。”文心一言的作用应能吸引新的用户与广告商,推动长期营收增长。

  百度瞄准“文心一句”落地方案,相当类似微软。从年初开始,“文心一言大数据”已经成为了各大网站竞相追逐的目标。以及微软商业变现方案,还引起了各方对“文心一句”商业前景问题的关注。百度的管理层在业绩会上说,“文心一句”的变现方式将会出现两种,其一,通过和搜索引擎的集成,增强用户体验,粘性强,招徕新用户然后提供对应的商品,例如为个人付费用户制作的短视频;其一,为合作伙伴提供一个框架,使它能自行研制应用模型与程序。

  除上述两种商业模式外,在庄明浩看来,“文心一句”也有可能以API调价或向商家布署私有、定制化的解决方案,实现商业变现。在“文心一言传天下”的计划中,“文心一语”将为互联网公司和传统行业带来新的商业模式创新。人工智能学会专家顾问郭涛说,除了在搜索引擎上嫁接“文心一句”这种直接兑现方式外,它也能通过为智能驾驶,电商、在百度生态体系中,如云服务,提供间接变现的大模型服务。

  因汉语特殊型,国内企业开发大模型遇到较大困难,但是如果有所突破,还将在本土的服务,有较大优势。

  近日,法国里昂商学院人工智能和商业分析专业教授丁文璿对媒体表示,语言对话模型的训练,有必要使机器形成文字的认识,英语略胜中文。他认为,汉语有很多词根和词义,如果用计算机来学习这些单词或短语,将十分艰难。丁文璿说明道,本国人工智能技术加工的中文语言,多数为象形词,并且英文具有解释性,相比之下,词语就不是非常多了。

  李彦宏2月22日在财报电话会上表示,百度大模型可确定为最高级中文语言模型,不只停留在语言上,更有百度对于中国文化深刻的了解,本土化大模型将更符合中国语言语境与中国市场。大型语言模型将来收入的机会很大,文心一言的发布之后,各类公司对百度都表示合作意向。