通用还是行业?人工智能“百模大战”愈演愈烈,国内厂商掀起“路线之争”

通用还是行业?人工智能“百模大战”愈演愈烈,国内厂商掀起“路线之争”

国内人工智能的发展正呈现燎原之势,各大小厂商纷纷抢占风口,企图在这场新的“技术革命”中占据一席之地。

在7月8日刚结束的2023世界人工智能大会上,包括百度文心、阿里通义、华为盘古、讯飞星火、商汤日日新等在内的30个大模型亮相,吸引了众多行业人士的关注。而事实上,国内的大模型数量远远不止这些,在5月底举行的中关村论坛上,就有专家披露,据其当时统计,中国10亿级参数规模以上大模型已发布了79个。

→7月8日,2023世界人工智能大会在上海世博中心闭幕。图源|澎湃新闻

国内厂商一拥而上的背后,却是多数大模型普遍呈现出使用体验重复、反馈同质化的情况。在WAIC现场,九派财经注意到,已发布的大模型多数局限于对话问答、文生图等类玩具形式,而这源于几个月前以ChatGPT为代表的通用大模型带来的深刻变革。优刻得CEO季昕华曾表示,目前国内130家研发大模型的公司中,通用大模型就占了78家。

对这一现象,达观数据CEO陈运文则在接受九派财经采访时表示,目前多数厂商只是做一个泛泛的通用大模型,产品同质化会非常严重。通用大模型回复的内容看上去好像滴水不漏,但是它的价值并没那么高。陈运文认为,未来大模型真正的机会在于更加垂直的行业大模型。

但也有从业者称,培养属于中文世界的通用大模型对于未来更具深刻意义。“通用大模型就像经历了通识教育的大学生,而行业大模型是专才,只有在前者的基础上,才能锻炼出符合中文语境下的行业模型。”

通用还是行业?国内人工智能领域的大模型路线之争已经掀起。而业内普遍认为,无论是何种选择最终都应回归使用场景。“百模大战以后,是时候要开始落地了。我们叫先打雷再下雨,接下来是需要能够让这些模型的能力在千行百业落地应用,能够渗透进去能够赋能行业。”陈运文称。

【1】路线之争:通用大模型向上,行业大模型向下

随着竞赛进入白热化,各家大模型发展路径已现殊途。

以腾讯为例,在本次WAIC展会现场,腾讯没有带来万众期待的混元大模型,反而将重点放在展示了诸如三分钟快速生成数智人、音频自动剪辑生成、AI构建游戏等多个实际落地场景上。

对此,接近腾讯的人士告诉九派财经,在ChatGPT带来通用大模型之前,行业大模型已经实际运用在各行业了。“通用大模型是偏体验性的,而解决问题应深入行业场景,这是腾讯所擅长的。目前腾讯计划是两条腿走路,通用和行业齐头并进,但会把更多精力放在后者。”

腾讯云总裁汤道生在大会现场同样强调了行业大模型的重要性。他表示,企业的大模型应用需要综合考虑行业专业性、数据安全、持续迭代和综合成本等因素。基于行业大模型,构建自己的专属模型,也许是企业更优的选项。

相较于两条腿走路的腾讯,在通用还是行业的选择题上,华为的表现更为直接。7月7日,华为发布了盘古3.0大模型,华为轮值CEO张平安在被问到与ChatGPT对比优势时称,盘古大模型不作诗只做事”。他表示,如果一个大模型不能解决行业问题,参数再多也没有意义。因此盘古未来只面向于B端客户开放。

但这并不意味着,已投入使用的通用大模型会失去用武之地。

商汤科技联合创始人王晓刚在接受媒体采访时表示,商汤推出的通用大模型“AI大装置SenseCore”可以被理解为商汤内部的一个基础设施。各个大模型的团队在做好大模型的同时,也会把模型提供给各个行业里面的行业线。

其次,“通用大模型在某种程度上也是一种智力对比。”有业内人士告诉九派财经,目前大模型都是基于英语进行训练,这种情况对国内研发行业大模型很不友好,由于语言不共通,预训练时数据在语音、语义上会发生变化,最终效果并没有那么好。目前,很多专家学者普遍认为,基于中文系统建立大模型是必要的。

此外,通用大模型在某种程度上位普及AI概念。从以前的摸不见看不着,到人人都可接触和使用,这有利于大模型公司挖掘更多的潜在市场和客户。当下之所以能出现百模大战,离不开通用大模型对用户心智的启发。

腾讯云副总裁、腾讯云智能负责人吴运声同样表示,不必将通用大模型和行业大模型对立起来。他认为,现在是大模型发展的早期阶段,“只有在不同的领域里面,有更多的资源加入进来,才会尝试不同的可能性,然后在一个时间点到了,出来不一样的东西。”

【2】分野or合作:成熟大模型的未来是商业化落地

通用大模型与行业大模型在选择上或许并不冲突,但从商业应用以及用户需求看,更垂直、更落地仍旧会是未来大模型混战的方向。

7月7日,腾讯研究院发布的《人机共生——大模型时代的十大AI趋势观察》报告指出,行业应用是大模型的主战场。优刻得科技股份有限公司董事长兼CEO季昕华表示,目前垂直的大模型有52个,但按照趋势未来数量只会越来越多。

这样的判断并非没有道理。从通用到行业,其背后的逻辑是,稍微成熟的大模型需要进一步商业化落地。

据了解,在B端,企业更欢迎垂直专精的行业大模型。一位体验过大模型客户向九派财经表示,因为ChatGPT横空出世,大家都意识到了这是个重新洗牌的机会,都在主动拥抱大模型,但不少客户拿到基础大模型后有点发懵,不知道具体跟哪个业务或场景结合、不知道如何进一步训练成行业专有模型。“我们希望大模型公司能够直接提供有效,或者了解用户需求后去进行精调。”

陈运文也告诉九派财经,专业的文本处理市场和问答闲聊的市场有所不同,原本企业报告、文档资料全是靠人工,速度慢、错误率难保障,而达观数据本次在WAIC展出的曹植大模型很长一段时间扎根在文本垂直领域,投入市场应用后,市场需求表现出了极强的迫切性。

但就算是精度更高的行业大模型,在普及推进上也有一定困难。IDC指出,2021年72%的中国企业仍在人工智能单点试验或局部落地的阶段踌躇不前,并未持续深入地进行部署。

据九派财经了解,目前企业的顾虑主要来源于两个方面,一是数据安全问题,将每家公司的核心商业数据投喂给AI,训练过程中一旦产生信息泄露,对企业无疑是致命的;二是如何给大模型定价引发的成本问题。由于行业处于早期状态,大模型能做什么尚且未知,各大模型公司的报价也存在较大差异,需求端一般难以直接判断大模型带来的商业价值。综合上述两点,大量企业面对大模型仍处于“浅尝”的阶段。

“大模型真正的商业化落地还有很长的路要走,但由于百模大战带来的可选择性变多、,这对行业会是一个很好的开始。”上述业内人士称,目前已有公司在探索能够及时落地的解决方案了。

据极客公园报道,一位头部 SaaS 厂商在发布自己的大模型升级应用时表示,“我们不自研大模型,而是在不同的业务场景中,哪个大模型擅长什么事情,就接那个模型。”

“大模型未来在企业的落地形态一定是大模型和多个企业垂直小规模的组合,真正的机会在垂直行业市场落地。”陈运文将大模型比喻为衣服的码数,比如S号、M号、L号的,不同尺寸的模型组合在一起,能将效率发挥到最大,扬长避短。

九派财经记者 郭梓昊 黄依婷 发自上海

【来源:九派新闻】

版权归原作者所有,向原创致敬返回搜狐,查看更多

责任编辑:

发布于:山东青岛平度市