大模型的野心

大模型的野心

ChatGPT能干什么?陪人聊聊天?回答几个刁钻的问题?讲个笑话?当然这些它都能做,如果认为它只能做这些,就把它想简单了,同时也就无法理解为什么在短短几个月内,国内出现了几十个类似ChatGPT的大模型,而更多大模型还在路上。

在7月6日举行的2023世界人工智能大会上,几家大模型厂商的负责人在发言时,不约而同地提到了MaaS(模型即服务)。他们的目标是把大模型打造成一种服务平台。这种服务平台可以用于金融、办公、城市管理、医疗等各种各样毫不相关的行业。过去有互联网平台的说法,而今天,各路大模型的野心日渐明晰——做人工智能的平台。

ChatGPT背后的大模型GPT属于通用大模型。通用大模型掌握了很多通识,但对各类专业知识缺乏深入了解。过去几个月,这类通用大模型与生成式人工智能的发展实现了强大的语言理解与推理能力,并能按提词生成完整的段落、精致的图片、视频甚至代码等,让人工智能成为更强大的个人助手。

但是,要把通用大模型运用到各种不同的行业上,还存在不少问题。腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生6日在世界人工智能大会上说:“通用大模型一般都是基于广泛的公开文献与网络信息来训练的,网上的信息可能有错误、有谣言、有偏见,许多专业知识与行业数据积累不足,导致回答的行业针对性与精准度不够,输出的信息也相对宽泛。” 他认为,通用大模型可以在100个场景中解决70%—80%的问题,但未必能100%满足企业某个场景的需求。

不同的行业、企业需要有服务于各自领域的大模型。这类行业模型、专属模型基于通用大模型,但需要用专业数据进一步精调。精调后的模型就可以成为平台,服务千行百业。而这正是大模型的“小心机”。

腾讯云最近公布了腾讯云MaaS服务全景图,基于腾讯云TI平台打造行业大模型精选商店,提供金融、文旅、政务、医疗、传媒、教育等10大行业,50多个解决方案;推出行业大模型精调解决方案,帮助模型开发者与算法工程师,一站式解决模型调用、数据与标签管理、模型精调、评估测试与部署等任务,减轻创建大模型的压力。在这些模型和工具平台基础上,企业只要加入自己的场景数据,就可以快速生成专属模型。

华为的盘古大模型也有类似的思路。华为推出了新的三层大模型结构,分别是基础大模型、行业模型、场景模型。模型已经深入金融、制造、政务、电力、煤矿、医疗、铁路等 10 多个行业,支撑 400 多个业务场景的人工智能应用落地。华为轮值董事长胡厚崑说:“第一层基础大模型层我们形象地叫作读万卷书,就是要做好海量的基础知识的学习。第二层行业模型和第三层场景模型叫作行万里路。”从读万卷书到行万里路还有很多困难要克服,很关键的一点就是要把各行各业的知识与大模型进行充分匹配和融合。

大模型在各行各业的应用可以和芯片代工厂做个类比。百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰说,芯片代工厂有昂贵的设备、非常长的供应链、复杂的工艺。但是对于芯片设计公司,它不要考虑这些,只要把芯片设计方案交给代工厂,所有后续生产环节都由代工厂完成。未来,大模型的产业模式可能与芯片很类似。大模型平台有需要昂贵的算力、数据,生产大模型的企业把大模型平台打造好以后,那些需要应用大模型的企业,只需要把需求提出来,然后用少量数据对大模型进行精调、场景适配,就可以满足产业需求。

王海峰介绍,已经有很多场景在积极应用百度的文心一言,例如能源、金融、教育、办公、媒体等等。在文心一言这类大模型产业落地的进程中,可以采用“集约化生产,平台化应用”的模式,即具有算法、算力、数据综合优势的企业将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务。此外,百度的文心大模型3.5新增了插件机制,未来插件生态将逐步开放,开发者可以基于文心大模型打造自己的应用。

有人把大模型的未来比做租车平台,任何人都可以在大模型平台上获得符合自己需求的应用(就像租车平台上的车型)。2023年,国产大模型的平台之战已然打响。返回搜狐,查看更多

责任编辑:

发布于:四川阿坝松潘县