深蓝媒体智库沙龙|三问大模型:流量见顶?越大越好?安全可控?
发布日期: 2023-08-18 09:52:36 来源: 北京商报

从拼参数到讲落地,短短半年时间,大模型经历了一次“神化”,又迅速“接地气”起来。在这轮“百模大战”中,人们越来越笃定,大模型将是比互联网以及移动互联网更大的机会。但在这个过程中,也不可避免地遭遇了技术、安全、商业化模式等方面的诸多挑战,如何跨过这些障碍,找到落地场景,打通商业模式,成为大模型的当务之急。


【资料图】

8月16日,由北京商报社、深蓝媒体智库主办的AI主题沙龙在新闻大厦艺术馆举行,沙龙以“大模型见真章”为主题,围绕着大模型产品、技术路线、场景寻找、伦理安全等诸多问题,探寻大模型商业化落地的可行之径。

会上,北京商报社社长兼总编辑李波涛在致辞中表示,在经济寻求向上突破的当下,几乎唯一没有争议的就是科技,科技可以带来力量。无论是产业还是行业,“破圈”都已形成一个越来越明显的趋势,希望通过深蓝智库的活动,实现产业、行业、人群的“破圈”,将更多前沿的科技成果向更广泛的产业、行业、人群进行传播和输出。

不是泡沫型发展

2023年,大模型接棒元宇宙,成为引爆科技圈的顶流。但半年过去了,由于尚未在产业端形成扎实的应用,人们也不免怀疑,大模型是否会像过去许多人工智能技术那样,数次达到爆发的边缘,但最终往往昙花一现。

对此,百度科技与社会研究中心主任余欢认为,这一波大模型的兴起不是AI概念第一次被热炒,经过70多年发展,人工智能经历了几次起伏,但不同的是,这一波大模型不再是泡沫型发展,而是已经成为当下人工智能的主流方向。

余欢表示,相比起之前的人工智能,这一波大模型的特点是泛化性更强、标准化程度更高、工业化发展趋势更明显。大模型解决的是中长尾的问题,即很多定制化场景无法解决的问题,能够在小样本、小数据的基础上,以相对低成本的情况满足场景化需求。

对于大模型的发展趋势,文渊智库创始人王超用马克·吐温的一句话总结,“历史不会简单地重复,但总是沿着相同的韵脚前行”。回顾整个科技史,从互联网到智能手机,都经历了爆发、泡沫、瓶颈和沉淀,“大模型同样如此,大模型是一个新的科技浪潮,但我觉得它的爆发、泡沫、瓶颈和沉淀期,包括商业化过程,会比互联网、智能手机浪潮更快”。

数据、用户和场景

技术实力并不等于变现能力,商业化是人工智能行业绕不过去的难题,对大模型来说也是如此。围绕着商业化的问题,新壹科技CTO张华伟的看法是:大模型商业化落地需要集齐数据、用户和场景,“商业化是一个长期的过程,一个颠覆性的创新需要打破现有业务去重构,目前国内大模型混战还在起步阶段”。

元语智能联合创始人兼COO朱雷则为大模型的落地概括出了三个关键词:快速、业务和增长。在他看来,当下人们认为大模型难落地,也是因为没有发现有价值的应用。面向企业客户做商业化落地,需要有真实的需求牵引,从用户出发,从需求出发,借用AI技术让业务快速增长。

朱雷解释称,“快速”是因为很多企业等不及,受限于预算、经营环境以及客户需求等问题,企业通常不能花费一两年的时间等待大模型达到GPT4的效果后才考虑落地。“业务”是因为很多模型厂商兜售方案时,其实与其主营业务没有太大关系,只是泛泛而谈的大模型场景,而无法解决具体的业务问题。“增长”则是因为当下很多方案都以“降本增效”为导向,但商业化公司的重点很多时候不在降本,而在增效。毕竟省钱的空间是有限的,只有挣钱才是最重要的事情。

中小微模式有望成主流

动辄千亿规模的参数是过去一段时间,大模型“秀肌肉”的关键之一,但这也延伸出了一个新的探讨,即大模型是不是越大越好?

在技术层面,360智脑产品资深专家葛灿辉认为,中小微模式有望成为国内主流。怎么理解中小微模式?葛灿辉解释,即在保持较高预测准确性的同时,大幅度减小模型的大小和计算成本,优化计算效率,以实现高效的模型预测在较小的设备上运行。

朱雷同样提到,大模型可能会有两大趋势,分别是端云共生以及大小并行。在端云共生方面,目前除了较头部的大模型制造商有云端API外,具体在端侧可能也存在广泛的应用场景,比如工业领域的一些具身智能机器人,以及一些XR眼镜等都可以跑端侧的模型。这种趋势可以概括为从以GPT4为代表的云端API模式慢慢迁移到端云并行的状态。

这也延伸出了第二个预测,大小并行。朱雷解释称,千亿规模的模型一直会存在,甚至可能出现更大量级的模型,但越来越小参数量级的模型可能也会有非常大的应用空间,也就是说要往轻量级模型上发展,能够运行在低端芯片上,并且可以产生不错的效果。

安全、可控、可靠

当下大模型应用方面还会遇到很多风险和挑战,包括幻觉、结果不可控、安全以及歧视、偏见等问题。解决好这些问题,是实现大模型落地的关键前提。

蚂蚁集团大安全AI算法资深专家郑霖表示,大模型只有更安全,在产业应用方面才能更深入更广泛。在新AI时代,蚂蚁集团从四个维度对可信AI做了重新定义,分别为大模型的可靠性、可控性、内容安全及合规以及伦理安全。

除安全问题外,郑霖认为,大模型还需要重视生态的打造,从底层架构,到中间算法,再到上层应用,整体需要各行各业的从业者参与进来,将生态搭建起来。包括芯片短缺和算力等问题,都需要这样一个生态去解决。

葛灿辉则将视角聚焦在了兼容这一问题上。据悉,整个场景布局中的核心是API(应用程序编程接口),这一平台的任务是赋能千行百业、打造开发者业务。

“API主要提供各种能力,比如翻译、对话能力等,简单说就是API接入大模型可以做新应用。”葛灿辉这样介绍基于大模型开发行业应用的过程,“底层是360多个基础大模型,基于底层能力、API开发者工具和360智脑API开放平台,客户可以开发各种行业应用,比如知识管理、医疗问答、智能客服等。”

在葛灿辉看来,API的开放和兼容对快速推进上述流程至关重要。他强调,“API一定要做到开放,360对外对内的API能力完全一致。兼容性在大模型时代也非常关键,360智脑的API和OpenAI的API是完全兼容的,用户只需要改一个API的地址,再改一个API Key,就可以用OpenAI原生的官方客户端调用360智脑的API,所以我们不需要开发客户端,第三方客户端可以直接用,这会让客户接入360智脑的效率大大提升”。

北京商报记者 杨月涵

关键词:

相关文章

热点图集