21深度｜“百模大战”进阶，大湾区怎样打赢AI追赶赛的下半场

发布日期：2024-11-19 20:34 点击次数：99

（原标题：21深度｜“百模大战”进阶，大湾区怎样打赢AI追赶赛的下半场）

21世纪经济报谈记者赖镇桃广州报谈

2023岁首，ChatGPT掀翻大模子激越，国内互联网厂商也纷繁下场“手抓模子”，“百模大战”死灰复燃。

但到了2024下半年，狂热启动渐渐褪去，科技界、学界到投资界进入从容阶段——反念念生成式AI怎样落地、买卖化，大模子的智商界限和迭代标的。

“从国内的全体发展看，到本年7月底，中央网信办批准的大模子省略有200个，其中惟有三分之一是通用大模子，三分之二是行业大模子。我展望改日通用大模子的数目和占比会越来越小，行业大模子会越来越多。”香港科技大学校董会主席、好意思国国度工程院外籍院士、英国皇家工程院外籍院士沈向洋在2024大湾区科学论坛上说谈。

简言之，通用大模子会缓缓往行业标的抑制，这意味着东谈主工智能和产业的诱惑会越来越精良，对实体经济的赋能也会更加权贵。在民营经济活跃的粤港澳大湾区，不错怎样挖掘东谈主工智能的新一轮机遇？

11月16—18日，2024大湾区科学论坛在广州南沙举行，包括诺贝尔奖得主、国度最高科学技巧奖获取者、菲尔兹奖获取者在内的百余位顶尖科学家皆聚于此，对东谈主工智能等前沿科技话题张开锐利筹办。

从通用到行业模子

业界浩荡把大模子历练形容为“真金不怕火丹”——在Transformer架构基础上，堆百亿、千亿级别的参数，达到一定阈值后，模子的谈话清爽、推理、生成智商出现一个较着跃升，也即是常说的“显露”。

但这个经过需要破坏巨额算力，烧钱天然不在话下。据国盛证券算计，GPT-3历练一次的资本约为140万好意思元。OpenAI的财务数据炫夸，到2029年都恐难罢了盈利，到2026年耗损可能达140亿好意思元，当中大部分的破耗要插足到模子历练中。

不啻OpenAI，烧钱基本是大模子公司的常态，因而怎样罢了盈利、完成买卖退换，成为横亘在这些公司眼前的现实问题。而对业界来说，也要回话大模子除了用于对话、还能拿来干嘛的问题。

“中国历练大模子的速率很快，临了国内会剩下几家企业具备万卡算力，来作念实在底层的基座大模子。一朝有这么的通用大模子后，实验上更专诚旨真谛的是行业大模子。”沈向洋指出，改日在医疗、金融等垂直赛谈，有千张显卡就不错作念行业大模子。每个企业确定也要作念我方的大模子，在行业大模子、通用大模子基础上加上我方的数据，几百张卡就不错作念一个企业大模子，对内莳植扫尾，对外不错莳植产物的可用性。

Gartner的问卷访问发现，70%的公司正在投资于生成性AI讨论，并将其纳入其业务战术。

本年以来，谷歌、微软和Meta都在拓荒我方的特有定制模子，为客户提供个性化的做事。通过特定领域的预历练、模子对皆、监督微调，来支配于特定行业。

加拿大工程院院士、欧洲科学院院士、香港科技大学盘算机科学与工程系讲座教唆郭嵩向21世纪经济报谈记者暗示，学术界在作念0-1的科学发现，不一定能平直产出经济效益。这些年，我方团队通过联贯子验室的顺次和大型企业建立了密切筹商，也和医学院、大型病院建立了配合，对医疗医学建立了更潜入的清爽。在这个基础上，能力作念出精确的垂类大模子，不久前团队刚发布了四个医疗的大模子，引起了不小反响。这是一种经久的顺次，即是把AI的技巧、科学盘算的公式融入行业，和特定领域的常识谐和谐和，这么随机能够产生实在有用的大模子。

大模子正在“向下扎根”，这无疑是产业生态活跃的大湾区上风场合。

中国科学院院士、深圳大学校长毛军发合计，珠三角最艰巨的上风即是民营经济相等活跃，更动创业的氛围应该说是全中国乃至全世界最佳的地区之一。东谈主工智能技巧产业化无非即是两种模式，一种是AI+X，另外一种是X+AI，X即是产业支配，况兼毛军发合计X+AI可能更艰巨，应该由百行万企的企业、企业家对东谈主工智能提议需求，并寻找到关系支配落地。

支配层恰是大湾区东谈主工智能的主要发力领域。就以广州为例，丰富的支配场景仍是招引了一浩荡东谈主工智能企业，显露出云从科技、文远知行、极飞科技等明星企业，它们在自动驾驶、智能农业等不同领域走出各异化发展之路。

防御“卖铲子的东谈主”

业界常言，东谈主工智能的发展有三因素——数据、算力、算法。算法决定模子的准确性和扫尾，数据是养料，决定内容输出的质料，算力则是铲子，是历练大模子的基础。

沈向洋说起了一组数据，从2019年到当今，每一年出来的最新大模子所需要的算力和前一年比拟，刚启动是以每年翻六七倍的鸿沟在增长，最近几年领略下来，省略以每年翻四倍的增速在增长。不错假想，算力需求一年翻几倍，十年下来这个数字会相等夸张。因为大模子对应巨额参数，需要的数据量也在增多，历练模子的算力需求也会激增。是以在扫数这个词AI波澜中，最大的赢家是英伟达。

“这几年我常常讲一句话，叫‘讲卡伤厚谊，没卡没厚谊’，算力是东谈主工智能发展的门槛。”沈向洋点出。

往常两年，英伟达市值翻了10倍，一度登顶众人市值之王，足见算力在东谈主工智能江湖里的地位。

但业界也知谈，依赖单逐一个“卖铲子”的东谈主是有风险的，因为它不错操纵供货、主管价钱。

东谈主工智能与数字经济广东省实验室（深圳）协理副主任黄玄学暗示，咱们面对的一大挑战是，英伟达抛弃GPU出口，以前有卡不错建大鸿沟集群，当今不一定建得了。要处理这个问题，如故得走独力重生的谈路，立足于国产算力。是以咱们鹏城云脑，从II到III都是由华为供应自主芯片的。

同期，处理国产算力问题最主要的如故生态问题。黄玄学进一步指出，咱们当今用的许多大模子、开源软件都是从国际来的，大部分是基于英伟达的。自主更动之后，因为芯片改动了，底层的一些算法就不相通了，是以咱们要拓荒雷同英伟达CUDA的系统，不错适配国际的软件，同期也不错自主研发我方的更动支配，这么来处理算力的问题。

着眼大湾区，深圳正自便设立国度超算深圳中心、鹏城云脑、腾讯云等算力基础范例。此前IDC发布的《众人盘算力指数评估发达》炫夸，中国的算力产业鸿沟和万般性当前正延续高速增长，2018年至2022年，深圳的算力鸿沟位居宇宙前三。

旧年5月，鹏城实验室初度对外发布了中国算力网盘算。此次大湾区科学论坛上，中国工程院院士、鹏城实验室主任高文先容，行动国度关键科技基础范例，鹏城云脑Ⅱ已在IO500众人总榜单中流畅8次夺得首脑，设立中的鹏城云脑Ⅲ建成后，算力鸿沟将达到16000P，格外于832万台家用电脑算力之和。

“大模子并非无所不成”

本年6月，牛津大学发布讨论发达《Theory is all you need》，标题上和大模子的开山之作《Attention Is All You Need》相呼应，但牛津的发达则裂缝了大模子为代表的AI局限性问题。该发达指出，东谈主类理解的骨子是“表面驱动”的，东谈主类不仅能够通过现存数据得出合理推行，更能基于假定、直观以及跨领域的瞎想，提议具有前瞻性的更动观念。但大模子的骨子更接近于对已有常识的师法，而非对新常识的原创性探索。

沈向洋也合计，大模子天然作念出来了，可是不可诠释，也不领略，就出许多的问题。东谈主们合计智能有限，似乎大模子出来之后，智能就出来了。但同期，许多东谈主也在怀疑，当今这么的一套体系是不是简直不错走很远。旧年，我方也在香港科技大学组织了一批科学家去研讨，“显露”背后的数学旨趣到底是什么，试图绽开大模子的“黑盒”。

清华大学教唆李宗鹏也向21世纪经济报谈记者暗示，大模子出来后，许多东谈主以为它不错用来作念许多事情，颠覆扫数这个词经济方法，可是实验上大模子并非无所不成。就说AI幻觉这个点，从数学的角度看，这是大模子恒久解脱不了的问题，因为天然谈话处理是基于概率生成和输出内容的，从这少许看，就没目标确保百分百准确。是以AI不错作念艺术、文本创作，可是在作念需要尽头精确的事情时，确定会存在局限性。

现阶段，大模子依然在沿着鸿沟法例（scaling law）在发展，也即是堆叠的参数、投喂的数据越多，模子就越广阔。但质疑的声息经常出现，即使互联网的数据棋布星陈，但朝夕会有用完的一天，况兼靠堆参数历练模子，这么的顺次会越来越不经济。鸿沟法举例故一条可行的路吗？

在郭嵩看来，从当前来看，顶级的科技公司还是曲常笃信鸿沟法例，信托跟着参数、数据有指数级的增长，显露的智商也会有权贵增强，也即是说插足和产出大要如故成比例的。至于改日要怎样去颠覆、下一个王法是什么，就要有待科学界和业界去探索了。但不错防御的是，李飞飞教唆提议来的空间智能，她合计这是AI的下一个标的。浅易而言即是，当今的大模子还停留在谈话层面，但谈话是闹翻的，也难以酿成对物理世界的实在清爽，是以诱惑对空间、时候等深层圭臬的清爽，能力往通用东谈主工智能（AGI）更近一步。

让建站和SEO变得简单

21深度｜“百模大战”进阶，大湾区怎样打赢AI追赶赛的下半场

热点资讯

相关资讯