你的位置: 首页 > 极光网 > > 大白话聊透人工智能

大白话聊透人工智能AI规模定律突破不在练模型在这3个新方向

以前聊AI进步大家总说“模型越大、数据越多能力就越强”这就是所谓的“AI Scaling Law(规模定律)”。

但现在业界发现靠“堆规模”练模型的效果越来越差就像给植物浇水一开始浇得多长得快后来再怎么浇长得也慢了。

不过不用慌AI的发展焦点已经转了方向接下来的突破会从3个新维度来咱们一个个用大白话讲透。

一、定律“换赛道”:从“练模型时堆规模”转向“用模型时提能力” 先搞懂“规模定律”到底在“换”什么。

以前的“规模定律”核心是“预训练规模定律(Pre-trained SL)”简单说就是“练模型的时候把数据量、模型参数堆得越大模型就越聪明”。

比如以前练一个语言模型用1000亿数据、1万亿参数比用100亿数据、1000亿参数的模型写文案、答问题的能力强得多。

但现在这条路走不通了——不是堆得越大没用而是“边际效益平缓”也就是“多花10倍钱堆规模能力只多1倍”不划算。

所以行业开始把焦点转向两个新的“规模定律”相当于从“练内功”转向“练实战”。

第一个转向是“推理规模定律(Inference SL)”。

“推理”就是AI“用知识解决问题”的过程比如你问AI“怎么修漏水的水龙头”它要从脑子里调出“水龙头结构”“维修步骤”再组织成你能懂的话这个过程就是“推理”。

以前没人关注“推理”的规模现在不一样了——行业开始研究“怎么让AI在推理时能处理更复杂的问题、更长的任务”。

比如以前AI只能帮你想“修水龙头的3个步骤”现在能帮你想“先判断是阀门坏了还是水管漏了再告诉你买哪种零件甚至帮你查附近的五金店对比零件价格”这就是“推理规模”提升了能把“解决漏水问题”这个事从头到尾想明白。

第二个转向是最终目标:“智能体规模定律(Agentic SL)”。

“智能体”就是咱们之前聊的“能自己干活的AI”这个定律的核心是“衡量智能体综合能力的规模”。

简单说以前看AI强不强看“练模型用了多少数据”;以后看AI强不强看“智能体能不能搞定更复杂的任务、跟更多设备联动”。

比如一个智能体能帮你“搞定出差行程”这是基础能力;要是能帮你“搞定出差+同步处理工作邮件+跟客户预约面谈+回来后写出差报告”这就是“智能体规模”更大综合能力更强。

这个定律一旦成熟AI就能从“只会解决单一问题”变成“能包办一整套事”。

二、范围“扩圈子”:从“只会玩语言”到“能看、能听、能懂各行各业” 以前的“规模定律”基本只在“语言模型”里管用也就是AI“学说话、写文字”的领域。

比如练语言模型时堆的是“文字数据”提升的是“写文案、翻译、答问题”的能力其他领域不管。

但现在不一样了“规模定律”开始“扩圈子”往更多领域延伸最明显的就是两个方向。

第一个方向是“视觉模型规模定律(Vision SL)”也就是AI“看东西”的能力。

以前AI看图片只能认出“这是猫”“那是狗”因为“视觉模型”没怎么堆规模;现在行业开始用“规模定律”练视觉模型——堆更多的图片数据、更大的模型参数让AI不仅能“认东西”还能“懂东西”。

比如你给AI看一张“厨房乱糟糟的照片”它不仅能认出“有脏碗、没叠的抹布、散落的调料瓶”还能告诉你“收拾步骤:先把脏碗放进洗碗机再叠好抹布最后把调料瓶归位到橱柜第二层”甚至能根据照片里的橱柜大小推荐“买哪种调料架更合适”。

这就是“视觉规模”提升了从“能看”变成“能看懂、能给方案”。

第二个方向是“领域特定规模定律(Domain SL)”也就是“针对具体行业的规模定律”。

以前的AI是“通用选手”什么行业的问题都能答但都不精;现在行业开始给AI“分专业”针对医疗、教育、汽车这些具体领域用“规模定律”练“专业模型”。

比如医疗领域练模型时堆的不是“通用文字数据”而是“几百万份病历、几千万张CT影像、几万种疾病的诊疗指南”这样练出来的医疗AI不仅能“认出CT里的肿瘤”还能根据患者的年龄、病史推荐“先做穿刺检查还是直接手术”甚至能对比“不同化疗方案的副作用和治愈率”给医生参考——这就是“医疗领域的规模定律”让AI从“懂点医疗常识”变成“半个医疗专家”。

现在这两个方向一扩展AI就从“只会玩语言的单一选手”变成“能看、能听、懂各行各业的全能选手”多模态(又会说、又会看、又会懂专业)的能力越来越强。

本小章还未完请点击下一页继续阅读后面精彩内容!。

本文地址大白话聊透人工智能AI规模定律突破不在练模型在这3个新方向来源 http://www.jigww.com

最新推荐

编辑推荐

热门小说