pg电子(中国)有限公司

集(ji)团 业务

当前位置:
集团业务 >行业动态

陆奇说了什么

2023-05-12 17:05

作者 | 张小珺

来(lai)源 | 腾(teng)讯(xun)pg电子(zi)

(ID:qqtech)

就连(lian)陆(lu)奇都说(shuo)他(ta)跟不(bu)(bu)上大模(mo)型时代(dai)的(de)狂飙速度(du)了(le)(le)。他(ta)让下属做“大模(mo)型日报”,一方面便于他(ta)跟上论(lun)文(wen)和信(xin)息(xi)更(geng)新,另一方面给奇绩生态创业者共享(xiang)。他(ta)用了(le)(le)三(san)个“实在(zai)(zai)”表达(da)这一点。“我(wo)实在(zai)(zai)不(bu)(bu)行了(le)(le),论(lun)文(wen)实在(zai)(zai)是跟不(bu)(bu)上,代(dai)码实在(zai)(zai)是跟不(bu)(bu)上。Just too much(太多了(le)(le))。”陆(lu)奇在(zai)(zai)近(jin)期一次分享(xiang)活(huo)动(dong)上说(shuo)。

这样的(de)时(shi)刻还从(cong)没有过(guo)。奇(qi)绩创(chuang)坛创(chuang)始人兼CEO陆奇(qi)是中国(guo)(guo)AI布道人,也(ye)是中国(guo)(guo)针对(dui)大模(mo)型(xing)最有发言权(quan)(quan)的(de)人之(zhi)一。他曾在(zai)全球(qiu)巨头身居(ju)要职(zhi),先后(hou)任职(zhi)于IBM、雅(ya)虎、微(wei)(wei)软、百度(du),曾是华人在(zai)美国(guo)(guo)pg电(dian)子公司最有权(quan)(quan)威(wei)的(de)高层人士,位至雅(ya)虎和微(wei)(wei)软执行副总裁,回国(guo)(guo)加盟百度(du)出(chu)任集团总裁兼COO。陆奇(qi)以勤勉的(de)工作为pg电(dian)子圈(quan)著称(cheng)——每天清晨(chen)4点起床,跑步(bu)5英里,6点准(zhun)时(shi)到办公室(shi)。

同时,他(ta)和OpenAI有着深厚渊源。陆奇所(suo)掌管的(de)奇绩前身是(shi)YC中国,是(shi)美(mei)国著名创业孵化器YC(Y Combinator)的(de)中国分支。他(ta)也是(shi)YC全球研(yan)究院院长。而(er)OpenAI首席执行官Sam Altman正是(shi)YC二代接班者、现任总裁。两人虽相(xiang)差24岁,却(que)是(shi)忘年(nian)交,相(xiang)识已逾18年(nian)。当初正是(shi)Sam Altman屡(lv)次力邀陆奇加盟YC。所(suo)以,陆奇对YC、对Sam Altman和OpenAI都有长期的(de)近距离(li)观(guan)察。

2023年4月22日,陆奇(qi)在上海举行小(xiao)规(gui)模演讲(jiang),腾讯新闻有幸参与了旁听。陆奇(qi)希望帮助中国创业(ye)者(zhe)认清这(zhei)次历(li)史性(xing)的(de)拐点时(shi)刻,定位今天的(de)时(shi)代坐标、找准自己的(de)位置。“这(zhei)个(ge)时(shi)代跟淘(tao)金时(shi)代很像,”他说(shuo)道(dao),“如(ru)果你那个(ge)时(shi)候去加州淘(tao)金,一大堆人(ren)会死掉。但是卖勺子、卖铲子的(de)人(ren)永远可以(yi)赚钱。”

陆奇很(hen)反(fan)感蹭热点,他一再(zai)警示创业者蹭热点只会浪费(fei)机会。到(dao)现在为止,你几(ji)乎(hu)很(hen)难在公开渠道听到(dao)陆奇的观点。这也让本(ben)次演讲具有稀缺性(xing)。

事实上,在大模型快速达(da)成社会共识之(zhi)际,一(yi)部分人期待陆奇博士披甲上阵,做(zuo)“中国的(de)Sam Altman”——扮演可能(neng)比一(yi)名投(tou)资(zi)者、布道(dao)者更(geng)关键的(de)角(jiao)色。但据奇绩(ji)内部人说:“Qi目(mu)前100%时间花(hua)在奇绩(ji)。”

腾讯新闻作(zuo)者将这场分享进行了完整的整理——演讲涵盖他对大(da)模型时(shi)代(dai)的宏观思考(kao),包括拐点的内(nei)在(zai)动因、技术演进、创(chuang)业公司(si)结构性(xing)机会(hui)点以及给创(chuang)业者的建议。大(da)家可以各(ge)取所需(xu)。

好(hao)了(le),让我们来(lai)看看陆奇怎么说。为了(le)方便阅(yue)读,作者做了(le)一些(xie)字句修改(gai)和文本(ben)优(you)化。

社会性拐点的核心

是(shi)一项大型(xing)成本从边际变(bian)成固定

我认识Sam Altman是2005年(nian),他(ta)那时19岁不到(dao),我已经40多岁了。

我(wo)们俩是(shi)忘年交。他是(shi)一个很善(shan)良(liang)也很奇怪的小孩,今天(tian)很高(gao)兴(xing)他能这样改变世界。前不久,我(wo)春节(jie)在美国(guo)3个月,也到OpenAI和Sam聊了(le)一些。

首(shou)先,怎么理解(jie)这个新范式(shi)?这张图能把ChatGPT和(he)OpenAI所带来的(de)一切讲清楚。之后,基于第(di)一性原理,你(ni)自然会推演出所在赛道的(de)机会和(he)挑(tiao)战。

这张图是“三(san)(san)位一(yi)(yi)体结构演化模式”,本质是讲任(ren)何复(fu)杂体系(xi),包括(kuo)一(yi)(yi)个人、一(yi)(yi)家(jia)公司、一(yi)(yi)个社会,甚至数(shu)字(zi)化本身(shen)的数(shu)字(zi)化体系(xi),都是复(fu)杂体系(xi)。“三(san)(san)位一(yi)(yi)体”包括(kuo):

“信息(xi)”系统(subsystem of information),从(cong)环境当中获得信息(xi);

“模型”系统(subsystem of model),对(dui)信(xin)息做一种表(biao)达,进(jin)行(xing)推理和规划;

“行动”系统(subsystem of action),我们最终和环境做交互,达(da)到(dao)人类想达(da)到(dao)的(de)目的(de)。

任何体系(xi),都是这三个体系(xi)的组合(he),数字(zi)(zi)化系(xi)统(tong)尤其如此。数字(zi)(zi)化和人(ren)分不(bu)开(kai)。人(ren)也(ye)一(yi)样,人(ren)要获得信息、表达(da)信息、行动解决问(wen)题或满足(zu)需(xu)求。

基(ji)于此,我们(men)可以得出一个简单结(jie)论。今天大(da)部(bu)分(fen)(fen)数字(zi)化产品和公(gong)司,包(bao)括Google、微软、阿里(li)、字(zi)节,本(ben)质是(shi)信息搬(ban)(ban)运公(gong)司。一定要记(ji)住,我们(men)所做的(de)一切,一切的(de)一切,包(bao)括在座的(de)大(da)部(bu)分(fen)(fen)企业都在搬(ban)(ban)运信息。Nothing more than that,You just move bytes(仅此而已,你只是(shi)移动字(zi)节)。但它(ta)已经足(zu)够好,改(gai)变了世界。

早在1995-1996年,通(tong)过PC互联网迎(ying)来一个拐点(dian)。那时我刚从CMU(卡内基梅隆大学)毕业。大量公司层出不(bu)穷,其中诞生(sheng)了一家伟(wei)大公司叫Google。为什么(me)会有(you)这个拐点(dian)?为什么(me)会有(you)爆(bao)炸式(shi)增长?把这个观点(dian)讲清(qing)楚(chu),就能把今天的拐点(dian)讲清(qing)楚(chu)。

原因(yin)是,获取信息的边际成(cheng)(cheng)本开始变成(cheng)(cheng)固定成(cheng)(cheng)本。

一定(ding)要记住(zhu),任何改变(bian)(bian)社会(hui)、改变(bian)(bian)产业的,永(yong)远是结构性改变(bian)(bian)。这个结构性改变(bian)(bian)往往是一类大型成(cheng)本(ben),从边(bian)际成(cheng)本(ben)变(bian)(bian)成(cheng)固定(ding)成(cheng)本(ben)。

举个例子,我在CMU念书(shu)开车离(li)开匹茨(ci)堡出去(qu),一张地(di)图(tu)3美元,获(huo)取信息很贵。今天(tian)我要地(di)图(tu),还是(shi)(shi)(shi)有价(jia)钱,但都(dou)变成(cheng)(cheng)固定价(jia)格。Google平均一年(nian)付10亿美元做一张地(di)图(tu),但每(mei)个用户要获(huo)得地(di)图(tu)的(de)信息,基(ji)本(ben)上(shang)代价(jia)是(shi)(shi)(shi)0。也就是(shi)(shi)(shi)说,获(huo)取信息成(cheng)(cheng)本(ben)变0的(de)时(shi)候,它一定改变了所有产业。这就是(shi)(shi)(shi)过去(qu)20年(nian)发生的(de),今天(tian)基(ji)本(ben)是(shi)(shi)(shi)free information everywhere(免费的(de)信息无(wu)处不在)。

Google为(wei)什(shen)么伟大?它(ta)(ta)把边(bian)际成(cheng)(cheng)本变(bian)(bian)成(cheng)(cheng)固(gu)定(ding)成(cheng)(cheng)本。Google固(gu)定(ding)成(cheng)(cheng)本很(hen)高,但它(ta)(ta)有个简单(dan)商业(ye)模(mo)式叫广告,它(ta)(ta)是(shi)世界上高盈(ying)利、改变(bian)(bian)世界的公(gong)司,这是(shi)拐点关键。

今(jin)天2022-2023年的(de)拐点是什么(me)?它不可阻挡(dang)、势不可挡(dang),原(yuan)因(yin)是什么(me)?一(yi)模(mo)一(yi)样。模(mo)型的(de)成本从(cong)边际走向固(gu)定(ding),因(yin)为有(you)件事叫大模(mo)型。

模(mo)型(xing)(xing)的成本(ben)开始从边际走向(xiang)固定,大模(mo)型(xing)(xing)是(shi)技术核(he)心(xin)、产业化基础(chu)。OpenAI搭好了,发展速度爬升会很快。为(wei)(wei)什么(me)模(mo)型(xing)(xing)这(zhei)么(me)重要、这(zhei)个拐(guai)点这(zhei)么(me)重要,因为(wei)(wei)模(mo)型(xing)(xing)和人(ren)有内在关(guan)系(xi)。我(wo)们每个人(ren)都是(shi)模(mo)型(xing)(xing)的组合(he)。人(ren)有三种模(mo)型(xing)(xing):

1.认知模型,我们能看、能听(ting)、能思考、能规划;

2.任(ren)务模(mo)型,我们能爬楼梯、搬椅子剥(bo)鸡(ji)蛋;

3.领域模(mo)型,我们有(you)些(xie)人(ren)是(shi)医生,有(you)些(xie)人(ren)是(shi)律师,有(you)些(xie)人(ren)是(shi)码(ma)农。

That’s all。我们对社会所有贡献都是这三种模型的组合。每个人不是靠手和腿的力量赚钱,而是靠脑袋活(huo)。

简单(dan)想一想,如果你(ni)没有(you)多大见解,你(ni)的(de)模型能力(li)大模型都有(you),或者(zhe)大模型会(hui)(hui)逐步学(xue)会(hui)(hui)你(ni)所有(you)的(de)模型,那(nei)会(hui)(hui)怎(zen)样?——未来,唯一有(you)价值的(de)是你(ni)有(you)多大见解。

人(ren)(ren)(ren)类社会是(shi)技(ji)术驱动(dong)。从农业(ye)时代(dai),人(ren)(ren)(ren)用工具做简单劳(lao)(lao)动(dong),最(zui)大问题是(shi)人(ren)(ren)(ren)和(he)土地(di)绑定,人(ren)(ren)(ren)缺少流通性,没(mei)有自由(you)。工业(ye)发展(zhan)对人(ren)(ren)(ren)最(zui)大变化是(shi)人(ren)(ren)(ren)可(ke)以(yi)动(dong)了(le),可(ke)以(yi)到城(cheng)市和(he)工厂(chang)。早期(qi)工业(ye)体(ti)系以(yi)体(ti)力劳(lao)(lao)动(dong)为(wei)(wei)主、脑力劳(lao)(lao)动(dong)为(wei)(wei)辅(fu),但随着(zhe)机械化、电(dian)气化、电(dian)子化,人(ren)(ren)(ren)的体(ti)力劳(lao)(lao)动(dong)下降(jiang)。信息化时代(dai)以(yi)后(hou),人(ren)(ren)(ren)以(yi)脑力劳(lao)(lao)动(dong)为(wei)(wei)主,经济(ji)从商(shang)品(pin)经济(ji)转向(xiang)服务(wu)经济(ji)——码农、设计师、分析师成(cheng)为(wei)(wei)我(wo)们时代(dai)的典型职(zhi)业(ye)。

这一次大模(mo)(mo)型(xing)拐点(dian)会(hui)让(rang)所有(you)服(fu)务经(jing)济中的人、蓝领基(ji)本都(dou)受影响,因为他们是模(mo)(mo)型(xing),除非(fei)有(you)独到见解,否则你今天所从(cong)事的服(fu)务大模(mo)(mo)型(xing)都(dou)有(you)。下一时代(dai)典型(xing)的职(zhi)业,我们认为是创业者和科学(xue)家。

所以,这次变革影响每个人。它影响整(zheng)个社(she)会(hui)。

我所看到的三个拐点

下个拐点是什么?

下个(ge)拐(guai)点将是组(zu)合:“行动”无处(chu)不在(自动驾驶、机器人、空(kong)间(jian)计算)。也就是人需要在物(wu)理空(kong)间(jian)里行动,它(ta)的(de)代价(jia)也从边际走向固定。20年后,这个(ge)房子里所有一切都(dou)有机械(xie)臂(bei),都(dou)有自动化的(de)东西。我需要的(de)任何(he)东西,按(an)个(ge)按(an)钮(niu),软件可(ke)以(yi)动,今天还(hai)需要找人。

那么,哪些公(gong)司能(neng)走到下(xia)个(ge)拐(guai)点、站住下(xia)个(ge)拐(guai)点?我认为特斯拉(la)有很(hen)高概率,它的(de)自动驾驶、机器人现在很(hen)厉(li)害(hai)。微软今天跟着(zhe)OpenAI爬坡,但怎么站住下(xia)个(ge)拐(guai)点?

接下来(lai)讲(jiang)一(yi)下我们看到的三个拐点(dian):

① 今(jin)天信息已经(jing)无处不在(zai)(zai)了,接(jie)下来(lai)15-20年,模型(xing)就是(shi)知(zhi)识,将无处不在(zai)(zai)。以后手(shou)机上打开,任何联网,模型(xing)就过来(lai)了。它教你怎么去解答法律问题(ti),怎么去做医学检验。不管什(shen)么样的(de)模型(xing)都可(ke)以无处不在(zai)(zai)。

② 在(zai)未来,自动(dong)化(hua)、自主(zhu)化(hua)的动(dong)作可以(yi)无处不在(zai)。

③ 人和(he)数字化(hua)的(de)技术共同进(jin)化(hua)。Sam最近经(jing)常讲,它必须要共同进(jin)化(hua),才能(neng)(neng)达到通(tong)用智能(neng)(neng)(AGI)。通(tong)用智能(neng)(neng)四大要素是:涌现(emergence)+代理(agency)+功能(neng)(neng)可(ke)见性(affordence)+具象(embodiment)。

总结(jie)来说,我们从(cong)根本性的(de)三(san)位一体结(jie)构分(fen)析未来,从(cong)过去的(de)历史拐点(dian)(dian)能(neng)清晰(xi)看(kan)到今天所面临的(de)拐点(dian)(dian),本质是模型(xing)成本从(cong)边(bian)际走向固定,将有一家甚至多(duo)家伟大公司诞生。毫无疑问,OpenAI处于领先。

虽然讲得有点(dian)早,但我个人认为,OpenAI未来肯定比Google大。只不过是大1倍(bei)、5倍(bei)还(hai)是10倍(bei)。

OpenAI核(he)心就坚信两件(jian)事

发(fa)展(zhan)速度连(lian)Sam本人(ren)都惊(jing)讶

下面我从技术角度讲(jiang)OpenAI大事迹,它怎么把大模型时代带(dai)来的(de)?

为什么讲(jiang)OpenAI,不(bu)讲(jiang)Google、微软。讲(jiang)真心话,因为我知道,微软好(hao)几千(qian)人也做这(zhei)个,但不(bu)如OpenAI。一开始比尔(er)·盖(gai)茨根本不(bu)相信OpenAI,大概6个月前他还不(bu)相信。4个月前看到(dao)GPT-4的demo(产品原型),目瞪(deng)口呆。他写(xie)了(le)文章说:It’s a shock,this thing is amazing(这(zhei)太令人震惊了(le),这(zhei)东西太神(shen)奇了(le))。谷(gu)歌内部也目瞪(deng)口呆。

OpenAI一路(lu)走下来(lai)的关键技(ji)术(shu):

1.GPT-1是(shi)第一次(ci)使用(yong)预训练方法(fa)来实现(xian)高效语言理解(jie)的训练;

2.GPT-2主要采用了迁移(yi)学习技(ji)术,能在多种任(ren)务中高效应用预训练信息,并(bing)进一步提高语(yu)言理(li)解能力;

3.DALL·E是走到(dao)另外一个模态;

4.GPT-3主(zhu)要注重泛化能力,few-shot(小样本(ben))的泛化;

5.GPT-3.5 instruction following(指令遵循(xun))和tuning(微调)是最(zui)大突破;

6.GPT-4 已经开(kai)始实现(xian)工程化。

7.2023年3月的(de)Plugin是生态化。

OpenAI的(de)(de)(de)(de)融资(zi)(zi)结构(gou)(gou)(gou)为什么这(zhei)么设(she)计(ji)?和Sam早(zao)期目标(biao)和对未来(lai)的(de)(de)(de)(de)判(pan)断分(fen)不开。他知(zhi)道要融很(hen)多钱,但股权设(she)计(ji)有一(yi)(yi)个很(hen)大挑战——容易(yi)把回报(bao)和控制(zhi)混在一(yi)(yi)起——所以(yi)他要设(she)计(ji)一(yi)(yi)个结构(gou)(gou)(gou),让它(ta)不受(shou)任何股东的(de)(de)(de)(de)制(zhi)约。于是,OpenAI的(de)(de)(de)(de)投资(zi)(zi)者没有控制(zhi)权,他们的(de)(de)(de)(de)协(xie)议是一(yi)(yi)种债的(de)(de)(de)(de)结构(gou)(gou)(gou)。如果(guo)赚(zhuan)完2万亿,接下来(lai)是non-profit(不再盈利了),一(yi)(yi)切回归(gui)社会(hui)。这(zhei)个时代需(xu)要新(xin)的(de)(de)(de)(de)结构(gou)(gou)(gou)。

它(ta)势不可挡(dang)。Sam Altman自己(ji)都(dou)surprise,连他都(dou)没想(xiang)到会那么快(kuai)。

如(ru)果大家对技(ji)术(shu)感兴趣,Ilya Sutskever(OpenAI联合创始人兼首(shou)席科学家)很重要,他坚(jian)信两(liang)件(jian)事。

第一(yi)是模型架构(gou)。它要(yao)足够深(shen),只(zhi)要(yao)到了一(yi)定(ding)深(shen)度,bigness is betterness(大就是好(hao))。只(zhi)要(yao)有(you)算力,只(zhi)要(yao)有(you)数(shu)据,越大越好(hao)。他们一(yi)开始是LSTM(long short term memory),后来看到Transformer就用(yong)Transformer。



image.png

第二个(ge)OpenAI相(xiang)信的是,任何范(fan)式、改(gai)变一切的范(fan)式永远(yuan)有个(ge)引(yin)擎,这个(ge)引(yin)擎能(neng)不断(duan)前(qian)进、不断(duan)产生(sheng)价值。

这个(ge)引擎基本是(shi)(shi)一(yi)个(ge)模(mo)(mo)型体系(model system),它的(de)(de)核心是(shi)(shi)模(mo)(mo)型架构Transformer,就是(shi)(shi)sequence model(序列模(mo)(mo)型):sequence in、sequence out、encode、decode后(hou)者decode only。但最终的(de)(de)核心是(shi)(shi)GPT,也就是(shi)(shi)预训练之后(hou)的(de)(de)Transformer,它可(ke)以把信(xin)(xin)息高(gao)(gao)度压(ya)缩。Ilya有个(ge)信(xin)(xin)念:如果你能高(gao)(gao)效压(ya)缩信(xin)(xin)息,你一(yi)定(ding)已经(jing)得到知识,不然你没(mei)法压(ya)缩信(xin)(xin)息。所以,你把信(xin)(xin)息高(gao)(gao)效压(ya)缩的(de)(de)话(hua),you got to have some knowledge(你得有一(yi)些(xie)知识)。

Ilya坚信(xin)GPT3、3. 5,当然GPT-4更是(shi)(shi),它已(yi)经(jing)(jing)有一(yi)(yi)个(ge)(ge)世(shi)界模(mo)(mo)型在(zai)里面(mian)。虽然你(ni)(ni)做(zuo)的(de)(de)(de)事是(shi)(shi)predict next word(预(yu)测下一(yi)(yi)个(ge)(ge)关键词),这只不过(guo)是(shi)(shi)优化(hua)手(shou)段,它已(yi)经(jing)(jing)表达(da)了世(shi)界的(de)(de)(de)信(xin)息,而且它能持续地提高(gao)模(mo)(mo)型能力,尤其(qi)是(shi)(shi)目前(qian)研(yan)究(jiu)比较多(duo)(duo)的(de)(de)(de)在(zai)子概念(nian)空间当中做(zuo)泛化(hua)。知(zhi)识(shi)图谱(pu)(pu)真(zhen)的(de)(de)(de)不行。如果(guo)哪个(ge)(ge)同学(xue)做(zuo)知(zhi)识(shi)图谱(pu)(pu),我认真(zhen)跟你(ni)(ni)讲(jiang),你(ni)(ni)不要用(yong)(yong)知(zhi)识(shi)图谱(pu)(pu)。我自己也做(zuo)知(zhi)识(shi)图谱(pu)(pu)20多(duo)(duo)年,just don’t do that。Just pretty bad。It does not work at all。You should use Transformer。(不要那(nei)样做(zuo)。很(hen)糟糕(gao)。它根本不起作用(yong)(yong)。你(ni)(ni)应该使用(yong)(yong)Transformer。)

更重(zhong)要的(de)是(shi)用增(zeng)强学(xue)习,加上人(ren)的(de)反馈,与人(ren)的(de)价值对齐。因为GPT已经做(zuo)了4年多(duo),知识已经封装在里面了,过去真的(de)是(shi)用不起(qi)来,也很难用。

最大的是(shi)对(dui)齐(alignment engineering),尤其是(shi)instruction following和自(zi)然语言对(dui)齐。当(dang)然也可以跟代码、表格(ge)、图表对(dui)齐。

做大(da)模型是(shi)(shi)(shi)(shi)很难(nan)的,很大(da)难(nan)度(du)是(shi)(shi)(shi)(shi)infra(基础设施)。我(wo)在(zai)微软的时候,我(wo)们每(mei)个服务(wu)(wu)器(qi)都(dou)不(bu)(bu)(bu)用网卡(ka),都(dou)放了FPGA。网络的IO的带(dai)宽速(su)度(du)都(dou)是(shi)(shi)(shi)(shi)无限带(dai)宽技术(Infiniband),服务(wu)(wu)器(qi)和服务(wu)(wu)器(qi)之间是(shi)(shi)(shi)(shi)直接访(fang)问内存。为(wei)什么?因为(wei)Transformer是(shi)(shi)(shi)(shi)密度(du)模型,它不(bu)(bu)(bu)光是(shi)(shi)(shi)(shi)算力问题(ti),对带(dai)宽要(yao)求(qiu)极高,你就想GPT-4需要(yao)24000张到25000张卡(ka)训练,试想世界上(shang)多少人(ren)能(neng)做这种(zhong)系统。所有(you)数(shu)据、data center网络架(jia)构都(dou)不(bu)(bu)(bu)一样。它不(bu)(bu)(bu)是(shi)(shi)(shi)(shi)一个三层的架(jia)构,必(bi)须是(shi)(shi)(shi)(shi)东西向的网络架(jia)构。所以这里要(yao)做大(da)量的工作。

Token很重(zhong)要(yao)。全世界可(ke)能有(you)40-50个(ge)确定的(de)token,就是语言的(de)token和模(mo)态,现在(zai)有(you)更多的(de)token化。当然(ran)现在(zai)更多的(de)模(mo)型的(de)参(can)数小型化、本地化,任务领域的(de)专业知识可(ke)以融入这些大模(mo)型当中。它的(de)可(ke)操(cao)(cao)纵(zong)性主(zhu)要(yao)是靠(kao)提示(shi)和调(diao)试(shi),尤其是根据(ju)指(zhi)令来调(diao),或者(zhe)对齐来调(diao)试(shi),或者(zhe)in-context learning(上下(xia)文学习),这个(ge)已(yi)经贯(guan)彻比较(jiao)清晰(xi)了。它的(de)可(ke)操(cao)(cao)作性是越(yue)来越(yue)强。可(ke)拓展(zhan)性基本上也足够。

加在(zai)一起(qi),这(zhei)个引擎并不(bu)完美。足够(gou)好(hao)、足够(gou)强(qiang)的引擎,我没从没有过(guo)。

以上(shang)是(shi)引(yin)擎,拐(guai)点是(shi)怎(zen)么(me)到的?ChatGPT能在历(li)史(shi)上(shang)第(di)一次两个月(yue)1亿活跃用户,挡都挡不住(zhu),为什么(me)?

① 它封装了世界上所(suo)有(you)知识。

② 它有足够强的学习和推理能(neng)力(li),GPT-3能(neng)力(li)在(zai)高中生和大学生之间,GPT-4不(bu)光是(shi)进斯坦福(fu),而(er)且是(shi)斯坦福(fu)排名(ming)很靠前的人。

③ 它(ta)的领域(yu)足(zu)够宽,知识足(zu)够深,又(you)足(zu)够好(hao)用。自然(ran)语言(yan)最大的突破是好(hao)用。扩展性也(ye)足(zu)够好(hao)。当然(ran)还是很贵(gui),像2万多张卡,训练几(ji)个月这么大的工程(cheng)。不过也(ye)没贵(gui)到那么离(li)谱——Google可以做(zuo),微(wei)软可以做(zuo),中(zhong)国几(ji)个大公司能做(zuo),创业公司融(rong)钱也(ye)能做(zuo)。

加在一起,范式的临(lin)界点(dian)到(dao)了。拐点(dian)已经到(dao)来。

稍微啰嗦(suo)几句(ju)。我做自(zi)然语言(yan)20多年,原来的(de)(de)自(zi)然语言(yan)处理有(you)14种任(ren)务(wu),我能(neng)够把动(dong)词(ci)找(zhao)出来、名词(ci)找(zhao)出来、句(ju)子分(fen)析清楚。即使(shi)分(fen)析清楚,你知(zhi)道(dao)这是(shi)(shi)(shi)(shi)形(xing)容(rong)词(ci),这是(shi)(shi)(shi)(shi)动(dong)词(ci),这是(shi)(shi)(shi)(shi)名词(ci)——那这个名词(ci)是(shi)(shi)(shi)(shi)包香烟?还(hai)是(shi)(shi)(shi)(shi)你的(de)(de)舅舅?还(hai)是(shi)(shi)(shi)(shi)一个坟墓(mu)?还(hai)是(shi)(shi)(shi)(shi)个电影?No idea(不知(zhi)道(dao))。你需(xu)要(yao)的(de)(de)是(shi)(shi)(shi)(shi)知(zhi)识(shi)。自(zi)然语言(yan)处理没(mei)有(you)知(zhi)识(shi)永远没(mei)用。

The only way to make natural language work is you have knowledge(让自然语(yu)言(yan)处理(li)有(you)效的唯(wei)一路径是你有(you)知识(shi))。正好(hao)Transformer把(ba)这(zhei)么多知识(shi)压缩在(zai)一起了,这(zhei)是它的最大突破。

未(wei)来是一个模(mo)型无处不在(zai)的时(shi)代(dai)

OpenAI未(wei)来2-3年(nian)要(yao)做的(de)——模型更(geng)稀疏一(yi)点,现在(zai)它对带宽要(yao)求实(shi)在(zai)太高,要(yao)把attention window拉长一(yi)点,或者(zhe)是recursion causality推理的(de)功能(neng),包括brainstorming等一(yi)些(xie)工(gong)作要(yao)做。当然有一(yi)些(xie)grounding的(de)东西,包括亚(ya)符(fu)号、子概念的(de)都可以做。更(geng)多(duo)的(de)模态(tai),更(geng)多(duo)的(de)token空(kong)间(jian)(jian),更(geng)多(duo)的(de)模型稳定性,更(geng)多(duo)的(de)潜(qian)在(zai)空(kong)间(jian)(jian)(例如Latent Space对齐),更(geng)多(duo)的(de)计算,更(geng)多(duo)的(de)基础架构工(gong)具(ju)。2-3年(nian)基本排满。也就是说,我们大(da)概知道需要(yao)什么去(qu)把这个引擎继(ji)续做大(da)。

不过这个(ge)飞轮启动(dong),主要是(shi)资本大量进(jin)(jin)来(lai)。美国2023年1月(yue)到(dao)3月(yue),挡也挡不住,钱(qian)全进(jin)(jin)去(qu)了,每个(ge)月(yue)都在比上个(ge)月(yue)增(zeng)长。中国基(ji)本也一样(yang),商业模(mo)式、盈利模(mo)式有初步规模(mo),基(ji)础设施、平台应(ying)用(yong)、生态在加(jia)速开(kai)发(fa),初创公(gong)司、大型企业都在进(jin)(jin)入(ru)。

当然社(she)会的安全、监管,一大堆(dui)问题——现在(zai)这些是(shi)OpenAI最头痛的——Sam在(zai)美国花(hua)大量(liang)精力让社(she)会认可这个技术。现在(zai)OpenAI核心做的是(shi),把推进速度变慢,每推进新版本,都有(you)足够(gou)时间让用(yong)户给他(ta)们(men)足够(gou)反(fan)馈,找到潜在(zai)风(feng)险点,有(you)足够(gou)时间弥补。但加在(zai)一起,增长飞轮的雏形基本上起来了(le)。

有了飞轮,我(wo)认为(wei)发展路径核心是模(mo)型的可延伸性和未(wei)来模(mo)型的生(sheng)态。是一个模(mo)型无处不在的时代。

未来(lai)的(de)模型(xing)世(shi)界会(hui)怎(zen)么发展?首先是将有更(geng)多(duo)大模型(xing)会(hui)出来(lai)。更(geng)多(duo)更(geng)完整的(de)模态和更(geng)完整的(de)世(shi)界知识在(zai)这里(li)。你有大量的(de)知识、更(geng)多(duo)的(de)模态,学习能(neng)力(li)、泛化能(neng)力(li)和泛化机制一定会(hui)加强。

此外,会有(you)(you)更多(duo)(duo)的对(dui)(dui)齐(qi)(qi)工(gong)作要(yao)做(zuo)(zuo)。OpenAI目前会关注什么呢(ni)?今天对(dui)(dui)齐(qi)(qi)基本上是做(zuo)(zuo)到,有(you)(you)一(yi)部(bu)分(fen)人(ren)能接受但(dan)你(ni)也(ye)得罪(zui)很多(duo)(duo)人(ren),很多(duo)(duo)人(ren)每天骂GPT。他们想要(yao)做(zuo)(zuo)到是足够(gou)(gou)宽的一(yi)个对(dui)(dui)齐(qi)(qi),希望有(you)(you)个像美国(guo)宪章这样一(yi)个结(jie)果,虽然(ran)ChatGPT不是大(da)家都能够(gou)(gou)认可,但(dan)它足够(gou)(gou)平稳、综合,大(da)部(bu)分(fen)人(ren)能接受,这是对(dui)(dui)齐(qi)(qi)工(gong)程。自然(ran)语言也(ye)好(hao),代码(ma)也(ye)好(hao),数学公式也(ye)好(hao),表单也(ye)好(hao),有(you)(you)大(da)量对(dui)(dui)齐(qi)(qi)工(gong)作要(yao)做(zuo)(zuo)。

还(hai)有更(geng)(geng)多的(de)模(mo)(mo)(mo)态(tai)对齐(qi)。这里先(xian)讲human scale的(de)模(mo)(mo)(mo)态(tai),它(ta)主(zhu)要是(shi)对人(ren)的(de)描述,以人(ren)的(de)语言为主(zhu),它(ta)的(de)模(mo)(mo)(mo)态(tai)目前是(shi)语言和图形(xing),以后有更(geng)(geng)多的(de)模(mo)(mo)(mo)态(tai)会接入。这是(shi)大模(mo)(mo)(mo)型层面。

在(zai)大模(mo)型(xing)(xing)(xing)之上建(jian)立的(de)模(mo)型(xing)(xing)(xing)更多了。我判断(duan)主要是(shi)有(you)(you)两类模(mo)型(xing)(xing)(xing)和他们的(de)组合。第一是(shi)事情的(de)模(mo)型(xing)(xing)(xing),人类每一类需求都有(you)(you)领域/工作(zuo)模(mo)型(xing)(xing)(xing),其(qi)中有(you)(you)结构模(mo)型(xing)(xing)(xing)、流程模(mo)型(xing)(xing)(xing)、需求模(mo)型(xing)(xing)(xing)和任务模(mo)型(xing)(xing)(xing),尤其(qi)是(shi)记忆和先验。

第二,人的(de)模(mo)(mo)型,包(bao)括认知/任(ren)务模(mo)(mo)型,它是个体的(de),其中有专业模(mo)(mo)型,有认知模(mo)(mo)型、运动模(mo)(mo)型和人的(de)记忆先验。人基(ji)本是这几类模(mo)(mo)型的(de)组合(he),律师也好,医生也好,大量领域会有大量模(mo)(mo)型往前走。

人(ren)的模型(xing)和学的模型(xing)有本质区别,这是我过去1-2个(ge)月个(ge)人(ren)收获较多(duo)的。

首(shou)先(xian),人(ren)(ren)(ren)一(yi)(yi)直在建(jian)立模(mo)(mo)(mo)(mo)(mo)型。人(ren)(ren)(ren)的(de)(de)模(mo)(mo)(mo)(mo)(mo)型好(hao)处是(shi)泛化的(de)(de)时(shi)候更(geng)深、更(geng)专业(ye),基本是(shi)用(yong)符号(hao)(例如(ru)数学公(gong)式)或结(jie)构(例如(ru)画(hua)流程图(tu))。它(ta)具体用(yong),说(shuo)实话(hua)都(dou)不(bu)好(hao)用(yong)。人(ren)(ren)(ren)的(de)(de)模(mo)(mo)(mo)(mo)(mo)型要(yao)么像物(wu)理(li)公(gong)式解(jie)决(jue)很宏观的(de)(de)问题(ti),要(yao)么解(jie)决(jue)很微观的(de)(de)问题(ti)。我们日常生(sheng)活的(de)(de)问题(ti),物(wu)理(li)一(yi)(yi)点用(yong)都(dou)没有(you)——没法告(gao)诉我这(zhei)(zhei)个树的(de)(de)叶子的(de)(de)形状,狗的(de)(de)猫的(de)(de)颜色为什么是(shi)这(zhei)(zhei)样子?没有(you)任何模(mo)(mo)(mo)(mo)(mo)型可(ke)以解(jie)这(zhei)(zhei)个。很大问题(ti)是(shi)它(ta)的(de)(de)模(mo)(mo)(mo)(mo)(mo)型是(shi)静态的(de)(de),不(bu)会场景变化。

今天(tian)有很多模(mo)(mo)型,比方(fang)说数(shu)字孪生(sheng),很难(nan)用(yong)。因为物理(li)世界一直在变(bian),这个模(mo)(mo)型僵硬、不变(bian),就用(yong)不起来。尤其是(shi)用(yong)知识(shi)图谱建的模(mo)(mo)型,我(wo)做了(le)几十年,超级难(nan)算,函数(shu)结构差得一塌糊涂。所(suo)以人的模(mo)(mo)型有好处,专业性强,但有很大缺点。

学出来(lai)(lai)的(de)模型(xing),首先,它(ta)本质是(shi)场景化的(de),因为(wei)它(ta)的(de)token是(shi)场景化的(de)。其次,它(ta)适应性(xing)(xing)(xing)很强,环境变(bian)(bian)了(le),token也变(bian)(bian)了(le),模型(xing)自(zi)然会随着环境变(bian)(bian);第三,它(ta)的(de)泛化拓展性(xing)(xing)(xing)有大(da)量理论工作要(yao)做,但(dan)(dan)是(shi)目前子概念空间的(de)泛化,看(kan)来(lai)(lai)是(shi)很有潜在发展空间的(de)这(zhei)样一(yi)种模型(xing)的(de)特性(xing)(xing)(xing)。它(ta)好用,因为(wei)它(ta)可以对齐(qi)人(ren)的(de)使用倾向(xiang)或人(ren)的(de)自(zi)然语(yu)言(yan)、表(biao)格(ge)等等。它(ta)的(de)计算性(xing)(xing)(xing)内在是(shi)过(guo)程(cheng)性(xing)(xing)(xing)的(de)。这(zhei)里(li)有大(da)的(de)问题,就是(shi)人(ren)表(biao)达(da)知识倾向(xiang)运(yun)用结构(gou),但(dan)(dan)真正能(neng)解(jie)决问题的(de)是(shi)过(guo)程(cheng),人(ren)不适合用过(guo)程(cheng)来(lai)(lai)表(biao)达(da)。

ChatGPT代(dai)表的(de)(de)(de)模型(xing)跟人的(de)(de)(de)模型(xing)相(xiang)辅相(xiang)成(cheng),长期(qi)可以(yi)融在一起(qi)。我们看到的(de)(de)(de)未来(lai)是更多模型(xing)的(de)(de)(de)生态,新(xin)(xin)的(de)(de)(de)领域、新(xin)(xin)的(de)(de)(de)专业、新(xin)(xin)的(de)(de)(de)结(jie)构、新(xin)(xin)的(de)(de)(de)场景、新(xin)(xin)的(de)(de)(de)适应(ying)能(neng)力,形成(cheng)闭环,不断加强认(ren)知(zhi)和推理能(neng)力。当然,最(zui)终还是要(yao)所(suo)谓叫(jiao)grounding,跟感知(zhi)要(yao)ground,和接入行动的(de)(de)(de)能(neng)力,形成(cheng)真正的(de)(de)(de)智(zhi)能(neng)。

某种意义上20-30年后,这个模(mo)(mo)型世界跟生物世界有很多(duo)类似的地方(fang)。大模(mo)(mo)型我觉得像基因,有不同的种类,然(ran)后进化。我们目前(qian)能看(kan)到(dao)未来核心技(ji)术(shu)模(mo)(mo)型世界,它是用这个方(fang)法来向前(qian)驱动。

我们(men)基本(ben)对这(zhei)个(ge)时(shi)代的(de)范(fan)式有了结构性(xing)的(de)理解。那么接下来,我们(men)如何拥抱(bao)这(zhei)个(ge)时(shi)代?

对每(mei)个(ge)人(ren)、每(mei)个(ge)行业(ye)都有结构性(xing)影(ying)响

我个(ge)人(ren)过(guo)去10个(ge)月,每天看东西(xi)是(shi)挺多的,但最近(jin)实(shi)在(zai)受不(bu)了(le)。就真的是(shi)跟(gen)不(bu)上(shang)。发展速度非常非常快。最近(jin)我们开始(shi)发行“大(da)模型日报(bao)”,是(shi)我实(shi)在(zai)不(bu)行了(le),论文(wen)实(shi)在(zai)是(shi)跟(gen)不(bu)上(shang),代码(ma)实(shi)在(zai)是(shi)跟(gen)不(bu)上(shang)——just too much(太多了(le))

世界在哗(hua)(hua)哗(hua)(hua)哗(hua)(hua)地(di)变。我曾经说1995-1996年有这种感觉,但这个比(bi)1995-1996年还要强。为什么(me)?模(mo)型(xing)的成本从边际转向固定,知识创造就是模(mo)型(xing)和知识的获取,它(ta)结构性做演变了(le)。

生(sheng)产资本(ben)从两个层次全面提高(gao)。第(di)一(yi),所有(you)动脑筋(jin)的(de)工作,可(ke)以(yi)降低(di)成本(ben)、提升产能。我(wo)们目(mu)前有(you)一(yi)个基本(ben)假设,码农成本(ben)会(hui)降低(di),但(dan)对码农的(de)需求(qiu)会(hui)大(da)量增加,码农不用担(dan)心。因为对软(ruan)件(jian)的(de)需求(qiu)会(hui)大(da)量增加,就是这个东西(xi)便宜了,都(dou)买(mai)嘛。软(ruan)件(jian)永(yong)远可(ke)以(yi)解决更多问题(ti),但(dan)有(you)些行(xing)业未必(bi)。这是生(sheng)产资本(ben)的(de)广泛(fan)提高(gao)。

第二,生(sheng)(sheng)产(chan)(chan)资本(ben)深层(ceng)提升。有一(yi)(yi)些行(xing)(xing)业(ye)的生(sheng)(sheng)产(chan)(chan)资本(ben)本(ben)质是(shi)模(mo)(mo)(mo)型(xing)(xing)(xing)驱(qu)动(dong)(dong)(dong),比如医(yi)疗就是(shi)一(yi)(yi)个(ge)(ge)模(mo)(mo)(mo)型(xing)(xing)(xing)行(xing)(xing)业(ye),一(yi)(yi)个(ge)(ge)好(hao)医(yi)生(sheng)(sheng)是(shi)一(yi)(yi)个(ge)(ge)好(hao)模(mo)(mo)(mo)型(xing)(xing)(xing),一(yi)(yi)个(ge)(ge)好(hao)护士是(shi)一(yi)(yi)种(zhong)好(hao)模(mo)(mo)(mo)型(xing)(xing)(xing)。医(yi)疗这种(zhong)产(chan)(chan)业(ye),本(ben)质是(shi)强模(mo)(mo)(mo)型(xing)(xing)(xing)驱(qu)动(dong)(dong)(dong)。现在模(mo)(mo)(mo)型(xing)(xing)(xing)提高了,科学(xue)(xue)也(ye)随之提高。在游戏核心产(chan)(chan)业(ye),我们的产(chan)(chan)能(neng)将本(ben)质性、深度提高。产(chan)(chan)业(ye)的发(fa)展速(su)(su)(su)度会加(jia)快,因为科学(xue)(xue)的发(fa)展速(su)(su)(su)度加(jia)快了,开发(fa)的速(su)(su)(su)度加(jia)快了,每个(ge)(ge)行(xing)(xing)业(ye)的心跳(tiao)都会加(jia)快。因此,我们认为下个(ge)(ge)拐点会加(jia)速(su)(su)(su)。用大模(mo)(mo)(mo)型(xing)(xing)(xing)做机器人、自(zi)动(dong)(dong)(dong)化(hua)、自(zi)动(dong)(dong)(dong)驾(jia)驶,挡也(ye)挡不住。

它对每个人都(dou)将产生深远和系统性影响。我(wo)们的假设(she)是每个人很快(kuai)将有(you)副(fu)驾驶(shi)员(yuan),不光(guang)是1个,可(ke)能(neng)5个、6个。有(you)些(xie)副(fu)驾驶(shi)员(yuan)足够强,变成正驾驶(shi)员(yuan),他自(zi)动可(ke)以去帮你做事。更长期,我(wo)们每个人都(dou)有(you)一(yi)个驾驶(shi)员(yuan)团队服务。未(wei)来的人类组织是真人,加上他的副(fu)驾驶(shi)员(yuan)和真驾驶(shi)员(yuan)一(yi)起协(xie)同。

毫无疑问(wen),每个(ge)(ge)行业(ye)也会(hui)有结构性影(ying)响,会(hui)系统性重组。这里有一个(ge)(ge)简单公式。今天动脑筋的(de)人一天平均(jun)工资(zi)多少小时?减(jian)掉ChatGPT现(xian)在大概平均(jun)是15美元/小时,再(zai)过(guo)3年(nian)可(ke)能(neng)不(bu)到1美元,再(zai)过(guo)5年(nian)可(ke)能(neng)几十美分。然(ran)后就乘一下有多少数量。降本或者增效,让码农能(neng)变成super码农,医生(sheng)变成super医生(sheng)。

大(da)家(jia)可以(yi)按这个公式算一算。如果你是(shi)华尔街的(de)对(dui)冲基金(jin),你可以(yi)做空一大(da)堆(dui)行业。

举个简单例(li)子,律(lv)师(shi)在(zai)美国平均1500美元/小(xiao)时(shi),我在(zai)网上已(yi)经看(kan)到每天有(you)这种(zhong)信息——如果你想(xiang)离婚,不要找离婚律(lv)师(shi),ChatGPT离婚很便宜啊!(全场(chang)笑)

开发(fa)人员、设计师、码农、研究人员都(dou)一(yi)样,有(you)些是(shi)更(geng)多(duo)需求(qiu),有(you)些是(shi)成本下降(jiang)。尤(you)其是(shi)核心产(chan)业,科学、教育(yu)、医疗(liao),这是(shi)OpenAI长(zhang)期(qi)最(zui)(zui)关注(zhu)的3个(ge)行业,也是(shi)整个(ge)社会最(zui)(zui)根本的。

尤其是医疗。在(zai)中(zhong)国,需求(qiu)远(yuan)(yuan)远(yuan)(yuan)大(da)于供(gong)给。而且,中(zhong)国是大(da)政府(fu)(fu)驱动的市场经济,政府(fu)(fu)可以(yi)扮演更大(da)角色(se),因(yin)为固定成本政府(fu)(fu)可以(yi)承担。

最(zui)为重(zhong)要的(de)是教育。如(ru)果你是大(da)学,你第一(yi)担(dan)心的(de)是,考试怎么(me)考?没法考了。他(ta)一(yi)问ChatGPT,什么(me)都知(zhi)道(dao)。更重(zhong)要的(de)是,以后怎么(me)定(ding)义是好的(de)大(da)学生呢(ni)?假定(ding)说有个(ge)大(da)学生什么(me)都不懂,物理也不懂、化(hua)学也不懂,但他(ta)懂怎么(me)问ChatGPT,他(ta)算不算一(yi)个(ge)好的(de)大(da)学生?机(ji)会与挑战(zhan)并存(cun)。

总结一下(xia),整(zheng)个这个时代在(zai)高(gao)速(su)地进行,速(su)度越(yue)来越(yue)快(kuai)。它是(shi)结构上(shang)决定的。势不(bu)可挡。

大模型的淘金时代

对机会点进行结构性拆(chai)解

现(xian)在,我(wo)给大家一个结构(gou)化思(si)维框架。某种意义上你可以对号入座(zuo),知道我(wo)在这里,我(wo)怎么思(si)考今天的机会点。

image.png

这张图是整个(ge)人类技术(shu)驱动的(de)创业创新(xin),所有(you)事情的(de)机(ji)会都(dou)在这张图上。

首先,底层(ceng)是(shi)数(shu)(shu)字(zi)化的(de)技术,因(yin)为数(shu)(shu)字(zi)化是(shi)人的(de)延(yan)伸(shen)。数(shu)(shu)字(zi)化的(de)基础里有(you)平(ping)台,有(you)发展基础,包括开(kai)源(yuan)的(de)代码(ma)、开(kai)源(yuan)的(de)设计(ji)、开(kai)源(yuan)的(de)数(shu)(shu)据(ju);平(ping)台有(you)前(qian)端、后端等(deng)。这里有(you)大量机会。

第二,波(bo)是用数(shu)字化的(de)能(neng)力(li)去解决人(ren)的(de)需求。我(wo)们把数(shu)字化应(ying)用完整放(fang)在(zai)这张表上。

1)C端(duan),是把所(suo)有的(de)人分(fen)成(cheng)人群,每种人群24小时,他花时间干什么(me)?有通讯(xun)、社交(jiao)、内容、游(you)(you)戏消费、旅游(you)(you)、健身……C端(duan)有一类(lei)(lei)特殊(shu)的(de)人,这类(lei)(lei)人是改变(bian)世界的(de),是码农、设(she)计师、研究员(yuan)。他们(men)创造未来(lai)。微软这么(me)大的(de)公司,是基(ji)于一个简单理念(nian):微软我们(men)就是要写(xie)(xie)更(geng)多软件、帮别(bie)人写(xie)(xie)更(geng)多软件,因为写(xie)(xie)软件是未来(lai)。

2)B端,企业需(xu)求(qiu)也一样,降本增效。它要(yao)生产(chan),有供应(ying)链、销售、客服……有了这些需(xu)求(qiu)之后,数字化看(kan)得见的体验结(jie)构有6种:给(ji)你(ni)(ni)(ni)信(xin)息(xi)的,二维(wei)就够;给(ji)你(ni)(ni)(ni)三维(wei)交(jiao)互体验,在游(you)戏、元宇(yu)宙;人(ren)(ren)和(he)人(ren)(ren)之间抽象的关(guan)系,包括信(xin)任关(guan)系、Web 3;人(ren)(ren)在物理世界环中(zhong)自动驾驶、机器人(ren)(ren)等;人(ren)(ren)的内在的用(yong)碳机植入(ru)到里(li)面,今天(tian)是(shi)(shi)脑(nao)机接口,以后有更多,以后是(shi)(shi)可以用(yong)硅基;最后是(shi)(shi)给(ji)你(ni)(ni)(ni)模(mo)型。

最后,人类是挺奇怪(guai)的物种(zhong),不光(guang)要(yao)满(man)足这些需求,还要(yao)改(gai)变世界(jie),我们在满(man)足世界(jie)时,也要(yao)获(huo)得更多能源(yuan),所(suo)以需要(yao)有能源(yuan)pg电子;需要(yao)转化能源(yuan),用(yong)生命科(ke)学的形式,biological process转化能源(yuan)或者使用(yong)mechanical process,材(cai)料结构来转化能源(yuan),或者是新(xin)的空(kong)间。这是第三波。

所以创业公(gong)司基(ji)本上有三类:数字化基(ji)础(chu),用数字化去解决人的(de)需(xu)求,去改变(bian)物理世界。有了这个大(da)的(de)框架(jia),我们可以系统(tong)性地来看(kan)对号(hao)入座:我在(zai)哪(na)个位置(zhi)?如(ru)果(guo)我在(zai)这个位置(zhi),需(xu)要关(guan)注(zhu)哪(na)些点(dian)?

image.png


首先讲数(shu)字化基础,它(ta)有一个(ge)稳定结(jie)(jie)构,不管再怎么(me)发展,结(jie)(jie)构永(yong)远是(shi)这样。过去30多年,大部分系统或多或少(shao)我都(dou)碰过,这个(ge)结(jie)(jie)构确实相当(dang)稳定。

核心是(shi)前端(duan)和后端(duan)——前端(duan)是(shi)完(wan)整可(ke)延伸的体(ti)验,后端(duan)是(shi)完(wan)整可(ke)延伸的能(neng)力(li),有设备(bei)端(duan),比方说电脑、手机、眼(yan)镜(jing)、汽(qi)车(che)等等,设备(bei)端(duan)里面(mian)是(shi)芯片、模(mo)组加上(shang)操作系统(tong)。万(wan)亿(yi)美元的公(gong)司都在这(zhei)一层(ceng)。

其次是体(ti)验的容(rong)器(qi),二维(wei)的容(rong)器(qi),三维(wei)的容(rong)器(qi),内在(zai)嵌入的容(rong)器(qi)。

容器之上(shang),写代码都(dou)知(zhi)道画(hua)布(bu)(bu),画(hua)布(bu)(bu)可(ke)以(yi)(yi)是文(wen)档,可(ke)以(yi)(yi)是聊(liao)天(tian),可(ke)以(yi)(yi)是代码,可(ke)以(yi)(yi)是空间(jian),可(ke)以(yi)(yi)是世(shi)界,可(ke)以(yi)(yi)是数字人,也可(ke)以(yi)(yi)是碳(tan)基里(li)的蛋(dan)白质等等。这是前端。

后端也一样(yang),底层式设备(bei),服务器(qi)、交(jiao)换机、数(shu)据中心(xin)等等,也是芯片、模组、操作系统。

中间这一层非常重要(yao),网络数(shu)据堆栈,分布式系统(tong),区块链等(deng)等(deng)。

最上面是云,是能力(li)(li)(li)的(de)供给(ji)。能力(li)(li)(li)供给(ji)像自(zi)然水源,打(da)开就是算力(li)(li)(li),有(you)存储(chu)和通讯能力(li)(li)(li)。今天的(de)模型(xing)时代,打(da)开就是模型(xing)。

下面是数(shu)字(zi)化基(ji)础。符号计(ji)算,或者所(suo)谓的深(shen)度学习,叠加向量的浮点计(ji)算,硅基(ji)的,碳基(ji)的。

如果你(ni)是这(zhei)里(li)的创业者,机(ji)会点在(zai)哪里(li)?

image.png


① 首先搬运信(xin)息(xi),这个时代(dai)还有很多可以做(zuo)。

② 如果你是做(zuo)模型的(de),我(wo)现在判断(duan)什么都要重(zhong)做(zuo)一遍。大(da)模型为先。很多设备也要重(zhong)做(zuo),你要支持大(da)模型,容器要重(zhong)做(zuo),这些都有机(ji)会(hui)。云、中间的(de)基(ji)(ji)础设施、底层的(de)硬件(jian),包括(kuo)数(shu)字化发展(zhan)核心的(de)基(ji)(ji)础,尤其是开源的(de)体系,这里是真正意义(yi)上(shang)是有大(da)量机(ji)会(hui)。

③ 第(di)三(san)代(dai)系统(tong),即已经开始做机(ji)(ji)器人(ren)、自动化(hua)、自主系统(tong)。孙正义今天(tian)all in。这(zhei)个(ge)也能(neng)用大(da)模型做。马(ma)斯(si)克也看到这(zhei)种机(ji)(ji)会(hui)。都是在第(di)三(san)代(dai)下一个(ge)拐点,创业公司完全可以把握(wo)的机(ji)(ji)会(hui)。

④ 同时(shi)并行的,我把(ba)它称(cheng)作“第(di)三代++系统”,是(shi)碳基(ji)的生(sheng)物(wu)计算,这一(yi)类公司有(you)大量(liang)的量(liang)子计算,有(you)很多机会。元(yuan)宇宙和(he)Web 3今天点冷,但从(cong)历史长(zhang)河角度来(lai)(lai)讲,只是(shi)时(shi)间问题,因为(wei)这些技术都能真正意义上带来(lai)(lai)未来(lai)(lai)的人类价值。

所以如果是(shi)这(zhei)个创业项(xiang)目,基础层机会(hui)就(jiu)在(zai)这(zhei)里。这(zhei)是(shi)最好的(de)生意。为什(shen)么?这(zhei)个时代跟淘(tao)(tao)金时代很像(xiang)。如果你(ni)那个时候去加(jia)州淘(tao)(tao)金,一大(da)堆人(ren)会(hui)死掉,但(dan)是(shi)卖(mai)勺子的(de)人(ren)、卖(mai)铲子的(de)人(ren)永远可以赚钱。所谓(wei)的(de)shove and pick business。

大模(mo)型是平台(tai)型机会。按照我们几(ji)天的(de)判断,以模(mo)型为(wei)先的(de)平台(tai),将(jiang)比以信(xin)息为(wei)先的(de)平台(tai)体量更大。平台(tai)有以下几(ji)个特(te)征(zheng):

① 它是开箱即用;

② 要有(you)一个足够简单和好的商业模式,平台是(shi)开发者可以活在上面,可以赚足够的钱、养活自(zi)己,不(bu)然不(bu)叫(jiao)平台;

③ 他有自己杀(sha)(sha)手(shou)级(ji)应用。ChatGPT本身是(shi)(shi)个(ge)杀(sha)(sha)手(shou)应用,今天平台公司就(jiu)是(shi)(shi)你(ni)在(zai)苹(ping)果生态上,你(ni)做(zuo)得再好(hao),只要做(zuo)大苹(ping)果就(jiu)把(ba)你(ni)没收(shou)了,因为(wei)它要用你(ni)底层(ceng)的(de)(de)东西,所以你(ni)是(shi)(shi)平台。平台一般都有它的(de)(de)锚点,有很强的(de)(de)支撑点,长期(qi)OpenAI设备机会(hui)有很多——有可能这(zhei)是(shi)(shi)历史上第一个(ge)10万亿(yi)美元的(de)(de)公司。

这(zhei)是一场激(ji)烈(lie)(lie)的(de)竞争(zheng)平台之战,未来一个体量(liang)很(hen)大的(de)公司。在这(zhei)个领域竞争(zheng)是无比激(ji)烈(lie)(lie)。The price is too big(代价(jia)实在太大),错过(guo)太可惜。再怎么(me)也得试一试。

今天的模型鲁棒(bang)性、脆弱性,还是(shi)问题。用(yong)这(zhei)(zhei)个模型,你(ni)(ni)一(yi)定(ding)要(yao)一(yi)开(kai)始稍微窄(zhai)一(yi)点,限制(zhi)要(yao)严(yan)一(yi)点,这(zhei)(zhei)样的话体验(yan)是(shi)稳定(ding)的,等到(dao)模型能(neng)力(li)越来越强再把它放宽,找(zhao)到(dao)适当的场景,循序(xu)渐进。质量和宽度之间的平衡很(hen)重(zhong)要(yao)。另外发展路径上(shang),你(ni)(ni)要(yao)考虑(lv)今天产品要(yao)不要(yao)在这(zhei)(zhei)个上(shang)基础(chu)上(shang)改,重(zhong)启炉(lu)灶,还是(shi)齐头并进。把这(zhei)(zhei)个团(tuan)队(dui)给改了、重(zhong)做,还到(dao)外面去买(mai)公(gong)司(si)?

创新(xin),尤其是创业(ye)公司落地,它永远是技术推动和(he)需(xu)(xu)(xu)求拉动的组合。在落地的过(guo)程中,对需(xu)(xu)(xu)求理(li)解的把控,掌握和(he)满(man)足需(xu)(xu)(xu)求的方法是一(yi)切当中最重要(yao)。长期一(yi)定是技术驱动为主(zhu),但(dan)在落地的时(shi)候(hou)对需(xu)(xu)(xu)求的拆(chai)解、分析(xi)、梳理(li),把控好需(xu)(xu)(xu)求,是一(yi)切的一(yi)切。

有(you)(you)一个机(ji)密大家今天(tian)都知道了——OpenAI是(shi)用GPT-4做(zuo)GPT-5,每个码(ma)农都是(shi)放大能(neng)力的码(ma)农。它规模效应不(bu)一样,马太效应不(bu)一样,从此壁垒和竞(jing)争(zheng)格局不(bu)一样,知识产权结果不(bu)一样,国际化的格局也不(bu)一样。中国显然有(you)(you)机(ji)会。

我对创业者有几点建(jian)议(yi)

创(chuang)业(ye)公司的(de)内(nei)在结(jie)构(gou)是(shi)人(ren)和(he)事的(de)组合。人(ren),一(yi)(yi)开始是(shi)创(chuang)始人(ren)/创(chuang)始团队;他有初心,内(nei)在驱动(dong)力、外在驱动(dong)力;他能(neng)独立思考,判断(duan)未来;他能(neng)行动(dong)导向(xiang),解(jie)决问题;他能(neng)需求导向(xiang),找到价(jia)值;最终通过沟通获得资源。接下来是(shi)产(chan)品市(shi)场匹配,这(zhei)(zhei)部分就是(shi)研发技术、研发产(chan)品、交付产(chan)品。商(shang)业(ye)模式是(shi)收到钱、更多(duo)(duo)增长(zhang)、触(chu)达(da)更多(duo)(duo)客户、融更多(duo)(duo)钱、一(yi)(yi)直触(chu)达(da)到未来的(de)价(jia)值。组织(zhi)上,通过系统建设,开拓(tuo)面向(xiang)未来的(de)人(ren)才、组织(zhi)结(jie)构(gou)和(he)文化价(jia)值观等等。这(zhei)(zhei)一(yi)(yi)切就是(shi)一(yi)(yi)家公司的(de)总和(he)。


image.png


我们(men)对每位同学的(de)建议是,不要轻举妄动,首先要思考。

① 不要浮夸,不能蹭(ceng)热(re)(re)。我个(ge)(ge)人(ren)最反对蹭(ceng)热(re)(re),你要做大(da)模(mo)型,想好到(dao)底做什么,大(da)模(mo)型真正(zheng)是怎么回事(shi),跟你的(de)创业方向在哪个(ge)(ge)或哪几个(ge)(ge)维度有本质关(guan)系。蹭(ceng)热(re)(re)是最不好的(de)行为(wei),会浪(lang)费机会。

② 在(zai)(zai)这(zhei)个阶(jie)段要勤于(yu)学习。新(xin)范(fan)式有多个维度,有蛮大复(fu)杂性(xing),该看到的(de)论文要看,尤其现在(zai)(zai)发展实在(zai)(zai)太快,非确定性(xing)很大。我的(de)判断都有一定灰度,不能说看得(de)很清楚,但大致是看到是这(zhei)样的(de)结(jie)果(guo)。学习花时间,我强(qiang)烈推(tui)荐(jian)。

③ 想清楚之(zhi)后(hou)要行(xing)动(dong)(dong)导向,要果(guo)(guo)(guo)断、有规划地采取(qu)行(xing)动(dong)(dong)。如(ru)果(guo)(guo)(guo)这一次变(bian)革对(dui)你(ni)所(suo)在的产业带来结构(gou)性影(ying)(ying)响,不(bu)进则退(tui)。你(ni)不(bu)往前走没退(tui)路的,今天(tian)的位置守不(bu)住。如(ru)果(guo)(guo)(guo)你(ni)所(suo)在的产业被直接影(ying)(ying)响到,你(ni)只能采取(qu)行(xing)动(dong)(dong)。

接下来(lai)我想(xiang)讲几个(ge)维度——每个(ge)公司是一组能力的组合。

① 产品开发能力方面,如果你(ni)(ni)的公司以软件为主,毫无(wu)疑问一定对你(ni)(ni)有影响,长期(qi)影响大得不得了。尤其是如果你(ni)(ni)是做C端,用(yong)户(hu)体验的设计一定有影响,你(ni)(ni)今天就要认真考虑未来怎么(me)办。

② 如果你(ni)的公司是(shi)(shi)自己研(yan)发技(ji)术,短期(qi)有(you)局部和(he)间接影响(xiang)(xiang),它(ta)可以帮助你(ni)思考技(ji)术的设(she)计(ji)。长期(qi)核(he)心技(ji)术的研(yan)发也(ye)会(hui)受影响(xiang)(xiang)。今天芯片的设(she)计(ji)是(shi)(shi)大(da)量的工(gong)具,以后大(da)模型一(yi)定会(hui)影响(xiang)(xiang)芯片研(yan)发。类似(si)的,蛋白(bai)质(zhi)是(shi)(shi)蛋白(bai)质(zhi)结构设(she)计(ji)。不管你(ni)做什么,未来的技(ji)术它(ta)都影响(xiang)(xiang)。短期(qi)不直接影响(xiang)(xiang),长期(qi)可能有(you)重大(da)影响(xiang)(xiang)。

③ 满足(zu)需(xu)求能力,满足(zu)需(xu)求基本就要(yao)(yao)触达用(yong)户,供应链或运维(wei)一定受影响。软件的运维(wei)可(ke)以用(yong)GPT帮(bang)你(ni)做,硬件的供应链未必。长期来看(kan)有(you)变(bian)(bian)革机(ji)会,因为上(shang)下(xia)游结(jie)(jie)构(gou)会变(bian)(bian)。你(ni)要(yao)(yao)判断你(ni)在这个产业的结(jie)(jie)构(gou)会不会变(bian)(bian)。

④ 商业价值的探索(suo)、触达用户、融资(zi),这一(yi)切它可以帮你思考、迭(die)代。

48.png


最后是关于人(ren)才(cai)和组织(zhi)。

① 首先讲创(chuang)始(shi)(shi)人(ren)。今天创(chuang)始(shi)(shi)人(ren)技(ji)术能力(li)强(qiang),好像很(hen)牛、很(hen)重要,未(wei)来(lai)真的(de)(de)不重要。技(ji)术ChatGPT以后(hou)都能帮你做。你作为创(chuang)始(shi)(shi)人(ren),越(yue)(yue)来(lai)越(yue)(yue)重要、越(yue)(yue)来(lai)越(yue)(yue)值钱的(de)(de)是愿力(li)和(he)心力(li)。愿力(li)是对于未(wei)来(lai)的(de)(de)独到的(de)(de)判断和(he)信念(nian),坚持、有强(qiang)的(de)(de)韧(ren)劲。这是未(wei)来(lai)的(de)(de)创(chuang)始(shi)(shi)人(ren)越(yue)(yue)来(lai)越(yue)(yue)重要的(de)(de)核心素养。

② 对初创团队,工具能帮(bang)助探(tan)索方向,加(jia)速想法的(de)迭(die)代、产品的(de)迭(die)代,甚(shen)至资源获(huo)取。

③ 对(dui)未来人才的培(pei)养,一方面学习工具(ju),思考和探索机会,长期适当(dang)时候培(pei)养自己的prompt engineer(提示工程师)。

④ 最后(hou)讲到组织文化建设,要更深(shen)入思考,及(ji)早做(zuo)准备(bei),把握时代(dai)(dai)的机会。尤其是考虑有很多职能已经有副驾驶(shi)员(yuan),写代(dai)(dai)码也(ye)好(hao),做(zuo)设计也(ye)好(hao),这之间(jian)怎么协同?

我们面临这(zhei)样一个时代的机(ji)会。它(ta)既是(shi)机(ji)会,也是(shi)挑战。我们建议(yi)你就(jiu)这(zhei)个机(ji)会做全方位思考(kao)。

右侧固定栏
返回顶部
给我留言

验证码:

看不清换一张