李彥宏內(nèi)部講話流出!談大模型三個(gè)認(rèn)知誤區(qū)、稱不允許打榜

    2024-09-11 16:21:22 126觀看

    9月11日消息,據(jù)媒體報(bào)道,百度創(chuàng)始人李彥宏的一則內(nèi)部講話曝光,稱外界對(duì)大模型有相當(dāng)多的誤解。IjH驛資訊

    在此次講話中,李彥宏提到了外界對(duì)大模型的三個(gè)認(rèn)知誤區(qū),包括大模型競爭、開源模型效率、智能體趨勢(shì)等熱點(diǎn)話題。IjH驛資訊

    對(duì)于大模型之間的壁壘,李彥宏表示,部分自媒體的炒作,再加上每個(gè)新模型發(fā)布的時(shí)候都有宣傳的動(dòng)力,使得大家有一種印象,認(rèn)為模型之間的能力差別已經(jīng)比較小了,其實(shí)真不是這樣。IjH驛資訊

    “真正衡量文心大模型能力的是,你在具體應(yīng)用場景當(dāng)中到底有沒有能夠滿足用戶的需求,有沒有能夠產(chǎn)生價(jià)值的增益,這是我們真正在乎的”,李彥宏表示,“我不允許我們的技術(shù)人員去打榜”。IjH驛資訊

    不僅模型之間還有著明顯的差距,大模型的天花板也很高,跟理想狀態(tài)還差得非常遠(yuǎn),所以模型還需要不斷快速地去迭代、去更新、去升級(jí),幾年、十幾年如一日地投入。IjH驛資訊

    李彥宏內(nèi)部講話流出!談大模型三個(gè)認(rèn)知誤區(qū)、稱不允許打榜IjH驛資訊

    以下為內(nèi)部講話內(nèi)容IjH驛資訊

    問:有觀點(diǎn)認(rèn)為,大模型之間的能力已經(jīng)沒有壁壘了?IjH驛資訊

    李彥宏:這個(gè)說法我不同意。我認(rèn)為外界對(duì)大模型有相當(dāng)多的誤解,每一個(gè)新模型發(fā)布時(shí),肯定都想說自己有多好,每次都去跟GPT-4o做比較,拿測試集或者弄一些榜單,說我的得分已經(jīng)跟它差不多了,甚至某些單項(xiàng)上得分已經(jīng)超過它了,但這并不能證明這些新發(fā)的模型跟OpenAl先進(jìn)的模型相比已經(jīng)沒有那么大的差距了。IjH驛資訊

    模型之間的差距是多維度的,一個(gè)維度是能力方面,不管是理解能力、生成能力、邏輯推理能力還是記憶能力等這些基本能力上的差距;另一個(gè)維度是成本方面,你想具備這個(gè)能力或者想回答這些問題,你付出的成本是多少?IjH驛資訊

    有些模型可能推理速度很慢,雖然也達(dá)到同樣的效果了,但實(shí)際上它的體驗(yàn)還是不如先進(jìn)的模型。還有就是對(duì)于測試集的over-fitting,每一個(gè)想證明自己能力的模型都會(huì)去打榜,打榜時(shí)他就要猜別人到底在測什么、哪些題我用什么樣的技巧就能做對(duì),所以從榜單或者測試集上看,你覺得能力已經(jīng)很接近了,但到實(shí)際應(yīng)用中還是有明顯差距的。IjH驛資訊

    部分自媒體的炒作,再加上每個(gè)新模型發(fā)布的時(shí)候都有宣傳的動(dòng)力,使得大家有一種印象,認(rèn)為模型之間的能力差別已經(jīng)比較小了,其實(shí)真不是這樣。在實(shí)際使用過程當(dāng)中,我不允許我們的技術(shù)人員去打榜,真正衡量文心大模型能力的是,你在具體應(yīng)用場景當(dāng)中到底有沒有能夠滿足用戶的需求,有沒有能夠產(chǎn)生價(jià)值的增益,這是我們真正在乎的。IjH驛資訊

    我們需要看到,一方面模型能力之間還有比較明顯的差距,另外一方面天花板很高,你今天做到的跟你實(shí)際想要做到的、跟理想狀態(tài)還差得非常遠(yuǎn),所以模型還需要不斷快速地去迭代、去更新、去升級(jí)。IjH驛資訊

    即使今天你看到差距也許沒有那么大了,再過一年你看看差距有沒有拉大? 有誰能夠持續(xù)不斷地幾年甚至十幾年如一日往這個(gè)方向上去投入,讓它越來越能夠滿足用戶的需求、滿足場景、滿足提升效率或者說降低成本等需求?不同的模型之間差距不是越來越小,是會(huì)越來越大的,只是他們不知道真實(shí)需求的時(shí)候,只去做測試集的題可能覺得差不多了。IjH驛資訊

    所謂的領(lǐng)先12個(gè)月或者落后18個(gè)月,我認(rèn)為沒有那么重要。我們每個(gè)公司都處在完全競爭的市場環(huán)境中,你不管做什么方向都有很多競爭對(duì)手,如果你能永遠(yuǎn)保證領(lǐng)先對(duì)手12~18個(gè)月,那是天下無敵的,不要覺得12—18個(gè)月是很短的時(shí)間,哪怕你能保證永遠(yuǎn)領(lǐng)先競爭對(duì)手6個(gè)月,那就贏了,你的市場份額可能是70%,而對(duì)手可能僅為20%甚至10%的份額。IjH驛資訊

    問:有人說開源模型正在縮小與閉源模型的差距,這會(huì)摧毀閉源大模型公司的商業(yè)模式嗎?IjH驛資訊

    李彥宏:這個(gè)問題跟上一個(gè)問題是高度關(guān)聯(lián)的,我剛才講一個(gè)模型除了能力或效果之外還要看效率,效率上開源模型是不行的。閉源模型準(zhǔn)確地講應(yīng)該叫商業(yè)模型,商業(yè)化的模型是無數(shù)個(gè)用戶或者說客戶在共享同樣的資源,在分?jǐn)傃邪l(fā)成本、分?jǐn)偼评碛玫臋C(jī)器資源和GPU,而開源模型需要你自己去部署一套東西,部署之后GPU的使用率是多少呢?IjH驛資訊

    我們的文心大模型3.5、4.0也好,使用率都是90%多,你部署一個(gè)開源模型有多少人在用?我們對(duì)外講文心大模型每天調(diào)用量超過6億,每天生成的token數(shù)超過萬億,哪個(gè)開源模型可以說自己一天調(diào)用量是多少、生成了多少token?沒有人用的話成本怎么分擔(dān)?推理成本怎么能夠跟商業(yè)化模型相比呢?IjH驛資訊

    在大模型時(shí)代之前,大家習(xí)慣了開源意味著免費(fèi)、意味著成本低。那時(shí)市面上那種商業(yè)化的產(chǎn)品,每一個(gè)版本都要為之付錢,比如買一個(gè)電腦裝Windows,可能微軟要從中收多少錢,而你如果跑一個(gè)Linux就不用花這個(gè)錢了。由于Linux是開源的,所有程序員都可以看到代碼,哪兒做的不好我可以去更新,更新了再check in,大家眾人拾柴火焰高,你在巨人的肩膀上可以不斷地進(jìn)步。IjH驛資訊

    但是這些東西在大模型時(shí)代都不成立,大模型時(shí)代大家經(jīng)常講的是GPU有多貴,算力是決定大模型成敗的一個(gè)關(guān)鍵因素,開源的模型給你送算力嗎?它不給你送算力,怎么能夠讓算力高效地被利用?開源模型解決不了這個(gè)問題。IjH驛資訊

    以前你買電腦的時(shí)候就已經(jīng)為算力付費(fèi)了,但大模型的推理不是這樣,這個(gè)推理其實(shí)很貴。所以說開源大模型的價(jià)值在教學(xué)科研這些領(lǐng)域,要想搞清楚大模型的工作原理是啥,如果不知道源代碼什么的肯定是有劣勢(shì)的,但是真正在商業(yè)領(lǐng)域,當(dāng)你追求的是效率、效果,追求的是低的成本時(shí),開源模型是沒有優(yōu)勢(shì)的。IjH驛資訊

    問:AI應(yīng)用的演進(jìn)方式是什么?為什么強(qiáng)調(diào)智能體?IjH驛資訊

    李彥宏:大模型發(fā)展的過程必然要經(jīng)歷這幾個(gè)階段,一開始是對(duì)人進(jìn)行輔助,后出來什么東西需要人把后一道關(guān),我們確定它的效果是OK的,各方面都不錯(cuò)才會(huì)讓它出去,這是Copilot階段;再往下走就是Agent智能體,外界對(duì)于Agent有各種各樣不同的定義,主要還是說它有了一定的自主性,具備自主使用工具、反思、自我進(jìn)化等能力;這種自動(dòng)化程度再往下走就變成一個(gè)所謂的Al Worker,能夠像人一樣做各種各樣的腦力和體力勞動(dòng),各方面的工作都可以獨(dú)立完成。肯定要有這么一個(gè)過程。IjH驛資訊

    “智能體是大模型重要的發(fā)展方向”這個(gè)判斷,其實(shí)是一個(gè)非共識(shí)。百度Create大會(huì)上我們發(fā)了三個(gè)產(chǎn)品,AgentBuilder、AppBuilder、ModelBuilder,其中AgentBuilder和AppBuilder都是講智能體的,一個(gè)門檻更低一些,另一個(gè)功能更強(qiáng)大一些。IjH驛資訊

    當(dāng)我們解釋完了之后,有些人終于開始明白這東西確實(shí)有意思,能夠產(chǎn)生價(jià)值,而且已經(jīng)可以相對(duì)比較低門檻地做出來大家感覺可用的東西。從那時(shí)候開始智能體的熱度才慢慢上來,也開始有很多人看好智能體這個(gè)發(fā)展方向,但是到今天為止智能體還不是共識(shí),像百度這樣把智能體作為大模型重要的戰(zhàn)略、重要的發(fā)展方向的公司并不多。IjH驛資訊

    為什么我們這么強(qiáng)調(diào)智能體?因?yàn)橹悄荏w的門檻確實(shí)很低,我們?nèi)ツ暾f要卷應(yīng)用、大家都去做應(yīng)用,其實(shí)很多人還是說不知道該怎么做,不知道這個(gè)方向能不能做出來,我到底要用到什么能力才能夠在這個(gè)場景下產(chǎn)生價(jià)值,這里面有無數(shù)不確定性,大家不知道怎么從模型變成應(yīng)用。IjH驛資訊

    但是智能體提供了一個(gè)非常直接、非常高效、非常簡單的方式,在模型之上構(gòu)建智能體是相當(dāng)方便的,這也是為什么今天每周都有上萬個(gè)新的智能體在文心平臺(tái)上被創(chuàng)造出來。IjH驛資訊

    智能體方面我們已經(jīng)看到了趨勢(shì),也有比較好的先決條件,除了模型本身的能力比較強(qiáng)大之外,我們也有很好的分發(fā)通路。IjH驛資訊

    百度的APP,尤其是百度搜索一天有數(shù)以億計(jì)的人在用,用戶的需求主動(dòng)向我們表達(dá)了,哪一個(gè)智能體能更好地去回答他這些問題,去滿足他這些需求,這是一個(gè)自然匹配的過程,所以我們是能夠幫助這些開發(fā)者分發(fā)他們智能體的。IjH驛資訊

    本文鏈接:http://www.bbbearmall.com/news-131913.html李彥宏內(nèi)部講話流出!談大模型三個(gè)認(rèn)知誤區(qū)、稱不允許打榜

    標(biāo)簽:
    聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com。天上從來不會(huì)掉餡餅,請(qǐng)大家時(shí)刻謹(jǐn)防詐騙
    人妻丰满?V无码久久不卡| 久久久久久av无码免费看大片| AAA级久久久精品无码片| 中文字幕无码久久人妻| 国产亚洲精久久久久久无码AV| 成人午夜精品无码区久久| 熟妇人妻久久中文字幕| 国产福利电影一区二区三区久久老子无码午夜伦不 | av无码人妻一区二区三区牛牛 | 中文字幕久久波多野结衣av| 东京热加勒比无码视频| 亚洲中文字幕不卡无码 | 亚洲热妇无码AV在线播放| 亚洲乱码中文字幕手机在线| 婷婷色中文字幕综合在线| 久久亚洲AV成人无码电影| 亚洲欧洲日产国码无码网站| 中文字幕精品一区二区日本| 日本中文字幕在线| 性无码专区| 亚洲午夜无码片在线观看影院猛| 精品无码久久久久久尤物| 无码毛片视频一区二区本码| 少妇性饥渴无码A区免费| 亚洲天堂中文字幕在线| 欧美日韩国产中文精品字幕自在自线 | 欧美亚洲精品中文字幕乱码免费高清 | 亚洲va无码手机在线电影| 亚洲一区二区三区无码中文字幕| 亚洲一日韩欧美中文字幕欧美日韩在线精品一区二 | xx中文字幕乱偷avxx| 色综合久久中文色婷婷| 亚洲日韩中文字幕在线播放| 中文字幕专区高清在线观看| A∨变态另类天堂无码专区| 在线看无码的免费网站| 国产自无码视频在线观看| 免费无码婬片aaa直播表情| 亚洲精品无码成人片在线观看| 亚洲爆乳精品无码一区二区| 无码国内精品久久人妻麻豆按摩 |