日韩AV片无码一区二区不卡电影_HEYZO无码综合国产精品_国产精品无码a∨精品_韩日美无码精品无码

強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了

2024-08-08 16:14:19 317觀看

國產大模型,多模態能力都開始超越GPT-4-Turbo了??CXE驛資訊

權威榜單,中文多模態大模型測評基準SuperCLUE-V,新鮮出爐:CXE驛資訊

強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了CXE驛資訊

特別是騰訊的hunyuan-vision、上海AI Lab的InternVL2-40B,分別成為國內閉源和開源界兩大領跑者,甚至超過Claude-3.5-Sonnet和谷歌王牌Gemini-1.5-Pro。CXE驛資訊

雖然這次都還是被GPT-4o壓過,差距也確確實實縮小了很多。CXE驛資訊

(這個榜單旨在為中文領域提供一個多模態大模型多維度能力評估參考,GPT-4o等國外模型僅作對比參考,不參與排名哦)CXE驛資訊

hunyuan-vision也就是騰訊混元大模型的多模態版本了,除了開發者調用API之外,其實在騰訊元寶APP里免費就能體驗到。CXE驛資訊

一直以來,元寶主打“實用AI搭子”,似乎著重強調的是實用易用性;沒想到背著咱們偷偷拿模型去測評,還捧回來個國內第一,emmm……有點意思。CXE驛資訊

所以國產多模態大模型進化成什么樣了,光看分數還是不夠直觀,下面就拉出來溜溜。CXE驛資訊

多模態能力第一?這就上手玩CXE驛資訊

多模態測試,說實話有點不嘻嘻:還沒有出現“弱智吧”一樣公認效果拔群的“民間benchmark”。CXE驛資訊

但又嘻嘻:根本不耽誤我們碳基生物用千奇百怪的圖片來為難大模型。CXE驛資訊

強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了CXE驛資訊

那就開始吧!CXE驛資訊

Round 1.1:梗圖表情包理解CXE驛資訊

時間過得好快!昨兒已經立秋了。CXE驛資訊

夏天夏天悄悄過去,只留下可以用這張meme圖概括的心情:CXE驛資訊

強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了CXE驛資訊

問元寶,這張圖什么意思?得到的答案是:CXE驛資訊

強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了CXE驛資訊

隨手測試的程序員祖傳題,元寶也輕松應對。CXE驛資訊

強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了CXE驛資訊

Round 1.2:照片內容識別CXE驛資訊

上來就是一道不走尋常路的“超前”題——編輯部好幾個人對著這張圖皺眉。CXE驛資訊

太黑暗了,不知是何物。CXE驛資訊

強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了CXE驛資訊

答案揭曉,這是近一個分享貼中,“南京本地人應該也受不了”的黑金榴蓮紫薯披薩。CXE驛資訊

元寶不僅能正確get到圖中“太超前”的含義,同時還根據圖片猜中了食物拿紫薯當原料。CXE驛資訊

至于沒有猜出榴蓮成分,也不能怪它,人類的黑暗料理不管是對AI還是對人類都真的太超前……CXE驛資訊

強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了CXE驛資訊

再來一道經典題目,數吉娃娃。CXE驛資訊

可以看到,混元元寶先是分析了題目中“吉娃娃”的外貌特征,然后分別告訴了九張圖中哪些是吉娃娃的照片。CXE驛資訊

不僅答得全對,還看出了圖中另一個物種是藍莓松餅。CXE驛資訊

強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了CXE驛資訊

Round 1.3:視覺錯覺挑戰CXE驛資訊

多模態大模型的視覺幻覺問題,是這兩年的熱門研究方向。CXE驛資訊

這些測試題真的很有迷惑性,別說大模型了,連人類也常常踩坑沒商量。CXE驛資訊

但騰訊元寶,就這么水靈靈地答對了!CXE驛資訊

強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了CXE驛資訊

當初難道一種大模型的“哪一棵樹更亮”,也謹慎地回答:CXE驛資訊

強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了CXE驛資訊

不過更難的錯覺挑戰它就不行了。讀圖片中隱藏信息的傻傻看不出,怎么問都說“沒有啊”:CXE驛資訊

強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了CXE驛資訊

不過講道理,這些題GPT-4V也答不上來,大約目前多模態大模型的階段性能力還沒邁過這道坎。CXE驛資訊

玩耍一番過后,接下來要動真格的!CXE驛資訊

測試元寶背后hunyuan-vision在實用場景下,表現如何。CXE驛資訊

Round 2.1:財報表現摘要讀取CXE驛資訊

每個季度、半年、年終的財報,打工人看了真的是腦闊痛。CXE驛資訊

這就把騰訊一季度財報表現摘要截圖扔給元寶,讓它幫忙淺做分析:CXE驛資訊

強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了CXE驛資訊

元寶讀取了圖標中的數據,還在后還小小總結了一把:CXE驛資訊

總體來看,該公司在2024年3月31日的財務表現顯著優于2023年3月31日,各項指標均有不同程度的增長,尤其是毛利、經營盈利和期內盈利的增長幅度較大。CXE驛資訊

Round 2.2:讀取(學術)圖表CXE驛資訊

先來一道沒那么學術的圖表識別題。CXE驛資訊

問,一張圖中的數字序列,缺少了哪一個?CXE驛資訊

元寶很好地讀圖,并正確填補了缺的那個數字:29。CXE驛資訊

強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了CXE驛資訊

然后隨機從一篇關于大模型數據的論文中,截圖喂過去。CXE驛資訊

它也能理解并給出詳細解釋,后還來幾句總結。CXE驛資訊

強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了CXE驛資訊

Round 2.3:行測找規律題CXE驛資訊

這一回合的后上大招——萬千人頭疼不已的行測找規律題。CXE驛資訊

題是下面這一道,prompt輸入:請從所給的四個選項中,選擇合適的一個填入問號處,使之呈現一定的規律性。CXE驛資訊

先提前透露正確答案,選C。CXE驛資訊

強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了CXE驛資訊

在公布自己的終答案之前,元寶嘰里呱啦進行了很長的過程分析(講真,看得人很緊張)。CXE驛資訊

后堅定地選了C選項,答對。CXE驛資訊

強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了CXE驛資訊

一道GPT-4V沒做對的附加題CXE驛資訊

先做個前情提要,此前研究人員們發現,GPT-4V更擅長解釋西方文化背景的圖像or帶有英文文字的圖像。CXE驛資訊

比如給AI看《白雪公主》,知道是有7個小矮人。換成《葫蘆娃》,7個就數成了10個,葫蘆山七彩峰也說成了冰山。CXE驛資訊

強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了CXE驛資訊

那么純國產大模型,總該表現好點了吧?直接原題譯中,丟過去。CXE驛資訊

好家伙,不僅數對了數量,還在追問中成功辨別這是《葫蘆兄弟》的截圖。CXE驛資訊

Nice!CXE驛資訊

強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了CXE驛資訊

騰訊元寶,真·AI實用搭子CXE驛資訊

看過這么多實測案例,是時候整體介紹一下背后的模型和整個APP了。CXE驛資訊

騰訊混元大模型,可以說是一位老朋友了。CXE驛資訊

去年9月首次對外亮相,之后一直保持著快速迭代。目前已擴展至萬億參數規模,由7萬億tokens的預訓練語料訓練而來,能力已覆蓋了文本、多模態理解及生成等。CXE驛資訊

在國內大模型中,騰訊混元率先完成MoE(Mix of Experts,專家混合)架構升級,也就是從單個稠密模型升級到多個專家組成的稀疏模型。CXE驛資訊

今年7月,還解鎖了一個單日調用tokens數達千億級的成就。CXE驛資訊

強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了CXE驛資訊

騰訊元寶,今年5月底剛剛上線,可能對很多人來說還是新朋友。CXE驛資訊

值得一提的是,在前一陣“9.11和9.9哪個大”的風波中,騰訊元寶表現不錯,無需額外提示自己就能答對。CXE驛資訊

強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了CXE驛資訊

騰訊元寶主打一個“實用AI搭子”,其中一個特色是APP、小程序和網頁都能訪問,聊天記錄多端同步。CXE驛資訊

比如在微信聊天中接收到的工作文檔,不用轉存到手機目錄,就可以直接到小程序選擇對話直接發給AI了,接下來是總結也好、生成也好都非常方便。CXE驛資訊

強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了CXE驛資訊

再拿多模態理解能力來說,無論是文檔截圖、人像風景、收銀小票,還是任意一張隨手拍的照片,元寶都能基于圖中內容給出自己的理解和分析。CXE驛資訊

背后的一個思考是不光要識別、理解,還要生成滿足用戶需求的內容。CXE驛資訊

從前面的測試中也可以看出,丟一個表情包給它,回答也會簡短,換成學術圖表,回答就會盡量詳盡、并且主動附加總結段落。CXE驛資訊

據騰訊介紹,混元大模型系列中的多模態理解模型,在視覺編碼、語言模型、訓練數據三方面做了深度的優化,能處理高達7k分辨率大16:1長寬比圖片,也是國內首個基于MoE的多模態大模型。CXE驛資訊

把Transformer開山之作,經典論文《Attention is all you need》拼成一個長圖,對騰訊元寶來說也完全不是難事,從引言到結論全文覆蓋。CXE驛資訊

強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了CXE驛資訊

而且騰訊元寶團隊這次特別透露,接下來會把更多精力放在融合模型多模態能力上。CXE驛資訊

反正騰訊嘛大家都熟悉,是國內大廠里重產品,重視打磨用戶體驗的。CXE驛資訊

比如近騰訊元寶開始往“深度”發展,先更新了“深度搜索”,又剛剛上線“深度長文閱讀”。CXE驛資訊

這些功能都是隱藏了技術細節、盡量減少對提示工程的需要,很多功能都是自動識別,一鍵觸發,不需要什么學習成本。CXE驛資訊

強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了CXE驛資訊

深度閱讀功能就初步整合了多模態理解能力,上傳一個論文PDF進去,生成的“精度”頁面中不僅有文字總結,還能把相應的圖表從文檔里拽出來。CXE驛資訊

在很多情況下,都不用來回翻原文對照了。CXE驛資訊

強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了CXE驛資訊

而且這一次,中文多模態大模型測評基準SuperCLUE-V榜單成績,也說明騰訊不只搞好了產品體驗,也非常看中背后模型基礎能力。CXE驛資訊

所以說,在多模態“圖生文”場景下,騰訊又能整出什么實用好活,就非常值得期待了。CXE驛資訊

本文鏈接:http://www.bbbearmall.com/news-131298.html強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了

標簽:
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com。天上從來不會掉餡餅,請大家時刻謹防詐騙
日韩AV片无码一区二区不卡电影_HEYZO无码综合国产精品_国产精品无码a∨精品_韩日美无码精品无码

    亚洲男人天堂2021| 国产裸体舞一区二区三区| youjizz.com在线观看| 玖玖爱视频在线| 国产成人无码一二三区视频| 97av中文字幕| 超碰免费在线公开| 午夜剧场高清版免费观看| 欧美xxxxx在线视频| 日本a视频在线观看| www.亚洲成人网| 男女啪啪的视频| 亚洲天堂网站在线| 久热在线视频观看| 99热这里只有精品在线播放| 国产一区视频免费观看| av观看免费在线| 欧美激情 国产精品| 欧美精品久久久久久久自慰| 国产在线视频在线| 国产一区二区三区小说| 欧美国产综合在线| 阿v天堂2018| 成人午夜精品久久久久久久蜜臀| 久久亚洲国产成人精品无码区| 97在线免费视频观看| 免费的一级黄色片| 妞干网在线观看视频| 97在线国产视频| 欧美 日韩 亚洲 一区| 国产精品va无码一区二区| 日日橹狠狠爱欧美超碰| 欧美日韩激情视频在线观看| 黑森林福利视频导航| 欧美特级aaa| 在线观看日本www| 亚洲免费视频播放| 国产一线二线三线女| 和岳每晚弄的高潮嗷嗷叫视频| 热99这里只有精品| 国产精品人人妻人人爽人人牛| 国产又大又黄又粗的视频| 香蕉视频网站入口| 亚洲男人天堂2021| 欧美亚洲黄色片| 国产a级片免费观看| 激情文学亚洲色图| av久久久久久| 亚洲人成无码www久久久| 天堂在线中文在线| av 日韩 人妻 黑人 综合 无码| 欧美黑人经典片免费观看| 97公开免费视频| 青青草原国产免费| 成熟丰满熟妇高潮xxxxx视频| 国产aaa一级片| 亚洲av无日韩毛片久久| 精品成在人线av无码免费看| 丁香婷婷激情网| 六月婷婷激情网| 99色精品视频| 一级日本黄色片| 日韩精品 欧美| 一本色道久久亚洲综合精品蜜桃| 一本—道久久a久久精品蜜桃| 免费国产黄色网址| 日本黄色福利视频| 久久国产午夜精品理论片最新版本| 玩弄japan白嫩少妇hd| 久久精品在线免费视频| 激情综合网俺也去| 国产在线无码精品| 天堂在线资源视频| 成年女人18级毛片毛片免费| 在线观看的毛片| 免费特级黄色片| 亚洲一区二区在线视频观看| 999在线观看视频| 在线播放av中文字幕| 欧美一级在线看| 亚洲高清av一区二区三区| 日韩精品一区二区三区久久| 四虎影院一区二区| 无码内射中文字幕岛国片| 青青草综合在线| av亚洲天堂网| 日韩免费高清在线| 国产va亚洲va在线va| 中文字幕丰满乱码| 中文字幕无码不卡免费视频| 欧美黄网在线观看| 污污视频网站在线| 欧美 日韩 国产 激情| 国产中文字幕二区| 欧美日韩午夜爽爽| 免费在线观看污网站| 亚洲色图38p| 少妇高潮喷水在线观看| 4444在线观看| 中文字幕12页| www亚洲成人| 波多野结衣家庭教师视频| 少妇久久久久久被弄到高潮| 国产在线观看中文字幕| 亚洲欧美自拍另类日韩| 91视频免费版污| 116极品美女午夜一级| 青草青青在线视频| www.激情网| 中国一级黄色录像| 色男人天堂av| 伊人色在线视频| 看看黄色一级片| 色悠悠久久综合网| 妓院一钑片免看黄大片| 岳毛多又紧做起爽| 波多野结衣家庭教师视频| 欧美精品一区免费| 日本福利视频在线| 国产视频九色蝌蚪| 大陆极品少妇内射aaaaa| 亚洲人精品午夜射精日韩| 欧洲精品一区二区三区久久| 国产精品69页| 国产主播在线看| 国产淫片免费看| 欧美亚洲国产成人| 亚洲成熟丰满熟妇高潮xxxxx| 妺妺窝人体色www在线小说| 91精品91久久久中77777老牛| 日日碰狠狠添天天爽超碰97| 日韩av综合在线观看| 那种视频在线观看| av免费中文字幕| 欧美精品aaaa| 亚洲精品成人在线播放| 黄色片免费网址| 国产激情片在线观看| www.xxx麻豆| 国产一区二区在线视频播放| 国产成人亚洲精品无码h在线| 苍井空浴缸大战猛男120分钟| 久久综合久久色| 国产美女18xxxx免费视频| 婷婷激情综合五月天| 成年人三级视频| 大西瓜av在线| 黑森林福利视频导航| 欧美在线aaa| 日本成人在线不卡| 丰满少妇被猛烈进入高清播放| 国产情侣av自拍| 中文av字幕在线观看| 国产激情片在线观看| 久久国产亚洲精品无码| 免费涩涩18网站入口| 亚洲一级片免费观看| 国产日韩欧美精品在线观看| 国产成人无码一二三区视频| 亚洲三级在线观看视频| 久操手机在线视频| 日本熟妇人妻xxxxx| 天天做天天干天天操| 东北少妇不带套对白| 丝袜制服一区二区三区| 青少年xxxxx性开放hg| 久草热视频在线观看| 国产福利在线免费| 蜜桃视频一区二区在线观看| 熟女性饥渴一区二区三区| 日本在线观看视频一区| 成人一级生活片| 午夜免费福利在线| 欧美黄色免费网址| 一区二区三区国产免费| 伊人网在线免费| 久久久国产欧美| 99久久久精品视频| 国产高清视频网站| 野外做受又硬又粗又大视频√| 爱情岛论坛vip永久入口| wwwjizzjizzcom| 日韩无套无码精品| 轻点好疼好大好爽视频| 少妇一级淫免费放| 久久久国内精品| 欧美成人福利在线观看| www.av毛片| 午夜在线视频免费观看| 国产精品人人妻人人爽人人牛| 天天干天天色天天爽| av五月天在线| 国产精品久久中文字幕| 1314成人网| 欧美三级理论片| 成熟丰满熟妇高潮xxxxx视频| 一道本在线观看视频| 手机在线看福利| 国产成人在线免费看| 毛片在线视频观看|