通信界訊 近日,擁有清華系研發(fā)創(chuàng)始團(tuán)隊(duì)的面壁智能開源發(fā)布了端側(cè)旗艦大模型MiniCPM,顯著特點(diǎn)有三,以小博大,在最接近用戶體感的 MT-Bentch 上,表現(xiàn)優(yōu)異;其次,部署多模態(tài)能力,能說會(huì)看,還具備編程能力;其三,高效且部署成本低。
網(wǎng)易科技獲悉,面壁智能成立于2022年8月,深耕通用 AI 領(lǐng)域,專注大模型技術(shù)創(chuàng)新與應(yīng)用轉(zhuǎn)化。目前,公司正在構(gòu)建 Al Agent 智能體協(xié)作平臺(tái)以充分釋放大模型高效生產(chǎn)力。
此次發(fā)布的端側(cè)旗艦大模型MiniCPM就是團(tuán)隊(duì)在助力通往AGI道路上的重要一步,目前,眾多主流手機(jī)、PC 與汽車品牌相繼宣告接入大模型,端側(cè)模型則是云端協(xié)同的關(guān)鍵一環(huán)。

據(jù)介紹,Mistral-7B 是“以小博大”的標(biāo)桿模型。相比而言,面壁 MiniCPM 以2B 的參數(shù)規(guī)模、1T tokens,中英文平均成績(jī)超越 Mistral-7B,表現(xiàn)優(yōu)異。
與此同時(shí),在同等規(guī)模模型中,面壁 MiniCPM 取得主流榜單的大幅領(lǐng)先成績(jī),相比 Llama2-13B、甚至40B 量級(jí)的大個(gè)子,也在代碼、邏輯能力等重要榜單上毫不遜色。
演示中,我們可以看到,語言能力方面,面壁 MiniCPM 可以把中英語言夾雜的句子翻譯成法語。

他還能準(zhǔn)確地進(jìn)行知識(shí)問答,譬如準(zhǔn)確答出山東最高山是泰山,還知道它和黃山的準(zhǔn)確海拔,并計(jì)算出差值。

此外,可以為你言語中的情感流露配上可愛小表情,也能對(duì)人物性格進(jìn)行活靈活現(xiàn)的演繹。

MiniCPM 還能夠?qū)懗鲆淮笍?fù)刻自己」的代碼片段。

具體在部署方面,面壁 MiniCPM 可以支持 CPU 推理,降低模型推理成本。同時(shí)發(fā)布的量化版本,可以做到壓縮75%,性能基本無損。
面壁智能 CEO 李大海以現(xiàn)場(chǎng)演示所使用手機(jī)為例,做了一道數(shù)學(xué)題。驍龍855芯片,成本約600元人民幣,按照運(yùn)行5年計(jì)算,每秒7.5 tokens,那么170萬 tokens 的推理成本是人民幣1元。低成本端側(cè)推理之外,僅需一臺(tái)電腦、一張顯卡就能完成對(duì) MiniCPM 的 SFT。
據(jù)了解,團(tuán)隊(duì)還對(duì) iOS,、Android 和 Harmony 等操作系統(tǒng)進(jìn)行了模型適配。目前,MiniCPM 已跑通了國(guó)際主流手機(jī)品牌和終端 CPU 芯片。
值得一提的是,面壁還一并開源了一個(gè)12B 多模態(tài)模型 OmniLMM,并取得 Object HalBench 榜單第一,在 MMHal-Bench 僅次于 GPT-4。
李大海表示,這是面壁“大模型+Agent ”雙引擎戰(zhàn)略的關(guān)鍵一步,從智能發(fā)展而言,我們堅(jiān)定認(rèn)為智能體化是未來邁向通用智能的必由之路,而智能體必然要在端側(cè)服務(wù)用戶,我們接下來會(huì)進(jìn)一步探索 Agent +云端協(xié)同的工作機(jī)制,實(shí)現(xiàn)智能賦能萬物。
面壁智能聯(lián)合創(chuàng)始人、清華大學(xué)副教授劉知遠(yuǎn)認(rèn)為:從技術(shù)研判而言,2023年 ChatGPT 和 GPT-4的推出,表明大模型技術(shù)路線已經(jīng)基本確定。
“接下來就是要探索其科學(xué)機(jī)理,并極致地優(yōu)化效率,我們這次推出端側(cè)大模型,也是向大家分享一個(gè)2B 級(jí)別大模型所能達(dá)到的性能機(jī)制,讓大家認(rèn)識(shí)到即使2B 尺寸大模型的效果極限還沒有被充分挖掘出來,這是一個(gè)科學(xué)問題也是一個(gè)技術(shù)問題,需要大家共同探索。”