国产91免费_国产精品电影一区_日本s色大片在线观看_中文在线免费看视频

CNTXJ.NET | 通信界-中國(guó)通信門戶 | 通信圈 | 通信家 | 下載吧 | 說(shuō)吧 | 人物 | 前瞻 | 智慧(區(qū)塊鏈 | AI
 國(guó)際新聞 | 國(guó)內(nèi)新聞 | 運(yùn)營(yíng)動(dòng)態(tài) | 市場(chǎng)動(dòng)態(tài) | 信息安全 | 通信電源 | 網(wǎng)絡(luò)融合 | 通信測(cè)試 | 通信終端 | 通信政策
 專網(wǎng)通信 | 交換技術(shù) | 視頻通信 | 接入技術(shù) | 無(wú)線通信 | 通信線纜 | 互聯(lián)網(wǎng)絡(luò) | 數(shù)據(jù)通信 | 通信視界 | 通信前沿
 智能電網(wǎng) | 虛擬現(xiàn)實(shí) | 人工智能 | 自動(dòng)化 | 光通信 | IT | 6G | 烽火 | FTTH | IPTV | NGN | 知本院 | 通信會(huì)展
您現(xiàn)在的位置: 通信界 >> 智慧 >> 新聞?wù)?/span>
 
Sora如何降維打擊其他文生視頻大模型?記者實(shí)測(cè)對(duì)比
[ 通信界 | 羅亦丹 | www.6611o.com | 2024/2/19 9:14:15 ]
 

  OpenAI的文生視頻大模型Sora已經(jīng)發(fā)布兩天,其沖擊力依然不減。

  2月18日,新京報(bào)貝殼財(cái)經(jīng)記者進(jìn)行了Sora與其他文生視頻大模型的對(duì)比測(cè)試,發(fā)現(xiàn)Sora在時(shí)間和視頻生成質(zhì)量上均對(duì)“同行”產(chǎn)生了“降維打擊”:其他文生視頻大模型僅能生成3至4秒的視頻,而Sora生成的視頻時(shí)間最多可達(dá)1分鐘,且景物也更加清晰穩(wěn)定、符合描述。

  不過(guò),隨著越來(lái)越多使用Sora制作的視頻出現(xiàn)以及部分技術(shù)細(xì)節(jié)的公開,業(yè)界開始對(duì)其進(jìn)行全方位審視,其中,贊揚(yáng)和驚嘆聲不少,但Sora生成的視頻也被發(fā)現(xiàn)存在諸多不合理之處。

  文生視頻對(duì)比實(shí)測(cè):Sora從“動(dòng)圖”升級(jí)到“短片”

  “一個(gè)時(shí)髦的女人走在東京的街道上,街道上充滿了溫暖發(fā)光的霓虹燈和生動(dòng)的城市標(biāo)志。她穿著一件黑色的皮夾克,一件紅色的長(zhǎng)裙,一雙黑色的靴子,還帶著一個(gè)黑色的錢包。她戴著太陽(yáng)鏡,涂著紅色的口紅。她自信而隨意地走著。街道是潮濕和反光的,創(chuàng)造了一個(gè)五顏六色的燈的鏡面效果。許多行人走來(lái)走去。”這是OpenAI官網(wǎng)介紹Sora時(shí),出現(xiàn)的第一組提示詞。

  在OpenAI推出Sora之前,文生視頻領(lǐng)域的創(chuàng)業(yè)公司主要包括Pika、Runway等,為了驗(yàn)證Sora的能力,新京報(bào)貝殼財(cái)經(jīng)記者將上述同樣的提示詞輸入Pika文生視頻模型,以及Runway旗下的Gen-2video文生視頻模型進(jìn)行了實(shí)測(cè)。

在相同提示詞下,新京報(bào)貝殼財(cái)經(jīng)記者使用Pika生成的視頻截圖。

在相同提示詞下,新京報(bào)貝殼財(cái)經(jīng)記者使用runway旗下Gen-2video生成的視頻截圖。

  OpenAI官網(wǎng)上Sora生成的視頻。

  貝殼財(cái)經(jīng)記者發(fā)現(xiàn),在相同的提示詞下,Pika僅能生成3秒的視頻,Gen-2video則可以生成4秒的視頻。其中,Pika的視頻為“時(shí)髦女人”的背影,無(wú)法體現(xiàn)她“戴著太陽(yáng)鏡,涂著紅色的口紅”的描述,不過(guò)對(duì)于提示詞中“潮濕反光的街道和五顏六色燈的鏡面效果”體現(xiàn)得較好,但整體上視頻較為模糊。

  Gen-2video則跳出了“無(wú)法輸入這么多提示詞”的彈窗,并根據(jù)能夠輸入的部分生成了一個(gè)4秒的視頻,該視頻相比Pika顯然精細(xì)很多,也符合提示詞描述的人物形象,包括“街道、人群、黑錢包”等。

  但可以發(fā)現(xiàn),無(wú)論是Pika還是Gen-2video,都忽略了“一件紅色的長(zhǎng)裙”這個(gè)細(xì)節(jié),且貝殼財(cái)經(jīng)記者通過(guò)觀看視頻發(fā)現(xiàn),這兩段視頻仍能看出AI生成的影子,特別是Gen-2video的人物臉部,有細(xì)微的形變,這正是AI生成視頻的特點(diǎn)之一:難以始終保持同一人物的連貫性。

  而Sora不僅體現(xiàn)了提示詞中的全部細(xì)節(jié),而且還很好地保持了人物的連貫性,使得該視頻幾乎可以“以假亂真”。當(dāng)然,如果仔細(xì)觀察,可以發(fā)現(xiàn)該視頻中人物的腳步在某幾個(gè)幀會(huì)出現(xiàn)不自然的扭曲,以及該視頻中的背景廣告牌雖然酷似日文,但由于目前AI還無(wú)法直接在視頻中“認(rèn)識(shí)”文字,其只能生成似是而非的“日文”,這都是AI生成視頻的特點(diǎn)之一。

  但即便如此,Sora還是用事實(shí)顯現(xiàn)出了同其他文生視頻大模型的代差。

  在谷歌和推特都有從業(yè)經(jīng)歷的AI創(chuàng)業(yè)者Gabor Cselle也發(fā)布了使用相同提示詞,在其他四個(gè)文生視頻模型中“復(fù)現(xiàn)”Sora“穿過(guò)下雪、櫻花飛舞的東京街道……”的場(chǎng)景,并表示“其他模型達(dá)不到能和Sora比較的效果”。

  Gabor Cselle社交賬號(hào)截圖。

  在國(guó)內(nèi),也有不少AI從業(yè)者直觀地感受到了Sora帶來(lái)的沖擊。

  清華大學(xué)沈陽(yáng)教授團(tuán)隊(duì)一直聚焦AI在各個(gè)領(lǐng)域的應(yīng)用,并也一直在使用AI模型進(jìn)行文生視頻的操作。2月17日,他在朋友圈發(fā)布了一條團(tuán)隊(duì)成員花兩天制作的“半失敗”AI視頻,并表示“從這里可以看出和Sora的差距,我讓她暫時(shí)放棄這個(gè)作品,等算法升級(jí)再重做一下。”

  對(duì)于Sora出現(xiàn)后,使用AI制作視頻的工作能否繼續(xù),沈陽(yáng)回復(fù)貝殼財(cái)經(jīng)記者“慢慢弄,往前挪唄”。

  理解物理世界顛覆影視、游戲行業(yè) Sora是“通用世界模型”嗎?

  為何Sora能夠在視頻生成的質(zhì)量上明顯領(lǐng)先同業(yè)產(chǎn)品?OpenAI在官方網(wǎng)站上表示,Sora是能夠理解和模擬現(xiàn)實(shí)世界的模型的基礎(chǔ),相信這一能力將是實(shí)現(xiàn)通用人工智能的重要里程碑。不過(guò),Sora還存在很多不完善之處,仍然處于世界模型研究應(yīng)用的初期階段。

  什么是世界模型?貝殼財(cái)經(jīng)了解到,實(shí)際上runway公司在去年12月就提出過(guò)要開發(fā)通用世界模型(General World Model),用其旗下的Gen-2模型來(lái)模擬整個(gè)世界,“我們相信,人工智能的下一個(gè)重大進(jìn)步將來(lái)自理解視覺(jué)世界及其動(dòng)態(tài)的系統(tǒng),這就是為什么我們要圍繞通用世界模型開始一項(xiàng)新的長(zhǎng)期研究工作。”

  從效果上看,目前OpenAI已經(jīng)通過(guò)Sora部分做到了這一點(diǎn),因?yàn)橹挥欣斫馕锢硎澜绲倪\(yùn)行法則,文生視頻模型才能創(chuàng)造出更加逼真的視頻。英偉達(dá)高級(jí)科學(xué)家Jim Fan就對(duì)此表示,Sora是一個(gè)數(shù)據(jù)驅(qū)動(dòng)的物理引擎,“它是對(duì)許多世界的模擬,無(wú)論是真實(shí)的,還是虛構(gòu)的。該模擬器通過(guò)去噪和梯度學(xué)習(xí)方式,學(xué)習(xí)了復(fù)雜的渲染、直觀的物理、長(zhǎng)期推理和語(yǔ)義理解。”

  而理解現(xiàn)實(shí)世界的物理法則,也正是通往通用人工智能這一“終極目標(biāo)”的必經(jīng)之路。

  對(duì)此,不少科技圈名人都發(fā)出了驚嘆,馬斯克直接在社交平臺(tái)上發(fā)布短評(píng)“GG世界”(GG是網(wǎng)絡(luò)游戲的用語(yǔ)之一,原指游戲結(jié)束時(shí)玩家互相致意,后引申為“游戲結(jié)束”)。

  360公司董事長(zhǎng)周鴻祎則直接在朋友圈發(fā)文稱,一旦AI能夠接上攝像頭,觀看并理解世界上所有的電影,它對(duì)世界的理解能力將遠(yuǎn)遠(yuǎn)超過(guò)僅僅通過(guò)文字學(xué)習(xí)所能達(dá)到的水平。在這種情況下,實(shí)現(xiàn)通用人工智能不再是遙不可及的夢(mèng)想。周鴻祎甚至預(yù)測(cè),這一天可能在一兩年內(nèi)就會(huì)到來(lái),而不是十年或二十年。

  在現(xiàn)實(shí)層面,有更多人擔(dān)心文生視頻大模型可能直接沖擊影視和游戲行業(yè)。美國(guó)舊金山早期投資人Zak Kukoff預(yù)測(cè),在5年內(nèi),一個(gè)不到5人的團(tuán)隊(duì)將可能用文生視頻模型制作出一部票房收入超過(guò)5000萬(wàn)美元的電影。

  值得注意的是,日前大火的游戲《幻獸帕魯》的開發(fā)團(tuán)隊(duì)就僅有4人,有許多人質(zhì)疑該團(tuán)隊(duì)使用了AI生成技術(shù)制作游戲角色,以節(jié)省成本。而根據(jù)OpenAI 發(fā)布的最新Sora技術(shù)報(bào)告,Sora能夠模擬視頻游戲的數(shù)字化過(guò)程,Sora能在控制 Minecraft 游戲角色進(jìn)行基本操作的同時(shí),高質(zhì)量動(dòng)態(tài)渲染游戲世界。這意味著,個(gè)人開發(fā)制作游戲的門檻可能會(huì)被進(jìn)一步降低。

  前阿里巴巴副總裁,Lepton AI公司創(chuàng)始人賈揚(yáng)清則直接評(píng)價(jià)Sora“真的非常牛”,他表示Sora的問(wèn)世可能會(huì)給對(duì)作OpenAI的公司帶來(lái)一波被大廠FOMO(害怕錯(cuò)過(guò)機(jī)會(huì)而導(dǎo)致的收購(gòu))收購(gòu)的機(jī)會(huì)。賈揚(yáng)清預(yù)測(cè),大模型市場(chǎng)長(zhǎng)期仍將呈現(xiàn)閉源寡頭的格局,開源大模型仍然需要一段時(shí)間才能追趕上,而從算法小廠的角度來(lái)看,要么在算法上與OpenAI媲美,要么深耕垂直領(lǐng)域的應(yīng)用,要么選擇開源道路;最后,基礎(chǔ)設(shè)施的需求將繼續(xù)猛增。

 

184作者:羅亦丹 來(lái)源:新京報(bào) 編輯:顧北

 

聲明:①凡本網(wǎng)注明“來(lái)源:通信界”的內(nèi)容,版權(quán)均屬于通信界,未經(jīng)允許禁止轉(zhuǎn)載、摘編,違者必究。經(jīng)授權(quán)可轉(zhuǎn)載,須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息并注明“來(lái)源:通信界”。②凡本網(wǎng)注明“來(lái)源:XXX(非通信界)”的內(nèi)容,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多行業(yè)信息,僅代表作者本人觀點(diǎn),與本網(wǎng)無(wú)關(guān)。本網(wǎng)對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。③如因內(nèi)容涉及版權(quán)和其它問(wèn)題,請(qǐng)自發(fā)布之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除內(nèi)容。 
熱點(diǎn)動(dòng)態(tài)
普通新聞 OpenAI甩出AI模型Sora,拍大片就一句話的事兒,誰(shuí)最害怕?
普通新聞 Sora為何出道即碾壓主流AI視頻模型:文生視頻最長(zhǎng)紀(jì)錄 對(duì)世界有全面
普通新聞 世人驚呼Sora誕生:現(xiàn)實(shí)不存在了!多家A股公司積極布局視頻生成模型
普通新聞 Sora如何降維打擊其他文生視頻大模型?記者實(shí)測(cè)對(duì)比
普通新聞 30年全球半導(dǎo)體建廠洞察:美國(guó)需736天,比全球平均值多8%
普通新聞 全球首款透明屏PC?聯(lián)想將在MWC展示新款A(yù)I PC
普通新聞 AMD將發(fā)銳龍8000GE系列APU 頻率功耗均降低
普通新聞 iPhoneSE4或2025年推出 造型類似iPhone14
普通新聞 曝魅族21PRO已經(jīng)正式完成測(cè)試將于下個(gè)月開啟預(yù)熱
普通新聞 外媒:美國(guó)政府考慮為英特爾提供超過(guò)100億美元補(bǔ)貼
普通新聞 國(guó)家綠色發(fā)展基金領(lǐng)投,美克生能源完成D輪融資
普通新聞 周鴻祎:Sora意味著AGI實(shí)現(xiàn)將從10年縮短到1年
普通新聞 “手寫再見(jiàn),智能你好” 一文讀懂AI商務(wù)速記
普通新聞 國(guó)貨之光!FFALCON雷鳥電視及顯示器新品,顏值與實(shí)力并存
普通新聞 FFALCON雷鳥2024新品發(fā)布會(huì)揭秘:MiniLED與千級(jí)背光分區(qū)如何重塑電
普通新聞 AI商務(wù)速記,引領(lǐng)高效溝通新時(shí)代
普通新聞 中國(guó)移動(dòng)聯(lián)合華為,全球首條 5G-A 車聯(lián)網(wǎng)全要素驗(yàn)證示范線路開通
普通新聞 華為全年研發(fā)投入1621億元!中國(guó)第一 世界第五
普通新聞 臺(tái)積電耗時(shí)36年 成全球最大半導(dǎo)體制造商
普通新聞 分析師:忘記FAANG和Magnificent Seven 美股將由AI 5來(lái)主導(dǎo)
通信視界
高通CEO安蒙:生成式AI走向終端,將帶來(lái)最大智
普通對(duì)話 高通CEO安蒙:生成式AI走向終端,將帶來(lái)最大
普通對(duì)話 李彥宏:不斷地重復(fù)開發(fā)基礎(chǔ)大模型是對(duì)社會(huì)
普通對(duì)話 中興通訊徐子陽(yáng):強(qiáng)基慧智,共建數(shù)智熱帶雨
普通對(duì)話 鄔賀銓:移動(dòng)通信開啟5G-A新周期,云網(wǎng)融合
普通對(duì)話 華為輪值董事長(zhǎng)胡厚崑:我們正努力將5G-A帶
普通對(duì)話 高通中國(guó)區(qū)董事長(zhǎng)孟樸:5G與AI結(jié)合,助力提
普通對(duì)話 雷軍發(fā)布小米年度演講:堅(jiān)持做高端,擁抱大
普通對(duì)話 聞庫(kù):算網(wǎng)融合正值挑戰(zhàn)與機(jī)遇并存的關(guān)鍵階
普通對(duì)話 工信部副部長(zhǎng)張?jiān)泼鳎何覈?guó)算力總規(guī)模已居世
普通對(duì)話 鄔賀銓:我國(guó)互聯(lián)網(wǎng)平臺(tái)企業(yè)發(fā)展的新一輪機(jī)
通信前瞻
亨通光電實(shí)踐數(shù)字化工廠,“5G+光纖”助力新一
普通對(duì)話 亨通光電實(shí)踐數(shù)字化工廠,“5G+光纖”助力新
普通對(duì)話 中科院錢德沛:計(jì)算與網(wǎng)絡(luò)基礎(chǔ)設(shè)施的全面部
普通對(duì)話 工信部趙志國(guó):我國(guó)算力總規(guī)模居全球第二 保
普通對(duì)話 鄔賀銓院士解讀ChatGPT等數(shù)字技術(shù)熱點(diǎn)
普通對(duì)話 我國(guó)北方海區(qū)運(yùn)用北斗三號(hào)短報(bào)文通信服務(wù)開
普通對(duì)話 華為云Stack智能進(jìn)化,三大舉措賦能政企深度
普通對(duì)話 孟晚舟:“三大聚力”迎接數(shù)字化、智能化、
普通對(duì)話 物聯(lián)網(wǎng)設(shè)備在智能工作場(chǎng)所技術(shù)中的作用
普通對(duì)話 軟銀研發(fā)出以無(wú)人機(jī)探測(cè)災(zāi)害被埋者手機(jī)信號(hào)
普通對(duì)話 AI材料可自我學(xué)習(xí)并形成“肌肉記憶”
普通對(duì)話 北斗三號(hào)衛(wèi)星低能離子能譜儀載荷研制成功
普通對(duì)話 為什么Wi-Fi6將成為未來(lái)物聯(lián)網(wǎng)的關(guān)鍵?
普通對(duì)話 馬斯克出現(xiàn)在推特總部 收購(gòu)應(yīng)該沒(méi)有懸念了
普通對(duì)話 臺(tái)積電澄清:未強(qiáng)迫員工休假或有任何無(wú)薪假
普通對(duì)話 新一代載人運(yùn)載火箭發(fā)動(dòng)機(jī)研制獲重大突破
推薦閱讀

聚焦场景化创新 华为擎云亮相中国联通合作伙伴大会

万里数据库GreatDB亮相上合组织数字经济论坛 与哈萨克斯坦人工智能发展协会签署合作协议

3个月迁移、存储成本直降87%!OceanBase助河北移动酬金业务驶入快车道

新紫光集团三周年:智变跃升,交出硬核答卷

亚信科技:助力马来西亚探寻人工智能“崛起时刻”

友商截单?去看苏超?车主是谁?……雷军回应一切,很全! | 次世代车研所

效率跃升300%?鸿蒙电脑定义AI时代商务办公新体验

闪存普惠,一步到位 | 华为商业市场极简全闪数据中心Pro+重磅发布

开源鸿蒙持续壮大 三大运营商全面入局 多元成果亮相HDC2025

数码视讯助力广东卫视、深圳卫视两个4K超高清频道开播
Copyright @ Cntxj.Net All Right Reserved 通信界 版權(quán)所有
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像