Sora—人工智能的里程碑

[日期:2024-10-17] 作者:信息技術 次瀏覽 [字體: ]

2025屆15班 羅天瑞   指導教師:付秀軍

圖片3.png

       “AI”一詞,從去年到現(xiàn)在都十分火熱。由最早的小愛同學等一批AI,再到如今的Chat GPT,人們對于AI的了解在一步一步前進;從簡單的發(fā)送命令,再到現(xiàn)在的可以聊天,繪畫,扮演等,AI的功能也在一步一步增加。

       不久前,世界第八屆渲染大賽開始,主題為“無盡階梯”,各路大神都帶著自己的力作參與其中,但有可能的是,這是最后一屆審核較為輕松的了。因為在2024年初,OpenAI發(fā)布了新型人工智能“Sora”,Sora可以根據(jù)用戶提供的圖片,生成出延續(xù)其風格和主題的視頻,或者在原有視頻的基礎上,添加或刪除一些元素,創(chuàng)造出新的效果。

       那為什么Sora比GPT的關注度更高呢?   

       首先大家可能都見過GPT等AI的繪畫吧。雖比人工繪畫更高效,更便捷,但問題就在于它的不協(xié)調(diào)??赡墚嬕恢皇郑嫵?個手指頭,可能人背對屏幕看電視。但Sora不同,Sora能夠模擬出物體和角色在三維空間中的運動和交互,即使它們被遮擋,也可以保持一致性,同時還能夠模擬出物理交互的反饋,比如畫家在畫紙上的筆觸,或者球員在球場上的動作,讓視頻看起來更加真實自然。

       在寒假,抖音、快手上熱火的《洗澡歌》是由通義千問所合成的,但是十分短暫。Sora卻達到了新高度,它能夠生成長達60秒的視頻,這在目前的人工智能領域是前所未有的。以往的文生視頻大模型,如Pika、RunwayML等,最多只能生成20秒的視頻,而且畫質(zhì)和內(nèi)容都不盡人意。Sora則突破了這一限制,不僅能夠生成長視頻,而且能夠包含多角色和多角度的鏡頭,讓視頻更加豐富多彩。

       Sora還有驚人的一點,那就是它的參數(shù)量。

       參數(shù)量是衡量一個模型復雜度的指標,一般來說,參數(shù)量越大,模型越復雜,能力越強,但也越耗費算力。Sora的為30億,但是對比萬億級別Gemini,顯然并不算多。不過雖然數(shù)值上沒有那么強勢,Sora在視頻上的生產(chǎn)力卻遠超Gemini,說明什么?說明Sora的模型十分高效,能在有限的參數(shù)下,實現(xiàn)它強大的功能。

       Sora的誕生,無疑是AI的里程碑,不過一個事物的誕生,往往也伴隨著質(zhì)疑。

       Sora生產(chǎn)的視頻,質(zhì)量往往會隨時間推移得到更好的提升,等真到了以假亂真的時候,視頻、影視等相關行業(yè)將大概率消失,此前因為類似的原因就發(fā)生過2023年好萊塢演員大部分罷工的事件了。

       對于AI,人們的質(zhì)疑從未停過 霍金曾經(jīng)說人類應停止對AI的研究,對于Sora的誕生,特斯拉創(chuàng)始人馬斯克也發(fā)出了“gg humans”!

       但是360的創(chuàng)始人周鴻祎卻又是這樣評價的:

       “年前我在風云演講上分享了十大模型預測,沒想到年還沒過完,就驗證了好幾個,從Gemini,英偉達的Chat with RTX到OpenAI的Sora,大家都覺得很炸裂。朋友問我怎么看Sora,總體來說就是我認為AGI(人工通用智能)很快就會實現(xiàn),就這幾年的事了。”

       作為一名對計算機科學知識高度感興趣的中學生,我對于Sora以及AI的認知是這樣的:

       對于GPT、Sora的泛用性會更高。Gpt在平時,可能就只是聊天的一個同伴,在我們學習和大人的工作上很少起作用,而在視頻創(chuàng)作領域Sora出現(xiàn)的頻率則明顯會更高。雖然Sora創(chuàng)造的視頻也并不是有多么精美,多么讓人感嘆,但它最大的優(yōu)勢就是創(chuàng)作的視頻能完全符合你對現(xiàn)實生活的認知,在某種情況下甚至可以讓人認為是真人拿手機拍的。就比如說電影,是人們消遣娛樂的一種方式,其中部分鏡頭會涉及到大量的群眾演員,尋找合適的人群是個難題。從今往后有群演的地方就可以使用Sora了,大量節(jié)省了人力和財力。相信《科幻世界》三月刊《永恒之境》中所描述的那種情況可能很快就會到來。

       但也正因如此,以后我們對AI生產(chǎn)的視頻、照片等媒體需要更加細心,壞人也可能會使用Sora進行敲詐、勒索,我們需提高“媒介素養(yǎng)”。

       AI的前景擁有著許多不確定的因素,我們對于它們的應用也應該有所限制。大多數(shù)人提起所謂的“機器人三大定律”卻不知道它最早源自科幻小說,AI給我們生活提供了極大的便利性,人工與AI合作,并且不過度依賴的情況下,相信我們的生活會愈加美好。