伴隨人工智能技術(shù)的迭代發(fā)展,AI文生視頻模型出現(xiàn),可以根據(jù)文字描述就能生成視頻?!度嵌眩何磥?lái)啟示錄》《山海奇鏡之劈波斬浪》《英雄》等作品將這種AI視頻生成技術(shù)應(yīng)用于籌拍、預(yù)演、實(shí)拍、后期等環(huán)節(jié),深刻改變了影視創(chuàng)作的生產(chǎn)模式。不過(guò),業(yè)界在積極嘗試使用新技術(shù)打造數(shù)智影視內(nèi)容、發(fā)展數(shù)智影視產(chǎn)業(yè)的同時(shí),也應(yīng)深入了解AI視頻生成技術(shù)可能給影視業(yè)發(fā)展帶來(lái)的風(fēng)險(xiǎn)和挑戰(zhàn)。
近來(lái),很多創(chuàng)作者反映,在利用AI生成與中國(guó)歷史現(xiàn)實(shí)相關(guān)的視頻內(nèi)容時(shí),經(jīng)常會(huì)鬧出笑話。例如,他們輸入指令,讓AI生成一段以中國(guó)某大學(xué)校園作為場(chǎng)景的視頻,視頻場(chǎng)景里出現(xiàn)的學(xué)生都是外國(guó)人的面孔;輸入指令讓AI生成一條中國(guó)街道的視頻,視頻中街道兩邊招牌上的文字卻不是漢字,而是一些奇怪的符號(hào),如同“天書(shū)”一般。如果說(shuō)AI文生視頻模型在生成中國(guó)現(xiàn)實(shí)題材的視頻時(shí)出現(xiàn)的錯(cuò)誤顯而易見(jiàn)、容易識(shí)別和糾正,那么它在生成中國(guó)歷史文化題材的視頻時(shí),則更容易出現(xiàn)一些隱秘、不容易識(shí)別的錯(cuò)誤。比如,讓AI生成一段講述中國(guó)古代故事的視頻,我們得到的內(nèi)容里很可能會(huì)出現(xiàn)其他國(guó)家的古代景觀,傳統(tǒng)服飾、帽冠、紋樣設(shè)計(jì)等。如果創(chuàng)作者相關(guān)的知識(shí)儲(chǔ)備不足,則很難看出其中的問(wèn)題。
目前這類AI生成視頻經(jīng)常出現(xiàn)的低級(jí)錯(cuò)誤,實(shí)際上與其生成邏輯及訓(xùn)練數(shù)據(jù)的局限性密切相關(guān)。AI文生視頻模型依托計(jì)算機(jī)深度學(xué)習(xí),通過(guò)學(xué)習(xí)數(shù)據(jù)庫(kù)中已有的及用戶投喂的圖像和視頻資源,結(jié)合用戶輸入的文字描述,生成新的視頻內(nèi)容。所以,訓(xùn)練模型的質(zhì)量和多樣性直接影響生成內(nèi)容的準(zhǔn)確性和文化適配性。當(dāng)前大量的AI文生視頻模型在國(guó)內(nèi)的訓(xùn)練數(shù)據(jù)中,反映中國(guó)文化特征的視頻素材較為匱乏。所以,在生成涉及中國(guó)文化的內(nèi)容時(shí),可能出現(xiàn)失真或錯(cuò)誤。例如,當(dāng)用戶輸入指令要求AI生成反映古詩(shī)《琵琶行》意境的視頻時(shí),生成結(jié)果可能出現(xiàn)古人手抱吉他而非琵琶的場(chǎng)景。這種錯(cuò)誤往往是因?yàn)锳I缺乏對(duì)琵琶形象的深度訓(xùn)練,從而在內(nèi)容生成時(shí)胡亂組合數(shù)據(jù)庫(kù)中不相關(guān)的素材所致。如果類似錯(cuò)誤的視頻內(nèi)容大量涌現(xiàn),不僅會(huì)影響作品的藝術(shù)性與文化價(jià)值,還可能對(duì)觀眾,尤其是青少年群體造成誤導(dǎo)。這反映了AI視頻生成技術(shù)在文化適配方面的不足,需要行業(yè)進(jìn)一步優(yōu)化訓(xùn)練數(shù)據(jù)。
因此,要應(yīng)對(duì)AI視頻生成技術(shù)生成與中國(guó)歷史現(xiàn)實(shí)相關(guān)的視頻內(nèi)容時(shí)容易出現(xiàn)失真、錯(cuò)誤等問(wèn)題,需要構(gòu)建信息準(zhǔn)確、考據(jù)翔實(shí)、能反映中國(guó)文化的數(shù)據(jù)庫(kù)。其中應(yīng)包括經(jīng)過(guò)專業(yè)機(jī)構(gòu)審核和認(rèn)證,反映中國(guó)歷史與現(xiàn)實(shí)的圖像、視頻等資源,用以訓(xùn)練AI文生視頻模型,從而確保中國(guó)數(shù)智影視內(nèi)容生產(chǎn)的真實(shí)性與高品質(zhì)。
然而,優(yōu)質(zhì)的數(shù)據(jù)庫(kù)建設(shè)并非一蹴而就,而是需要政府部門(mén)、相關(guān)高校及科研機(jī)構(gòu)、影視生產(chǎn)機(jī)構(gòu)等各界通力合作。首先,政府部門(mén)應(yīng)發(fā)揮主導(dǎo)作用,搭建圖像、視頻資源的確權(quán)、傳播與推廣平臺(tái),支持集合中國(guó)文化圖像、視頻資源的數(shù)據(jù)庫(kù)建設(shè),鼓勵(lì)各界共創(chuàng)、共享,探索數(shù)智影視內(nèi)容創(chuàng)作生產(chǎn)的長(zhǎng)效模式。其次,相關(guān)高校與科研機(jī)構(gòu)需要發(fā)揮科研轉(zhuǎn)化能力,深入挖掘中華文化的歷史源流、性質(zhì)特征、美學(xué)特色、文化內(nèi)涵,系統(tǒng)梳理中華文脈及特色景觀、城市、建筑、文物、人物等相關(guān)要素,為已有圖像、視頻資源的考據(jù)和新資源的開(kāi)發(fā)提供深厚的理論支撐。再次,影視生產(chǎn)機(jī)構(gòu)應(yīng)在推進(jìn)反映中國(guó)文化的數(shù)據(jù)庫(kù)建設(shè)過(guò)程中,將前沿?cái)?shù)字技術(shù)與歷史資源、文化資源、藝術(shù)資源等有機(jī)結(jié)合,助力中華優(yōu)秀傳統(tǒng)文化IP的創(chuàng)意開(kāi)發(fā),提高基于中華優(yōu)秀傳統(tǒng)文化IP的數(shù)智影視內(nèi)容品牌的傳播力與影響力。
總之,在人工智能時(shí)代,中國(guó)數(shù)智影視產(chǎn)業(yè)大有可為,而高質(zhì)量的反映中國(guó)文化的數(shù)據(jù)庫(kù)則是數(shù)智影視產(chǎn)業(yè)的關(guān)鍵“基礎(chǔ)設(shè)施”。因此,我們應(yīng)當(dāng)重視反映中國(guó)文化的數(shù)據(jù)庫(kù)建設(shè),并將其運(yùn)用到AI文生視頻模型訓(xùn)練中。在此基礎(chǔ)上,通過(guò)深度融合技術(shù)與文化創(chuàng)意,我們可以創(chuàng)作出更多高品質(zhì)的數(shù)智影視內(nèi)容,形成富有中國(guó)特色的數(shù)智美學(xué)范式,從而助力中國(guó)數(shù)智影視產(chǎn)業(yè)行穩(wěn)致遠(yuǎn)。
(作者:周 雯,系北京師范大學(xué)藝術(shù)與傳媒學(xué)院數(shù)字媒體系主任、教授)