記者19日從字節(jié)跳動獲悉,豆包App視頻生成能力升級,支持Seedance1.5 Pro模型,可一鍵生成聲音和畫面相匹配的有聲視頻。
記者發(fā)現(xiàn),打開豆包App對話框,選擇“照片動起來”,上傳圖片并輸入提示詞,選擇“1.5 Pro”模型,已經(jīng)可以體驗到該功能。
據(jù)字節(jié)跳動Seed官網(wǎng)介紹,Seedance 1.5 Pro是其新一代音視頻創(chuàng)作模型,依托原生音視頻聯(lián)合架構(gòu)與精細(xì)化后訓(xùn)練,Seedance 1.5 pro 較好地實現(xiàn)了對多模態(tài)指令的遵循。
據(jù)悉,該模型可實現(xiàn)精準(zhǔn)音畫同步,實現(xiàn)較高的視聽一致性,且支持多種語言和地方方言口音,能夠捕捉其獨有的語音韻律與情感張力。
豆包Seedance1.5 Pro具有電影級運(yùn)鏡控制與動態(tài)張力,具備自發(fā)的鏡頭調(diào)度能力,也能實現(xiàn)電影級的畫面銜接與專業(yè)影調(diào),大幅提升了視頻的動態(tài)張力。
此外,語義理解與敘事協(xié)調(diào)性增強(qiáng),實現(xiàn)了對敘事語境的精準(zhǔn)解析。它顯著提升了音視頻段落的整體敘事協(xié)調(diào)性,為專業(yè)級內(nèi)容創(chuàng)作提供有力支撐。
Seedance 1.5 Pro 模型對視聽協(xié)同、動態(tài)調(diào)度和文化語境的精準(zhǔn)掌握,使其在影視創(chuàng)作、短劇生成、廣告生產(chǎn)及戲曲演繹等場景中,均展現(xiàn)出較好的敘事表現(xiàn)力與視聽融合度。
2025年6月,視頻生成模型Seedance1.0 Pro正式發(fā)布,支持文字與圖片輸入,可生成多鏡頭無縫切換的高品質(zhì)視頻,主體運(yùn)動穩(wěn)定性與畫面自然度較高。
同時,即夢AI也上新Seedance 1.5 pro,支持聲音、畫面同步生成。
具體來看,即夢AI網(wǎng)頁版官宣全面升級,打造一站式“AI片場”。本次更新涵蓋了核心模型能力、交互方式及創(chuàng)作流程等,旨在為用戶提供從靈感到成品的全流程創(chuàng)作支持,讓創(chuàng)意海報、專業(yè)視頻乃至AI漫劇、AI短片的制作變得更加高效便捷。
此次升級的核心亮點之一,是即夢AI最新視頻生成能力“視頻 3.5 Pro”。該模型基于字節(jié)自研模型Seedance 1.5 pro,在即夢AI全球首發(fā)上線。視頻 3.5 Pro 支持視頻與音頻同時生成,人物口型、樂器演奏、環(huán)境音效等元素?zé)o需再后期配音,大幅提升了視頻的真實感與沉浸感。該模型在遵循復(fù)雜指令方面表現(xiàn)優(yōu)異,能精準(zhǔn)響應(yīng)運(yùn)鏡調(diào)度、動作幅度及光影氛圍等要求,并對中文發(fā)音口型、面部微表情乃至多種方言生成提供了更強(qiáng)支持。
除了模型能力的提升,即夢AI網(wǎng)頁版還將迎來全新UI,升級畫布、agent等功能的交互方式。
字節(jié)跳動方面表示,本次全面升級標(biāo)志著即夢AI網(wǎng)頁版正致力于將復(fù)雜的AI創(chuàng)作工具整合為直觀、高效的一站式“AI片場”,通過打包從靈感、畫面、視頻到長鏡頭的全流程能力,助力創(chuàng)作者將每一個天馬行空的創(chuàng)意轉(zhuǎn)化為異彩紛呈的作品。