Re: [閒聊] 皇城還在吵AI喔

作者: Satoman (沙陀曼)   2026-04-20 14:37:19
※ 引述 《jeffreyseh (jeffreyseh)》 之銘言:
: 純畫面的話現在開源的能做的還OK了
:  
: 但是配音跟音效都超奇怪
:  
: 有沒有董哥說一下一兩年內有機會ㄇ
:  
: 太晚我ㄐㄐ可能跟不上了
配音主要是兩個問題
目前主流的對嘴的模型fantasytalking
就是那個拿來生水管垃圾詐騙影片的東西,沒辦法和色色小影片結合
或者說效果很差
然後開源的能生聲音的影片模型LTx語音很假
然後你用TTS去生成語音本身也很難生色色的語音
就算生出來了也因為上述問題對不上嘴
那不如用素材比較快 ==
作者: amsmsk (449)   2026-04-20 14:40:00
聲音感覺直接請人配比較便宜省市
作者: ZooseWu (N5)   2026-04-20 14:40:00
有沒有推薦的 voice clone 阿,指定聲音+指定文本
作者: jeffreyseh (jeffreyseh)   2026-04-20 14:41:00
seedance配音效果就很好 開閉源現在差距還是太大了嗎
作者: h0103661 (路人喵)   2026-04-20 14:41:00
有,qwen3tts,自然語言指定聲調超神
作者: Satoman (沙陀曼)   2026-04-20 14:42:00
Qwen3-TTS拿去幹什麼怪事被抓自己負責 ==
作者: Wardyal (Wardyal)   2026-04-20 14:43:00
感覺那種小黃油嘴對不上也沒差吧 反正都是靜圖
作者: Satoman (沙陀曼)   2026-04-20 14:43:00
目前的TTS要讓他講色的還是有點卡我是發現語尾加個愛心符號有一點點幫助,但是不多
作者: ZooseWu (N5)   2026-04-20 14:45:00
沒辦法指定情境或語氣嗎?我同事之前推薦我voxCPM2 不過我懶得準備素材所以還沒試
作者: h0103661 (路人喵)   2026-04-20 14:48:00
兩款都能指定,qwen3能塞整個劇本進去生成,情境比voxcpm好很多
作者: Satoman (沙陀曼)   2026-04-20 14:48:00
我看開源的你沒辦法錄製別人的聲音然後調語氣大概是阿里巴巴知道有人會拿著去弄色的或詐騙但是現在複製能力就很危險了,詐騙集團越過越爽 ==

Links booklink

Contact Us: admin [ a t ] ucptt.com