※ 引述《Satoman (沙陀曼)》之銘言
: 然後你用TTS去生成語音本身也很難生色色的語音
: 就算生出來了也因為上述問題對不上嘴
: 那不如用素材比較快 ==
→ Satoman : 我看開源的你沒辦法錄製別人的聲音然後調語氣
voxcpm可以,工作流:
https://github.com/Saganaki22/ComfyUI-VoxCPM2
或是用python官方節點也可以
預設就有複製+調整的範例了
我自己試過給asmr腳本讓v唸
聲線完美,但語氣還是只有七成符合
不知道其他情境怎麼樣
https://github.com/flybirdxx/ComfyUI-Qwen-TTS
qwen3tts的複製就沒辦法很精細的調整
這個比較適合原創聲線,官方範例是ㄌㄌ
https://i.meee.com.tw/Bemk2Ru.png
0.0