搜尋

MuseTalkV3MuseTalk

返回清單
切換到指定樓層
通知這文章過時或找檔案 發表主題

[影片工具] 《MuseTalk V3》AI數位人脣形同步工具 免費下載與完整使用教學

[複製連結]
1
冰紅茶 ( Lv.20 天使 ) 發表於 5 天前 | 只看該作者 |只看大圖 回覆獎勵 |降序瀏覽 |閱讀模式
版本:V3
更新日期:2024年05月29日

MuseTalk V3 深度整理:打造專屬AI數位人



您是否曾夢想讓照片開口說話、或讓您的虛擬角色擁有生動的脣形同步?由騰訊團隊精心開發的AI數位人脣形同步工具 MuseTalk,正是實現這些創意的強大幫手!它能根據您輸入的音訊,自動且精準地調整虛擬人物的嘴部動作,讓聲音與口型完美匹配,告別數位人僵硬的表情。無論您是自媒體創作者、虛擬主播,或是想為影片增添趣味,MuseTalk 都能讓您的內容更上一層樓!

只需要簡單上傳一段驅動音訊,以及一段人物影片,MuseTalk 就能一鍵生成無限多的說話影片。這對於各種自媒體口播、直播內容,甚至是教學與娛樂影片,都提供了前所未有的便利性與彈性。

174722mko2ll2l4rzvmlom.jpg



👉 GM後台版 遊戲 推薦 ⬇️⬇️⬇️ 快速玩各種二次元動漫手遊app



硬體需求與版本亮點



想流暢運行 MuseTalk,建議您的電腦配備 NVIDIA GeForce RTX 顯示卡。最低要求為 4GB 顯示記憶體 的 NVIDIA GeForce RTX 3050 Ti 筆記型 GPU。在 fp16 模式下,即便這樣配置,生成一段 8 秒的影片大約也需要 5 分鐘。為了確保生成速度與效率,強烈建議您的顯示記憶體至少有 8GB,且系統基於 CUDA 11.8 環境。

這次分享的 MuseTalk V3 整合包,內建了官方最新釋出的 MuseTalk V1.5 版本模型。相較於舊版 1.0 模型,這個新模型在影片的清晰度、人物身份一致性以及最核心的脣音同步精確度上,都有了顯著的提升。這意味著您能製作出更自然、更逼真的數位人影片。

174722huiuru03yrioxgf5.jpg



MuseTalk V3 應用領域與功能展示



MuseTalk 的應用場景十分廣泛,能為您的數位內容創作帶來革命性的改變:

短影片製作:想為動漫角色或真人影片換配音,卻不想重新拍攝?MuseTalk 讓您輕鬆實現,讓角色嘴型自然對應新語音。
虛擬主播:讓您的 AI 虛擬主播擁有更自然的嘴部動作,提升觀眾的沉浸感與觀看體驗。
外語教學:透過數位人清晰展示標準發音口型,讓學習者更直觀地理解發音要領。
社交娛樂:將您或朋友的照片變成會唱歌說話的趣味影片,輕鬆製作搞笑內容分享給社羣。

174722u6l8wsl02dxasdua.jpg


MuseTalk V3 完整使用教學與批量處理密技



以下是 MuseTalk V3 一鍵整合包的詳細使用步驟,請務必按照順序操作,以免發生錯誤:

啟動軟體:解壓縮您下載的 MuseTalk V3 整合包。
準備素材:- 上傳您要驅動數位人說話的音訊檔案
- 上傳作為人物主體的參考影片

參數設定:軟體介面中會有詳細的參數說明,您可以根據需求進行調整。
測試預覽:建議您先點選「測試重繪」,預覽生成效果。
微調生成:根據預覽結果,再次調整參數,直到滿意為止,最後再點選「生成」即可。

174722fx7ekvvfvfrgo7dx.jpg


批量生成說明



如果您需要大量生成影片,MuseTalk 也提供了便捷的批量處理功能:

開啟設定檔:解壓縮一鍵包後,依序進入
  1. configs\inference
複製代碼
資料夾。
編輯批次檔案:用記事本或其他文字編輯器開啟
  1. batch.yaml
複製代碼
這個檔案。
配置任務:您會看到類似以下的範例代碼:
  1. yaml
  2.     task_0:
  3.       video_path: "data/video/1.mp4"
  4.       audio_path: "data/audio/1.wav"
  5.       bbox_shift: -7
  6.     task_1:
  7.       video_path: "data/video/2.mp4"
  8.       audio_path: "data/audio/2.wav"
  9.       bbox_shift: -7
  10.    
複製代碼
- 一個
  1. task
複製代碼
區塊對應一個影片生成任務。您可以依此類推,增加更多的
  1. task
複製代碼
區塊。
- 將所有要處理的影片和音訊素材放到指定目錄中,例如將影片放在
  1. data
複製代碼
下的
  1. video
複製代碼
資料夾,音訊放在
  1. data
複製代碼
下的
  1. audio
複製代碼
資料夾。
檔案命名注意:請確保影片檔名(
  1. video_path
複製代碼
)和音訊檔名(
  1. audio_path
複製代碼
)相互對應,且沒有搞錯。
  1. bbox_shift
複製代碼
參數:這是用來控制數位人嘴巴張開幅度的,您可以根據需求調整數值。

保存與啟動:配置完成後,儲存
  1. batch.yaml
複製代碼
檔案。接著,透過一鍵整合包的啟動程式,就能啟用批量處理功能,等待程式自動完成所有任務。

重要提醒:如果您的顯示記憶體(顯存)低於 8GB,請不要使用批量生成功能,這很容易導致顯示記憶體溢出,造成程式錯誤或當機。

下載鏈接


Free Download: MuseTalk V3 AI數位人脣形同步工具 下載

下載鏈接







大家正在看啥


收藏收藏 分享文章到FB上分享
回覆 使用道具 檢舉
複製專屬你的推廣連結:發至FB與各論壇宣傳:累積點數換GP商品 & 藍鑽
每五點閱率就可以兌換藍鑽積分或遊戲點卡 夢遊推廣文章換GP商品

你需要登入後才可以回覆 登入 | 加入會員

本版積分規則

Copyright (C) 2010-2020 夢遊電玩論壇

廣告合作:請直接聯繫我們,並附上您預刊登位置的預算。  

快速回覆 返回頂端 返回清單