豬豆網(wǎng)全新上線啦！每日更新有價(jià)值的內(nèi)容，歡迎收藏分享本網(wǎng)站。

AniTalker：開源照片+音頻視頻生成器

220次閱讀

AniTalker，這是一個(gè)創(chuàng)新框架，旨在從單個(gè)肖像中生成栩栩如生的說(shuō)話面孔?，F(xiàn)有模型主要關(guān)注唇形同步等語(yǔ)言線索，無(wú)法捕捉面部表情和非語(yǔ)言線索的復(fù)雜動(dòng)態(tài)，與此不同的是，AniTalker 采用了通用的運(yùn)動(dòng)表示。這種創(chuàng)新的表現(xiàn)方式有效地捕捉了廣泛的面部動(dòng)態(tài)，包括微妙的表情和頭部運(yùn)動(dòng)。

AniTalker 通過(guò)兩種自監(jiān)督學(xué)習(xí)策略增強(qiáng)運(yùn)動(dòng)描繪：第一種涉及從同一身份內(nèi)的源幀重建目標(biāo)視頻幀以學(xué)習(xí)微妙的運(yùn)動(dòng)表示，第二種使用度量學(xué)習(xí)開發(fā)身份編碼器，同時(shí)主動(dòng)最小化身份之間的互信息和運(yùn)動(dòng)編碼器。這種方法確保運(yùn)動(dòng)表示是動(dòng)態(tài)的并且沒(méi)有特定于身份的細(xì)節(jié)，從而顯著減少對(duì)標(biāo)記數(shù)據(jù)的需求。此外，擴(kuò)散模型與方差適配器的集成允許生成多樣化且可控的面部動(dòng)畫。

這種方法不僅展示了 AniTalker 創(chuàng)建詳細(xì)且真實(shí)的面部動(dòng)作的能力，而且還強(qiáng)調(diào)了其在為現(xiàn)實(shí)世界應(yīng)用制作動(dòng)態(tài)頭像方面的潛力。

開源地址：https://github.com/X-LANCE/AniTalker

正文完

AniTalker

發(fā)表至：值得一看開源項(xiàng)目

2024-05-14

0

版權(quán)聲明：本站原創(chuàng)文章，由老馬于2024-05-14發(fā)表，共計(jì)414字。

轉(zhuǎn)載說(shuō)明：本站提供的一切軟件、教程、電子書、視頻、圖片、音樂(lè)、文字以及所有內(nèi)容信息僅供個(gè)人學(xué)習(xí)、研究或欣賞；不得將上述內(nèi)容用于商業(yè)或者非法用途，否則，一切后果請(qǐng)用戶自負(fù)。本站信息來(lái)自網(wǎng)友分享及網(wǎng)絡(luò)收集整理，版權(quán)爭(zhēng)議與本站無(wú)關(guān)。您必須在下載后的24個(gè)小時(shí)之內(nèi)，從您的電腦或手機(jī)中徹底刪除上述內(nèi)容。如果您喜歡相關(guān)內(nèi)容信息，請(qǐng)支持正版，進(jìn)行購(gòu)買注冊(cè)，以得到更好的正版服務(wù)。我們非常重視版權(quán)問(wèn)題，如有侵權(quán)請(qǐng)郵件與我們聯(lián)系處理。敬請(qǐng)諒解！侵刪請(qǐng)致信E-mail：tntwl@qq.com

so-novel：開源交互式小說(shuō)下載器

BeArt AI：一款免費(fèi)且無(wú)水印的的在線換臉網(wǎng)站

Blossom：自托管云端雙鏈開源筆記軟件項(xiàng)目

Let’s Build AI：一個(gè)在線實(shí)用AI導(dǎo)航網(wǎng)站

iPA商店：免費(fèi)優(yōu)質(zhì)的蘋果iPA軟件資源下載網(wǎng)站

YY范文網(wǎng)：專業(yè)的簡(jiǎn)歷模板下載網(wǎng)站

Suno AI：可定制化歌詞的AI音樂(lè)創(chuàng)作工具

3MinTop：3分鐘AI讀書人工智能AI讀書工具

毛巾臟別用肥皂洗，教你一個(gè)妙招，多臟多舊的毛巾洗完跟新的一樣