🤖OmniTalker:实时文本驱动的仿真头像生成
00 min
2025-4-8
2025-5-9
type
status
date
slug
summary
tags
category
password
Date
Free
Free
Link
xhsContent
Price
xhsTitle
🌈 I feel
icon
notion image
🎨 特点:OmniTalker是阿里巴巴集团旗下Tongyi实验室提出的一个统一框架,能够从文本同时生成语音和仿真头像视频,解决了现有方法中的冗余计算、错误累积和音视频风格不匹配的问题。该框架采用双分支扩散变换器架构,实现了实时零样本场景下同步生成语音和头像视频,同时保留语音风格和面部风格。OmniTalker能够以25 FPS的实时推理速度,生成质量优越、风格保持良好且音视频同步的结果。 🔗 体验地址: https://humanaigc.github.io/omnitalker/