type
status
date
slug
summary
tags
category
password
Date
Free
Free
Link
xhsContent
Price
xhsTitle
🌈 I feel
icon

🎨 特点:OmniTalker是阿里巴巴集团旗下Tongyi实验室提出的一个统一框架,能够从文本同时生成语音和仿真头像视频,解决了现有方法中的冗余计算、错误累积和音视频风格不匹配的问题。该框架采用双分支扩散变换器架构,实现了实时零样本场景下同步生成语音和头像视频,同时保留语音风格和面部风格。OmniTalker能够以25 FPS的实时推理速度,生成质量优越、风格保持良好且音视频同步的结果。
🔗 体验地址: https://humanaigc.github.io/omnitalker/
- Author:AGILab
- URL:http://agilab.top/article/1cfb5a16-2acd-8113-bba7-d54052840246
- Copyright:All articles in this blog, except for special statements, adopt BY-NC-SA agreement. Please indicate the source!