type
status
date
slug
summary
tags
category
password
Date
Free
Free
Link
xhsContent
Price
xhsTitle
🌈 I feel
icon

🎨 特点:F5-TTS 是一种基于Diffusion Transformer和ConvNeXt V2的语音合成技术,它能够更快地进行训练和推理。E2 TTS使用Flat-UNet Transformer实现了接近原论文的再现。Sway Sampling是一种推理时的流步采样策略,能显著提升性能。该项目支持通过Hugging Face、Model Scope、Wisemodel等平台获取基础模型,并提供了Gradio App和CLI两种推理方式,同时还包括训练和评估的相关说明。
🔗 体验地址: https://github.com/SWivid/F5-TTS
- Author:AGILab
- URL:http://agilab.top/article/12fb5a16-2acd-8174-a25b-cc520e45d851
- Copyright:All articles in this blog, except for special statements, adopt BY-NC-SA agreement. Please indicate the source!