🎤多模态之最强中文TTS

type
status
date
slug
summary
tags
category
icon
password
🐏
一款为对话场景设计的文本转语音模型:ChatTTS
比如完成LLM助手对话任务,支持中英文,韵律细腻
 
亮点:
1、对话式 TTS
: ChatTTS针对对话式任务进行了优化,实现了自然流畅的语音合成,同时支持多说话人
2、细粒度控制
: 该模型能够预测和控制细粒度的韵律特征,包括笑声、停顿和插入词等
3、更好的韵律
: ChatTTS在韵律方面超越了大部分开源TTS模型,同时提供预训练模型 github:
模型:
最大的模型使用了10万小时以上的中英文数据进行训练的 目前在HuggingFace开源的版本为4万小时训练且未SFT的版本
 

API Server 和 WebUI:ChatTTS-Forge

基于ChatTTS 开发的项目:ChatTTS-Forge,实现了 API Server 和 基于 Gradio 的 WebUI
全面的 API 服务,支持超长文本生成、风格管理、说话人管理、风格提示词注入、批量生成、类 SSML 支持、独立的 refine API、OpenAI 和 Google 风格 API、友好调试 GUI、文本标准化和音质增强等 支持 Speaker 导入导出及融合 github:
notion image
Loading...

No results found.