供MacOS使用的 Qwen3 TTS GUI

项目地址:https://github.com/Da1sypetals/ttsui-mac

一个用于 MacOS 的 AI 语音合成(Text-to-Speech)桌面应用,基于阿里通义的 Qwen3-TTS 模型,提供三种不同的语音合成方式:

1. Clone(声音克隆)

  • 上传音频:拖放参考音频文件,或直接录音
  • 保存说话人:将常用的声音保存为"说话人",方便重复使用
  • 输入文字:输入任意文字,AI 会用参考音频的声音朗读出来

2. Control(控制模式)

  • 预设声音:选择内置的中文或英文预设声音
  • 情绪控制:通过文字描述来控制情绪,例如"非常开心兴奋"、“平静舒缓”、“专业正式"等
  • 输入文字:生成带有指定情绪的语音

3. Design(声音设计)

  • 自由创造:通过文字描述来设计一个全新的声音
  • 描述示例:如"一个活泼的年轻女声,音调高昂”、“一个深沉、冷静的男声,专业干练”、“一个温暖慈祥的奶奶声音"等
  • 输入文字:生成自定义声音朗读的语音

其他功能

  • 音频播放:内置播放器预览生成的语音
  • 保存导出:将生成的语音保存为音频文件
  • 说话人管理:保存、重命名、删除常用的克隆声音