项目简介
VoiceCanvas 是一个先进的多语言语音合成平台,使用最新的 AI 技术提供高质量的文字转语音服务和语音克隆服务。
🌟 主要特点
多语言支持
-
支持超过 50+ 种语言
语音功能
-
-
多种语音服务集成: -
OpenAI TTS(高质量自然语音) -
AWS Polly(多语言支持) -
MiniMax(中文优化) -
高质量语音合成 -
男声/女声选择 -
语速调节 -
逐字朗读模式 -
实时音频预览 -
音频可视化 -
智能容错机制(自动切换备选服务)
语音克隆
-
个人声音克隆功能 -
上传音频样本创建个性化声音 -
克隆声音管理 -
克隆声音配额控制
文件处理
-
支持文本文件上传 -
音频文件下载 -
支持长文本处理
用户系统
-
用户注册和登录 -
第三方登录(Google、GitHub) -
多语言界面 -
深色/浅色主题切换
订阅系统
-
免费试用计划 -
按年/按月订阅 -
按量付费选项 -
字符配额管理 -
克隆声音配额管理
🛠️ 技术栈
- 前端框架
: Next.js 14 - UI 组件
: Tailwind CSS, shadcn/ui - 认证
: NextAuth.js - 数据库
: PostgreSQL (Neon) - ORM
: Prisma - 语音服务
: -
OpenAI TTS -
AWS Polly -
MiniMax - 并发控制
: 自定义速率限制 - 部署
: Vercel
📦 安装
-
克隆仓库
git clone https://github.com/ItusiAI/Open-VoiceCanvas.git
cd Open-VoiceCanvas
-
安装依赖
npm install
-
配置环境变量
# 创建 .env 文件并添加以下配置
# OpenAI
OPENAI_API_KEY="your_openai_api_key"
# AWS Polly
NEXT_PUBLIC_AWS_REGION="us-east-1"
NEXT_PUBLIC_AWS_ACCESS_KEY_ID="your_aws_access_key_id"
NEXT_PUBLIC_AWS_SECRET_ACCESS_KEY="your_aws_secret_access_key"
# MiniMax
MINIMAX_API_KEY="your_minimax_api_key"
MINIMAX_GROUP_ID="your_minimax_group_id"
# Database
DATABASE_URL="your_neon_db_url"
# Stripe
STRIPE_SECRET_KEY="your_stripe_secret_key"
NEXT_PUBLIC_STRIPE_PUBLISHABLE_KEY="your_stripe_publishable_key"
STRIPE_WEBHOOK_SECRET="your_stripe_webhook_secret"
# NextAuth 配置
NEXTAUTH_URL="http://localhost:3000"
NEXTAUTH_SECRET="your_nextauth_secret"
# OAuth 提供商配置
GITHUB_ID="your_github_client_id"
GITHUB_SECRET="your_github_client_secret"
GOOGLE_ID="your_google_client_id"
GOOGLE_SECRET="your_google_client_secret"
-
运行数据库迁移
npx prisma migrate dev
-
启动开发服务器
npm run dev
🔑 环境变量
|
|
|
---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
📝 数据库模型
用户 (users)
-
基本信息:邮箱、密码、名称、头像 -
认证信息:提供商、提供商 ID -
使用统计:总字符使用量、最后使用时间 -
偏好设置:语言、时区
订阅 (Subscription)
-
计划类型 -
开始和结束日期 -
状态
字符配额 (CharacterQuota)
-
永久配额 -
临时配额 -
已使用字符数 -
配额过期时间
克隆声音 (ClonedVoice)
-
声音ID -
用户ID -
名称 -
创建时间
🔊 支持的语音服务
OpenAI TTS
-
高质量自然语音 -
支持多种声音:alloy, echo, fable, onyx, nova, shimmer, ash, coral, ballad, sage -
语速调节 -
自动容错(失败时切换到AWS Polly)
AWS Polly
-
多语言支持 -
多种声音选择 -
语速调节
MiniMax
-
中文优化 -
语音克隆功能 -
多语言支持 -
语速调节
项目链接
https://github.com/ItusiAI/Open-VoiceCanvas
扫码加入技术交流群,备注「开发语言-城市-昵称」
(文:GitHubStore)