关注我,记得标星⭐️不迷路哦~
✨ 1: Orpheus TTS
Orpheus TTS是基于Llama-3b的开源TTS系统,具备语音克隆、情感控制和低延迟等能力。它超越了 ElevenLabs 和 OpenAI 等开源和闭源模型的能力!
Orpheus TTS 是一个基于 Llama-3b 的开源文本转语音 (TTS) 系统。它旨在利用大型语言模型 (LLM) 的能力进行语音合成,并拥有以下主要特性:
- 类人语音:
能够生成自然流畅、富有情感和韵律的语音,甚至超越了某些闭源的领先模型。 - 零样本语音克隆:
无需预先微调即可克隆语音。 - 情感和语调引导:
可以通过简单的标签控制语音的情感和语调特征。 - 低延迟:
具有约 200 毫秒的流式传输延迟,适合实时应用,通过输入流式传输可进一步降低到约 100 毫秒。
地址:https://github.com/canopyai/Orpheus-TTS
✨ 2: CrackCode
CrackCode是一款隐蔽的AI面试助手,可在后台无痕辅助编程解题,提供实时代码建议。
CrackCode 是一款在技术面试中提供编码问题实时 AI 辅助的工具。它最大的特点是完全隐蔽,能够100%绕过所有屏幕录制和监控软件的检测。可以理解为面试时偷偷运行的AI编码助手。
地址:https://github.com/AryanChopraa/crack-coder
✨ 3: Claude Code but with OpenAI Models
这个项目是一个代理服务器,使用户能用OpenAI模型(如GPT-4o)来运行Claude Code。

Claude Code but with OpenAI Models
是一个代理服务器,它允许你使用 Anthropic 的 Claude Code 工具,但实际上底层使用的是 OpenAI 的模型,例如 GPT-4o 和 gpt-4o-mini。简单来说,它就像一个翻译器,将 Claude Code 发出的请求转换为 OpenAI 模型可以理解的格式,并将 OpenAI 的回复转换回 Claude Code 可以理解的格式。这样,你就可以利用 Claude Code 的界面和功能,同时享受到 OpenAI 模型的强大能力。
地址:https://github.com/1rgs/claude-code-openai
✨ 4: Local Whisper
Local Whisper使用FastRTC和本地Whisper模型,实现快速实时的语音转录功能。

Local Whisper 是一个使用 FastRTC 和本地 Whisper 模型(或其他 ASR 模型)进行实时语音转录的项目。它允许用户在本地运行语音识别,无需依赖云服务。
地址:https://github.com/sofi444/realtime-transcription-fastrtc
✨ 5: YT Navigator
YT Navigator 是一个AI驱动的YouTube频道内容搜索工具,可高效地搜索、聊天和定位视频内容。

YT Navigator 是一个 AI 驱动的应用,旨在帮助用户高效地浏览和搜索 YouTube 频道内容。它利用自然语言查询,用户无需手动观看大量视频,即可快速找到所需信息,并能与频道内容进行对话,获得基于视频文本的答案,并能精确定位视频中的相关片段。该工具非常适合研究人员、学生、内容创作者以及任何需要从 YouTube 频道快速提取信息的人。
- 频道内容检索:
通过 YouTube 频道 URL 扫描并处理视频,提取元数据和文本,并进行向量化存储。 - 语义搜索:
使用自然语言查询,通过语义搜索和关键词搜索结合的方式,找到频道内相关的视频片段。 - 聊天互动:
与 AI 代理进行对话,获取频道内容的解答,AI 基于已扫描的视频文本提供回答。
地址:https://github.com/wassim249/YT-Navigator
(文:每日AI新工具)