pip
3.1K Star!超酷的STT语音转文字神器!支持实时转录、唤醒词激活!
RealtimeSTT是一款开源工具,专注于实时将语音转录为文字。它提供智能体验如语音活动检测和唤醒词激活功能,简化录音控制,并支持多种用法场景。
将PDF文档转换为Markdown的智能工具Vision Parse
使用最先进的视觉语言模型将 PDF 文档解析为格式精美的 Markdown 内容。支持多种 Vision LLM 模型,并提供本地模型托管功能。
AISuite:一个新的开源 Python 库,提供了统一的跨 LLM API
吴恩达宣布Aisuite目标是提供一个类似OpenAI的API来简化使用多个LLM的过程,只需更改一个字符串即可选择所需的LLM提供程序。该库支持多种LLM提供商,并要求开发人员拥有相应的API密钥。