开源归档 - 第140页共145页

DeepSeek-VL2开源MoE 视觉语言模型家族，Gemini英语口语助手，将 PDF 文档转换为互动式思维导图

上午10时 2024/12/16 作者每日AI新工具

本文介绍了DeepSeek-VL2、Leffa、小红书笔记生成器、Gemini 英语口语助手和PDF Mind Map Maker等创新技术与应用。它们涵盖多模态视觉-语言模型、可控人物图像生成框架、笔记生成工具及AI英语口语辅助等多个领域，提供高效便捷的功能以提升用户在不同场景下的工作效率和体验质量。

一键将视频转换为优质小红书笔记！

上午10时 2024/12/16 作者 GitHubStore

一键将视频转换为优质小红书笔记，适用于内容创作者、知识管理者和社交媒体运营。特点包括标题创作、内容优化及标签系统等，支持Python脚本处理单个或批量视频链接生成笔记。

西工大与微软等开源AI说唱模型！Freestyler：让AI成为你的说唱歌手！

上午8时 2024/12/16 作者开源星探

西北工业大学与微软等团队联合推出开源项目Freestyler，能根据歌词和伴奏直接生成自然流畅的说唱人声，模仿指定歌手音色。

高质量表情动图生成！用一张照片和音频，即能生成会说话的表情视频。

下午2时 2024/12/15 作者开源星探

ComfyUI-IF_MemoAvatar是一款基于MEMO技术的插件，通过分析面部特征和音频生成富有表现力的表情丰富的动态视频。它支持Windows和Linux用户使用，并具备高质量视频输出、情感表达转移等特色功能。

开源英语语法检查工具Harper

下午2时 2024/12/13 作者 GitHubStore

一款专为开发者设计的开源英语语法检查工具，提供多种安装方式和Obsidian插件，旨在替代Grammarly，具备高效、轻量和私密特点。

快速将一个 Github 仓库转为 LLM 友好理解的文本 – gitingest

下午2时 2024/12/13 作者 GitHubStore

一键将任何 GitHub 存储库转化为 LLM 提示友好文本摄取，并提供文件统计、格式化输出等特性。

Gemini 2.0刚发布多模态模式马上开源，自动生成模仿X上用户的AI对话机器人，独立艺术生成设备PaperPiAI

上午10时 2024/12/13 作者每日AI新工具

文章介绍了5个项目：Gemini Multimodal Live API + Pipecat聊天应用入门套件、MCP Directory Minecraft服务器目录、PaperPiAI基于Raspberry Pi的独立艺术生成系统、Research Rabbit AI驱动网络研究助手以及Reply gAI个性化回复工具。

远程语音卫星Wyoming Satellite

下午12时 2024/12/12 作者 GitHubStore

远程语音卫星使用Wyoming协议进行本地唤醒词检测和音频增强，与智能家居系统无缝对接。通过Python脚本配置麦克风并运行卫星服务，支持多种唤醒词，并提供技术交流群和合作机会。

将 Docker 镜像编译成独立运行的二进制文件dockerc

下午12时 2024/12/12 作者 GitHubStore

无需 Docker run、pip install 或 npm i，Dockerc 可生成可执行文件供用户直接运行。支持多种操作系统和架构，并通过 Skopeo 加载镜像。

CodeArena让大型语言模型竞赛并实时显示排名，完全开源的 AI 桌面机器人Desk-Emoji

上午10时 2024/12/12 作者每日AI新工具

本期内容包括CodeArena、ChatTTSPlus、Desk-Emoji、LLMOps Python Package和Python-genai五个项目。它们分别提供了大型语言模型竞赛、语音合成增强版、AI桌面机器人、LLM全生命周期管理工具包以及Google生成式AI SDK，覆盖了模型比较、加速技术、交互式应用等多个方面。

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31