开源
月之暗面Kimi与清华大学发布Mooncake开源项目,阿里发布QwQ-32B-Preview模型,推理能力强劲
Mooncake是专为大规模语言模型服务的分散架构平台;QwQ致力于推进人工智能推理能力,并在各种基准测试中表现优异;Next.js AI Chatbot x Supabase提供高效的聊天功能与数据存储解决方案;Insight-V是一个早期探索长链视觉推理的多模态大语言模型;《AGI之路》深入探讨了大模型构建与应用的关键技术。
是宣传还是事故OpenAI Sora泄露API,完全开放语言模型OLMo 2,anthropic开放MCP旨在连接万物
本期内容涵盖了SoraVids、OLMo 2、StableAnimator、OneDiffusion和Model Context Protocol等五个AI项目。其中,SoraVids由desuAnon发布在Hugging Face平台,提供OpenAI视频生成模型Sora的视频及提示;OLMo 2是Ai2开发的完全开源语言模型;StableAnimator致力于高质量的人像动画生成,保持身份一致性并无需后处理;OneDiffusion是一个多功能的大规模扩散模型,支持双向图像合成和理解。Model Context Protocol则提供了一个新的标准连接AI助手与数据源,优化响应质量。
微软LazyGraphRAG:新一代超低成本RAG
微软发布LazyGraphRAG简化成本结构,相比完整GraphRAG成本低0.1%。其利用NLP提取概念及其共现,并采用图形统计优化概念图和分层社区结构。评测显示,在成本和质量上超越其他方法,性能优于包括标准向量RAG、RAPTOR、GraphRAG本地/全局搜索和DRIFT在内的多个选项。
EchoMimic全面升级!从数字脸到数字人,输入图+音频+手势即可!
蚂蚁集团开源数字人技术EchoMimic,可用于虚拟主播、视频编辑等。EchoMimic基于音频驱动生成逼真动画,提供多种功能并支持WebUI和GradioUI界面。
微软推出RAG的新方法:LazyGraphRAG
微软发布LazyGraphRAG新方法,索引成本低至0.1%,在查询效率和准确性上优于多种传统方法。该技术无需对源数据进行预先总结,采用轻量级索引结合NLP技术快速识别和提取关键概念及其关系。