火山引擎直接把大模型应用给开源了,附部署教程和实测体验!
特工小鹏团队介绍了火山方舟的大模型应用实验室,通过易集成、易落地的模式帮助企业快速实现AI应用。他们使用Python SDK Arkitect快速搭建了Chat2Cartoon项目,并分享了从低代码到高代码覆盖的过程。
特工小鹏团队介绍了火山方舟的大模型应用实验室,通过易集成、易落地的模式帮助企业快速实现AI应用。他们使用Python SDK Arkitect快速搭建了Chat2Cartoon项目,并分享了从低代码到高代码覆盖的过程。
5个人在3小时内完成了Manus开源复刻版OpenManus的开发。该项目展示了模块化Agent系统、实时反馈机制和强大的工具链等关键要素。
阿里云发布QwQ-32B推理模型,参数量为32B,性能媲美DeepSeek-R1,在数学和编程能力上与之相当,并可在消费级显卡上部署。该模型开源用于商业和研究用途,已吸引大量关注。
香港科技大学研究人员提出「原子思维」(AOT)改进了GPT-4o-mini在HotpotQA上的性能至80.6%,超越了现有方法。该技术通过将复杂问题分解为独立的子问题,实现更高效和准确的推理。
DeepSeek 发布了DualPipe和EPLB两个新工具以及训练和推理框架的分析数据,旨在帮助社区更好地理解通信-计算重叠策略和底层实现细节。
阿里巴巴Qwen团队发布了深度推理模型QwQ-Max-Preview,其在数学、编程及通用任务中表现出色,并支持联网搜索和思维链展示。该模型将开源,并推出Android和iOS应用程序,促进AI技术在全球范围内的传播和应用。
Qwen系列的新进展QwQ-Max-Preview专注于深层推理和多领域问题解决,未来将开源。FlashMLA是一款针对Hopper GPU优化的高效MLA解码内核,支持可变长度序列处理。Claude Code是一个终端编码工具,帮助开发者执行代码任务。EasyR1是高效、可扩展的多模态强化学习训练框架,支持视觉语言模型。GibberLink演示了会话AI在意识到彼此都是AI代理时从人类语言切换到音频协议的过程。