港大开源论文AI撰写工具AI-Researcher,Gemma 3发布评测性能超越DeepSeek-V3部署成本少10倍

ini 2.0研发的轻量级开源模型系列,可在单GPU或TPU上运行,性能强大。
Gemma 3 是

刚刚OpenAI发布Agents SDK,Claude Pro的编程助手,Cloudflare也开源构建智 Agents框架

OpenAI发布了多智能体工作流框架OpenAI Agents SDK及其示例应用Computer Using Agent Sample App。Anus是一个开源AI代理框架,旨在通过自动化任务革新AI应用程序的开发和使用。Cloudflare Agents提供状态管理和实时通信等功能。

OpenManus开源复刻Manus,腾讯开源的图像到视频生成框架,大型音频语言CoT推理模型

OpenManus 是由 MetaGPT 团队成员构建的无需邀请码工具,让用户实现创意。HunyuanVideo-I2V 是腾讯开源的图像到视频生成框架。Light-R1-32B 超越 R1-Distill,在数学问题上表现出色且成本低廉。Audio-Reasoner 是大型音频语言模型,通过 CoT 推理在基准测试中表现优异。SolGraph 利用 Solana 链上基础设施实现快速透明的 AI 应用。

小模型大智慧-阿里巴巴开源推理模型:QwQ-32B性能媲美DeepSeek-R1,AI Agent的生产级工具集Composio

Qwen系列模型之一的QwQ-32B参数量为325亿,适用于解决难题;OpenChat是一个支持Web、移动和桌面端的AI聊天应用;Archon是用于构建和优化AI智能体的工具;Firecrawl MCP Server整合了强大的网页抓取功能;Composio提供超过250种工具和支持多种框架与认证协议。

用Agent生成Manim动画视频用来解释定理辅助教学,低资源消耗的离线翻译服务器,开源AI 写作助手

TheoremExplainAgent生成可视化的定理讲解视频;AI写作助手定制化生成高质量内容;MTranServer超低资源离线翻译服务器;ReSearch通过强化学习提升问答效果无需监督数据;CoE通过层内专家间迭代通信提高LLM性能和效率。

开源深度研究报告Shandu,阿里巴巴开源ViDoRAG提升视觉文档理解和问答效果,开源量化分析

本文介绍了5个AI研究项目:Shandu、ViDoRAG、Klee、HumanOmni和股票分析系统。它们涵盖从视觉文档检索到多模态语言模型的各个方面,包括生成报告、提升视觉理解能力、提供投资建议等功能。

大模型处理PDF文档olmOCR,DeepSeek开源DeepGEMM高效的FP8矩阵乘法库,多模态推理R1-OneVision

本文介绍了五个AI工具包和模型,包括olmOCR用于处理PDF文档、DeepGEMM优化FP8矩阵乘法、R1-OneVision多模态大语言模型、Baichuan-Audio语音交互模型以及MyCoder AI编程工具。

阿里巴巴发布深层推理模型并准备开源,DeepSeek加速H800的推理速度,Claude开源终端代码助手

Qwen系列的新进展QwQ-Max-Preview专注于深层推理和多领域问题解决,未来将开源。FlashMLA是一款针对Hopper GPU优化的高效MLA解码内核,支持可变长度序列处理。Claude Code是一个终端编码工具,帮助开发者执行代码任务。EasyR1是高效、可扩展的多模态强化学习训练框架,支持视觉语言模型。GibberLink演示了会话AI在意识到彼此都是AI代理时从人类语言切换到音频协议的过程。

DeepSeek将逐日开源五个项目还未开源就有3千多个star,langchain下的深入研究助手,开源复刻Openator

DeepSeek将逐日开源五个项目,共享透明进展与创新;Open Deep Research是一款支持用户自定义研究模型和报告结构的Web研究助手;Openator是一个开源浏览器代理工具,能够执行自然语言制定的操作;Magma是一种多模态人工智能代理的基础模型;AI 多人聊天室提供支持多人同时对话、可自定义角色的实时聊天应用。