港大开源论文AI撰写工具AI-Researcher,Gemma 3发布评测性能超越DeepSeek-V3部署成本少10倍
ini 2.0研发的轻量级开源模型系列,可在单GPU或TPU上运行,性能强大。
Gemma 3 是
ini 2.0研发的轻量级开源模型系列,可在单GPU或TPU上运行,性能强大。
Gemma 3 是
OpenAI发布了多智能体工作流框架OpenAI Agents SDK及其示例应用Computer Using Agent Sample App。Anus是一个开源AI代理框架,旨在通过自动化任务革新AI应用程序的开发和使用。Cloudflare Agents提供状态管理和实时通信等功能。
本期介绍了5款软件与工具,包括AppAgentX、Gem-assist、CocoIndex、autoMate和iMCP。它们涵盖了GUI代理、终端助手、数据索引引擎和本地自动化等多个领域。
OpenManus 是由 MetaGPT 团队成员构建的无需邀请码工具,让用户实现创意。HunyuanVideo-I2V 是腾讯开源的图像到视频生成框架。Light-R1-32B 超越 R1-Distill,在数学问题上表现出色且成本低廉。Audio-Reasoner 是大型音频语言模型,通过 CoT 推理在基准测试中表现优异。SolGraph 利用 Solana 链上基础设施实现快速透明的 AI 应用。
Qwen系列模型之一的QwQ-32B参数量为325亿,适用于解决难题;OpenChat是一个支持Web、移动和桌面端的AI聊天应用;Archon是用于构建和优化AI智能体的工具;Firecrawl MCP Server整合了强大的网页抓取功能;Composio提供超过250种工具和支持多种框架与认证协议。
TheoremExplainAgent生成可视化的定理讲解视频;AI写作助手定制化生成高质量内容;MTranServer超低资源离线翻译服务器;ReSearch通过强化学习提升问答效果无需监督数据;CoE通过层内专家间迭代通信提高LLM性能和效率。
本文介绍了5个AI研究项目:Shandu、ViDoRAG、Klee、HumanOmni和股票分析系统。它们涵盖从视觉文档检索到多模态语言模型的各个方面,包括生成报告、提升视觉理解能力、提供投资建议等功能。
本文介绍了五个AI工具包和模型,包括olmOCR用于处理PDF文档、DeepGEMM优化FP8矩阵乘法、R1-OneVision多模态大语言模型、Baichuan-Audio语音交互模型以及MyCoder AI编程工具。
Qwen系列的新进展QwQ-Max-Preview专注于深层推理和多领域问题解决,未来将开源。FlashMLA是一款针对Hopper GPU优化的高效MLA解码内核,支持可变长度序列处理。Claude Code是一个终端编码工具,帮助开发者执行代码任务。EasyR1是高效、可扩展的多模态强化学习训练框架,支持视觉语言模型。GibberLink演示了会话AI在意识到彼此都是AI代理时从人类语言切换到音频协议的过程。
DeepSeek将逐日开源五个项目,共享透明进展与创新;Open Deep Research是一款支持用户自定义研究模型和报告结构的Web研究助手;Openator是一个开源浏览器代理工具,能够执行自然语言制定的操作;Magma是一种多模态人工智能代理的基础模型;AI 多人聊天室提供支持多人同时对话、可自定义角色的实时聊天应用。