Mac上的AI聊天侧边栏Onit,阿里巴巴开源QwenLong-L1,Web Agent 和浏览器之间无缝交互的标准框架

关注我,记得标星⭐️不迷路哦~


✨ 1: Onit

Onit是一款Mac上的AI聊天侧边栏,可以吸附到任何应用程序,如同一个更通用的Cursor Chat。

Onit 是一个 AI 聊天侧边栏,可以停靠在你的 Mac 上的任何应用程序中。它类似于 Cursor Chat,但适用于你电脑上的所有其他应用程序,而不仅仅是 IDE。

主要功能:

  • **高亮文本 -> 打开 Onit:**选择的文本会自动在 Onit 中打开。
  • 将任何窗口作为上下文加载:
     无需复制粘贴,Onit 可以自动读取停靠的窗口作为上下文。
  • 切换模型,不切换工作流程:
     选择最适合的模型。
  • 本地模式:
     一键切换到本地模式,将一切都保留在你的机器上。
  • 可定制的快捷键:
     可以自定义启动聊天窗口的热键,默认是Command+0

地址:https://github.com/synth-inc/onit

✨ 2: Web Agent Protocol

Web Agent Protocol(WAP)是一种标准化框架,通过记录和重放浏览器行为,实现用户、Web代理和浏览器之间的无缝交互。

Web Agent Protocol (WAP),它是一个旨在实现用户、Web Agent 和浏览器之间无缝交互的标准框架。WAP通过记录和回放浏览器动作,将动作的记录和执行分离,从而实现高效的自动化和可重用性。

主要功能和特点:

  1. 数据收集:
     使用 OTA-WAP Chrome 插件收集用户交互数据。
  2. 数据转换:
     将原始事件流转换为精确回放(exact-replay)或智能回放(smart-replay)动作列表。可以将记录的动作转换为MCP服务器,以便任何代理或用户重用。
  3. 动作回放:
     使用 WAP-Replay 协议回放动作列表,确保浏览器操作的准确性。

地址:https://github.com/OTA-Tech-AI/web-agent-protocol

✨ 3: QwenLong-L1

QwenLong-L1是通过强化学习训练的首个长文本推理大模型,在长文本DocQA基准测试中表现卓越,优于许多同类模型。

QwenLong-L1 的核心要点:

  • 创新性:
     QwenLong-L1 是首个利用强化学习进行长文本推理训练的 LLM。
  • 性能卓越:
     在七个长文本文档问答 (DocQA) 基准测试中,QwenLong-L1-32B 的性能优于 OpenAI-o3-mini 和 Qwen3-235B-A22B 等旗舰 LLM,与 Claude-3.7-Sonnet-Thinking 的性能相当。
  • 强化学习框架:
     提出了一种新的强化学习框架,旨在促进 LLM 从短文本能力向强大的长文本泛化能力过渡。该框架包括:
    • 热身监督微调 (SFT) 阶段:
       初始化一个强大的策略。
    • 课程引导的 RL 阶段:
       促进从短文本到长文本的稳定适应。
    • 难度感知的回顾性采样机制:
       调整各个阶段的训练复杂度,以激励策略探索。
  • 数据集:
     发布了 DocQA-RL-1.6K,这是一个专门的 RL 训练数据集,包含 1.6K 个文档问答 (DocQA) 问题,涵盖数学、逻辑和多跳推理领域。

地址:https://github.com/Tongyi-Zhiwen/QwenLong-L1

✨ 4: TranslateBookWithLLM

TranslateBookWithLLM是基于Ollama API的Python应用,用于本地LLM驱动的大规模文本翻译,提供Web和CLI界面。

TranslateBookWithLLM,一个使用本地大型语言模型 (LLM) 翻译书籍的 Python 应用程序。它利用 Ollama API,支持大规模文本翻译,例如整本书的翻译。 该工具提供了两种使用方式:一个现代化的 Web 界面,方便用户使用,以及一个命令行界面 (CLI),供高级用户进行自动化和脚本编写。

主要特性:

  • Web界面:
     提供用户友好的浏览器界面,带有实时进度追踪。
  • EPUB 支持:
     无缝翻译 .epub 格式的书籍文件,保持原始结构。
  • CLI 支持:
     命令行界面,方便自动化和脚本编写。

地址:https://github.com/hydropix/TranslateBookWithLLM

✨ 5: Claude Code MCP Server

Claude Code MCP Server是一个MCP服务器,它允许以绕过权限的方式运行Claude Code,从而增强 Claude 的代码处理能力。

Claude Code MCP Server,一个允许在单次模式下运行 Claude Code 的服务器,它自动绕过权限限制。

总结性介绍:

  • 核心功能:
     该服务器提供了一个强大的 claude_code 工具,允许LLM直接与 Claude Code CLI 交互,无需每次都请求授权。
  • 主要优势:
    • 更高效的文件编辑:Claude Code 在编辑文件方面比 Claude/Windsurf 更强大和快捷。
    • 节省上下文空间:可以将多个命令排队执行,而不是直接执行,从而节省上下文空间。
    • 成本效益:通过将任务分流到更便宜的模型,可以降低成本。
    • 解决“卡住”问题:Claude 拥有更广泛的系统访问权限,可以完成 Cursor/Windsurf 无法完成的任务。
    • 代理中的代理:在代理规则中的应用。
  • 关键特性:
     可以 bypass 权限,直接执行 Claude Code,允许LLM访问文件编辑能力,默认启用特定工具。

地址:https://github.com/steipete/claude-code-mcp

(文:每日AI新工具)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往