日期: 2025 年 6 月 7 日
基于Qwen3的Embedding和Rerank模型系列开源
Qwen3 Embedding系列通过多阶段训练pipeline,结合弱监督预训练、有监督微调和模型合并,利用强大的文本合成能力提升嵌入质量。
小红书开源了个模型 142b,激活14b
中等规模的dots.llm1模型在仅使用11.2万亿高质量真实数据的情况下达到与Qwen2.5-72B相当的性能水平,上下文长度达32K,参数量为140亿(14B)和1420亿(142B),并提供预训练中间检查点。
解锁文档处理新高度!这个开源神器支持OCR+机器学习,超丰富的API接口,效率翻倍!
Dedoc是一款ISPRAS团队开源的文档提取与转换工具,支持多格式文档处理,包括Office、PDF和扫描件等,并能智能提取表格、文本格式和逻辑结构。其核心功能亮点涵盖文档逻辑结构提取、复杂表格解析以及OCR扫描件处理。
让AI自动化控制电脑的一切操作automation-mcp
自动化 MCP 是一个模型上下文协议服务器,为AI模型提供完整的 macOS 桌面自动化能力,包括控制鼠标、输入键盘指令、截取屏幕截图及分析内容等。