NLP工程化
字节开源了一个新型多模态生成模型 Liquid
字节开源新型多模态生成模型Liquid,核心创新在于统一编码图像和文本到相同token空间,并使用单一LLM处理视觉理解和生成任务。研究表明,随着模型规模增大,性能下降会消失甚至互相促进。
微软研究院发布了个原生 1-bit 的大语言模型:bitnet-b1.58-2B-4T
微软发布原生1-bit大语言模型bitnet-b1.58-2B-4T,其在内存占用和CPU推理延迟上大幅降低,并且性能接近全精度模型。
line-bot-mcp-server:将AI Agent与LINE官方账号无缝连接的MCP服务器
LINE Messaging API实现高效消息推送,支持文本和Flex消息,并提供用户详细资料获取功能。
Skywork-OR1:释放强化学习的力量,打造强大的数学和代码推理Agent
Skywork-OR1发布,7B参数量模型在AIME数学竞赛中得分69.8,性能媲美671B DeepSeek-R1,开源模型、数据和代码助力研究。
可以让Web智能体(比如网页机器人)通过发现和磨练技能来自我改进的一个框架:SkillWeaver
SkillWeaver 是一个以技能为中心的框架,它通过自主合成可重用API技能来让Web智能体自我提升。