重磅!持续学习模型来了,可以像人类一样不断学习和思考!

Topology发布全新持续学习模型CLM,能记住对话内容并自主学习思考。相比传统大语言模型,CLM解决了失忆、缺乏内心世界及灵魂三大痛点,并支持数十亿条记忆存储与检索。

DeepSeek-VL2开源MoE 视觉语言模型家族,Gemini英语口语助手,将 PDF 文档转换为互动式思维导图

本文介绍了DeepSeek-VL2、Leffa、小红书笔记生成器、Gemini 英语口语助手和PDF Mind Map Maker等创新技术与应用。它们涵盖多模态视觉-语言模型、可控人物图像生成框架、笔记生成工具及AI英语口语辅助等多个领域,提供高效便捷的功能以提升用户在不同场景下的工作效率和体验质量。

豆包生成汉字,不是神秘的技术,而是好产品

设计圈最近因为AI生图带中文功能而热闹起来。豆包和即梦的新功能能生成工整的中文字体图片,取代了此前几百元一张的设计费。技术难点在于汉字生成的复杂性和控制一致性的难题,豆包通过打通大语言模型(LLM)与双模态图像理解(DIT)架构解决了问题,并在细节优化上取得了显著提升。尽管如此,可商用性才是关键因素,中国市场的字体版权保护生态和商业化考量使得真正落地的产品较少。

微软 Phi-4 震撼发布:14B 参数模型性能超越 一众大模型,数学推理性能提升显著

微软发布的Phi-4大语言模型在数学推理方面表现出色,准确率达到91.8%。该模型通过高质量合成数据集、精心策划的数据以及先进的后训练技术实现了这一成就,并已在Azure AI Foundry平台发布。