语言模型
JinaAI发布ReaderLM-v2,1.5B轻松拿捏HTML转JSON或MarkDown
ReaderLM-v2 是一个拥有1.5B参数的语言模型,能够将HTML转换为美观的Markdown或JSON格式,并支持29种语言。它在生成复杂元素、使用预定义模式输出JSON以及处理长文本方面表现出色,并通过强化学习提升稳定性。
MiniRAG来了!检索增强生成从未如此简单!
近年来检索增强生成技术的发展使得语言模型能够高效利用外部知识。然而小语言模型在RAG中的使用受限,MiniRAG通过语义感知异构图索引和轻量级拓扑增强检索解决了这个问题。
JinaAI开源升级!一个开源HTML转Markdown和JSON的小型语言模型,参数仅有1.8B。
在大数量级AI数据处理场景下,JinaAI的ReaderLM-v2语言模型通过将原始HTML转换为Markdown或JSON格式解决了资源消耗问题,并实现了更好的Markdown生成、新增JSON输出及更强的上下文和多语言支持。
让「幻觉」无处遁形!谷歌DeepMind全新基准,三代Gemini同台霸榜
谷歌发布的新基准测试FACTS Grounding用于评估AI模型在特定上下文中生成准确文本的能力,通过去除无效回复确保评分准确性。
Meta探索大模型记忆层,扩展至1280亿个参数,优于MoE
MLNLP 社区致力于促进 NLP 学术界、产业界及爱好者间的交流合作,Meta 新研究展示了记忆层在预训练语言模型扩展中的实用性和性能提升。
超越Claude 3.5紧追o1!DeepSeek-V3-Base开源,编程能力暴增近31%
DeepSeek AI开源最新混合专家语言模型DeepSeek-V3-Base,性能优于多个竞品模型,编程能力大幅提升。
清华深研院 AgentLand Festival 2025 Agent游戏开发年终盛会
清华大学AgentLand实验室举办Agent游戏工作坊,征集AI Agent游戏原型。活动涵盖线上投稿、线下试玩会和颁奖典礼,提供丰厚奖品及技术支持。