速递|《指环王》级文本吞吐,谷歌发布Gemini2.5 Pro的能效比突破密码

谷歌发布下一代AI推理模型Gemini 2.5,具备多模态能力,并在多个基准测试中表现优异。该模型通过Google AI Studio提供给开发者,并计划在未来几周公布其API定价。

谷歌提出Titans:突破算力限制,扩展上下文

专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言等大语言模型发展和应用落地。谷歌发布新研究Titans,通过神经长期记忆模块扩展大模型上下文窗口至200万token,超越现有Transformer模型。

谷歌三款新模型齐发,Gemini-2.0-Pro免费、跑分超o1登顶第一,适合编码、处理复杂提示!

Gemini 2.0系列新版本发布,包括Pro实验版、Flash Lite和Flash Thinking。Pro在编码、数学等方面表现最优,Flash Lite性价比高;Google AI Studio提供免费访问Pro实验版,并且强化安全性设计。

大模型超长窗口上下文与检索增强生成——RAG

本文介绍了大模型窗口与检索增强技术的关系及其重要性,并讨论了如何解决长对话问题。强调了大模型窗口的重要性以及其限制条件,指出大模型窗口并不是越大越好,更不可能无限大。同时探讨了上下文窗口和RAG技术在医疗等特殊场景中的应用及准确性保证问题。