Llama 4多模态大模型上线即开源,测试成绩、开源模式广遭质疑
Meta发布首个原生多模态Llama 4系列模型,性能超越GPT-4。包含Maverick、Scout和Behemoth三个模型,支持1000万token上下文。不过其开源模式存在争议,包括登录Hugging Face账户限制、严格再分发要求及命名要求等。
Meta发布首个原生多模态Llama 4系列模型,性能超越GPT-4。包含Maverick、Scout和Behemoth三个模型,支持1000万token上下文。不过其开源模式存在争议,包括登录Hugging Face账户限制、严格再分发要求及命名要求等。
文章介绍了Gemini 2.0原生绘画能力的突破,包括“对话式图像编辑”和“一致性生成”功能。Gemini 2.0能够通过简单的文本指令实现复杂的图像修改,并且能连续生成风格一致的内容。尽管存在一些小瑕疵,但其潜力巨大,目前已提供免费体验机会。
修改提示语、每张图生成时间不超过10s,
你肯定以为我是吹牛,
但现在
Gemini 2.0 Fla
Google开源Gemini 2.0多模态生图功能,用户只需一句话即可对图片进行修改或创作,如换发色、闭眼、改变对象身份等,展示了生成式AI在图像编辑领域的巨大进步。
谷歌DeepMind发布Gemini Robotics和Gemini Robotics-ER两款AI模型,让机器人能理解复杂环境、执行精细任务,并具有更好的泛化能力、交互性和灵活性。
谷歌Gemini 2.0、微软Copilot和OpenAI GPT-4o mini免费功能发布,支持代码补全、语音交互及深度思考,极大提升了开发者效率。
新智元报道
编辑:LRS
谷歌、斯坦福大学等机构开发的AI co-scientist系统,基于Gemini 2.0开发,能生成新的研究假设和实验方案,并通过自我改进提升结果质量。该系统在生物医学应用中成功预测药物再利用方向、提出新治疗靶点并解释抗菌耐药机制。
谷歌发布免费AI编程工具Gemini Code Assist,支持超过180K代码补全、所有公共语言和128K上下文窗口,预计2028年全球开发者将达5780万。
谷歌发布AI co-scientist系统,可处理科研选题、文献检索、实验设计等任务。特点包括理解研究目标、生成创新假设和研究方案、加速科研进程等。它采用多智能体架构模拟科学研究全流程,并通过‘测试时间计算’提升输出质量。实验证明其在药物重定向、靶点发现和抗生素耐药性机制解释等方面超越人类专家。
DeepSeek-R1 模型在解决业务问题时有时会遇到问题的连贯性和隔天再问情况。谷歌 Gemini 2.0 推出‘全局记忆’功能,通过构建用户专属的记忆图谱,实现对话历史记录和调用,改变人机交互范式。但这项技术升级也引发数据伦理的深水区。