Meta Llama 4被疑考试「作弊」:在竞技场刷高分,但实战中频频翻车
Meta发布AI模型Llama 4后,用户反馈编码能力不佳。尽管在基准测试中表现优异,但在实际编程任务中的效果欠佳,引发讨论。
Meta发布AI模型Llama 4后,用户反馈编码能力不佳。尽管在基准测试中表现优异,但在实际编程任务中的效果欠佳,引发讨论。
DeepMind内部研究发布设限,因担心被竞争对手利用或让Gemini模型逊色。谷歌推行更严格的审查机制,生成式AI相关论文设定6个月禁发期。此举引发研究人员对学术自由的担忧。
Gemini 2.5 Pro 是 Gemini 模型的新成员,具备强大的推理、编程能力和多模态任务处理能力。它在多个基准测试中表现出色,并引入了逐步推理机制以提高答案准确性。
Google DeepMind发布的新模型Gemini 2.5在推理能力、多模态处理及精度方面表现出色,特别是在处理文本、图像和音频数据时表现出强大的灵活性与高效性。
谷歌最新发布的Gemini 2.5 Pro模型在推理和代码能力上表现优异,横扫多个基准测试排行榜榜首,并且实现了显著的性能提升。
Anthropic联合创始人Jack Clark指出,机器人行业即将迎来类似生成式AI模型的早期发展时期。中泰证券认为,这将推动具身智能技术的发展,预示着一个万亿级市场机遇的到来。
Google DeepMind发布AI模型Gemini Robotics,使机器人能够在不同环境下执行任务。
Google DeepMind发布Gemma 3,单卡AI性能显著提升。支持多语言、长上下文处理和多模态能力,并提供了多种量化技术实现高效部署。
Reflection AI 成立,旨在开发超级智能。该公司已获1.3亿美元融资,估值达5.55亿美元。两名前谷歌DeepMind成员担任CEO和联合创始人,团队包括多名顶尖AI研究人员和工程师。公司目标是开发自主编程工具,并将聚焦于自动执行狭窄的编程任务。
谷歌发布免费AI编程工具Gemini Code Assist,支持超过180K代码补全、所有公共语言和128K上下文窗口,预计2028年全球开发者将达5780万。