Llama 4 系列的首批开源模型
Llama 4 Scout 和 Llama 4 Maverick 是两个强大的多模态模型,分别拥有16和128个专家,并在多个基准测试中表现出色。它们均能运行于单个 NVIDIA H100 GPU 上,且提供了业界领先的上下文窗口。
Llama 4 Scout 和 Llama 4 Maverick 是两个强大的多模态模型,分别拥有16和128个专家,并在多个基准测试中表现出色。它们均能运行于单个 NVIDIA H100 GPU 上,且提供了业界领先的上下文窗口。
Markdown万能转换器:Markdownify-MCP,提供多种文件类型转为Markdown的功能,包括PDF、图片、音频等,并支持网页内容和搜索结果的转换。
新智元报道 新世界首个20万块GPU训练出的Grok-3全部免费开放上线 DeepSearch和Think两大模式加持,Grok-3能秒解MIT积分赛题,但遭OpenAI研究员「打假」质疑作弊。它还支持高级语音模式,并能生成逼真的图像。
新榜账号‘AI新榜’更新头像及简介,并介绍账号发展方向和招聘信息。原名’头号AI玩家’,2024年初改名为’AI新榜’,专注AIGC研究与分享。现发布视频制作、内容编辑等岗位招聘信息。
本文介绍了五个开源项目:Zonos-v0.1(多语言TTS模型)、Nanospeech(文本转语音系统)、Potpie(AI代理创建平台)、Zotero PDF2zh(PDF翻译插件)和Open Deep Research Web UI(AI研究助手)。
斯坦福大学李飞飞团队联合华盛顿大学研究人员利用不到50美元的云计算费用训练出了名为s1的推理模型,其数学与编码能力表现接近OpenAI、DeepSeek等大模型。该模型已在GitHub上发布,并且通过精心挑选的数据集和蒸馏方法实现了低成本高效训练。
论文介绍了DeepSeek-R1-Zero和DeepSeek-R1两种推理模型,前者通过大规模强化学习训练,在没有监督微调下展现卓越推理能力,后者结合多阶段训练和冷启动数据优化其性能。