阿里巴巴云归档 - 第2页共3页

Llama 4 系列的首批开源模型

上午8时 2025/04/07 作者 NLP工程化

Llama 4 Scout 和 Llama 4 Maverick 是两个强大的多模态模型，分别拥有16和128个专家，并在多个基准测试中表现出色。它们均能运行于单个 NVIDIA H100 GPU 上，且提供了业界领先的上下文窗口。

下午2时 2025/03/06 作者 AI探索时代

数据预处理是神经网络的重要环节，涉及数据清洗、转换和压缩等步骤，以提升模型性能。

下午12时 2025/03/06 作者 GitHubStore

Markdown万能转换器：Markdownify-MCP，提供多种文件类型转为Markdown的功能，包括PDF、图片、音频等，并支持网页内容和搜索结果的转换。

下午12时 2025/02/26 作者 APPSO

阿里云推出新服务，旨在简化AI开发和部署流程，提高效率与成本效益。

下午4时 2025/02/20 作者新智元

新智元报道新世界首个20万块GPU训练出的Grok-3全部免费开放上线 DeepSearch和Think两大模式加持，Grok-3能秒解MIT积分赛题，但遭OpenAI研究员「打假」质疑作弊。它还支持高级语音模式，并能生成逼真的图像。

下午2时 2025/02/20 作者 AI新榜

新榜账号‘AI新榜’更新头像及简介，并介绍账号发展方向和招聘信息。原名’头号AI玩家’，2024年初改名为’AI新榜’，专注AIGC研究与分享。现发布视频制作、内容编辑等岗位招聘信息。

下午12时 2025/02/11 作者每日AI新工具

本文介绍了五个开源项目：Zonos-v0.1（多语言TTS模型）、Nanospeech（文本转语音系统）、Potpie（AI代理创建平台）、Zotero PDF2zh（PDF翻译插件）和Open Deep Research Web UI（AI研究助手）。

下午2时 2025/02/07 作者 AI先锋官

斯坦福大学李飞飞团队联合华盛顿大学研究人员利用不到50美元的云计算费用训练出了名为s1的推理模型，其数学与编码能力表现接近OpenAI、DeepSeek等大模型。该模型已在GitHub上发布，并且通过精心挑选的数据集和蒸馏方法实现了低成本高效训练。

上午8时 2025/02/07 作者 NLP工程化

论文介绍了DeepSeek-R1-Zero和DeepSeek-R1两种推理模型，前者通过大规模强化学习训练，在没有监督微调下展现卓越推理能力，后者结合多阶段训练和冷启动数据优化其性能。