7B 归档 - 每时AI

具身智能领域代表大模型及医疗多模态数据合成思路

2025年7月16日14时作者老刘说NLP

2023年12月27日《Qwen2.5和RoboBrain 2.0在医疗领域与具身智能中的应用》介绍了Qwen2.5用于医疗领域的空间理解模型MedEvalKit以及RoboBrain 2.0 32B用于室内场景建模，强调了它们如何结合医学图像数据进行训练，并生成结构化的3D布局。

2025年6月26日8时作者 NLP工程化

Sakana AI提出的新方法RLT让7B模型训练出的学生超过671B模型，且成本仅为传统方法的1/3。

2025年5月6日19时作者 AI先锋官

小米发布首个为推理而生的大模型MiMo，仅7B参数规模超越OpenAI和阿里Qwen。技术团队强调预训练与后训练协同优化的重要性，通过特定数据合成及创新算法提升推理能力。

2025年4月17日16时作者 PaperWeekly

MT-R1-Zero首次将R1-Zero范式扩展到机器翻译领域，通过规则-度量混合奖励机制实现无需监督微调的端到端强化学习优化。该方法在多项指标上超越了现有模型。

2025年3月26日8时作者 NLP工程化

专业领域模型Fin-R1在金融领域复杂推理任务上超过DeepSeek-R1，支持金融分析、代码生成、风险评估和合规审查等功能。

2025年3月7日16时作者量子位

DeepSeek研究团队发表LADDER论文，介绍一种通过递归问题分解和强化学习提升AI模型能力的新方法。该方法使7B规模的Qwen模型在MIT Integration Bee比赛中得分达到90分，超越了o1的成绩。

2025年3月6日14时作者小兵的AI视界

其中，法律领域对智能化的需求日益增长
，从法律条文的解读、案例分析到法律咨询服务，都渴望借助先进的

2025年3月3日23时作者智东西

广和通在2025世界移动通信大会发布星云系列AI模组及解决方案，覆盖1T~50T算力等级，支持智能陪伴机器人等终端设备的本地化大模型部署与应用开发。

2025年2月21日23时作者机器之心

Group Relative Policy Optimization）非常关键，是 DeepSeek