日期: 2025 年 2 月 24 日
大模型开源及RAG用于综述写作进展:兼看mobile agent在应用场景选择上一些思考
今天是2025年02月24日,星期一。文章讨论了mobile agent的思考和开源进展,包括MoE小模型Moonlight-16B-A3B、Qwen2.5-VL及deepseek开源周day1开源FlashMLA等项目。此外还介绍了RAG在写作场景中的应用进展。
【科普】大模型蒸馏技术揭秘:用1%的成本,获得90%的AI能力!
文章介绍了大模型蒸馏技术及其应用。通过模型蒸馏,可以将庞大复杂的大型模型“瘦身”为更高效的小模型,节省计算资源、提高推理速度并适应更多平台。模型蒸馏的核心是知识转移和温度调控等技术,同时存在知识同质化、能力阉割及数据污染等问题,需要综合解决方案来应对。
【问小白】Deepseek R1 671B满血版,非常稳定,不卡、零延迟、不限次、全免费、随便用
随着用户量增长,DeepSeek访问受限。问小白接入了DeepSeek满血版671B,并采用专线部署,解决访问不稳定问题。问小白以快、稳、免费和智能等特点脱颖而出,提供即时搜索、创作工具及逻辑推理等功能。它还支持联网搜索及语音输入,确保用户体验流畅稳定且免费。
阶跃星辰CEO姜大昕:汽车是AI Agent最关键落地场景
阶跃星辰在上海举办首届Step UP生态开放日,透露多模态推理和Agent智能体技术作为未来重点关注方向,并发布全新升级的‘繁星计划’2.0。
首批基于DeepSeek的“AI公务员”上岗
近日,镇江市数据局发布消息,本地化部署DeepSeek后单日数据处理量相当于全市公务员10年工作量总和。深圳福田区推出基于DeepSeek开发的AI员工,并推出《政务辅助智能机器人管理办法》为AI在政务领域的角色划定了制度边界。