optuna-mcp:Optuna的Model Context Protocol (MCP)服务器 2025年6月30日8时 作者 NLP工程化 OptimaMCP是Optuna的Model Context Protocol服务器,支持自动化超参数优化及交互式分析结果,兼容多种工具。
新手必看!用 DeepSeek-R1 数据训练出你的专属中文推理模型 2025年4月4日14时 作者 小兵的AI视界 进行 SFT ( Supervised Fine-Tuning )的小模型也展现出了强大的效果 。前
初探最大更新参数化muP:超参数的跨模型尺度迁移规律 2025年3月30日23时 作者 PaperWeekly 经网络 众所周知,完整训练一次大型 LLM 的成本是昂贵的,这就决定了我们不可能直接在大型 LLM