跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

Datawhale

DeepMind首席科学家最新万字访谈:模型「慢思考」,能力大幅提升!

下午7时 2025/02/28 作者 Datawhale

ind 首席科学家 Jack Rae 接受访谈,就谷歌思维模型的发展进行深入讨论。
Jack Rae

分类 分享 标签 DeepMind、 Jack、 公平性、 合作、 评估指标、 透明度 发表评论

OpenAI发布GPT-4.5:主打情商高,OpenAI最大最贵模型

下午7时 2025/02/28 作者 Datawhale

、
机器之心
今天凌晨4点,OpenAI进行了在线技术直播,
奥特曼并没有现身
。
OpenAI 正

分类 分享 标签 GPT-4.5、 SVG生成、 Will Depue、 物理模拟、 视觉识别、 音乐推荐 发表评论

零基础入门:DeepSeek微调的评测教程来了!

下午7时 2025/02/28 作者 Datawhale

望通过比较通俗的方式给大家直观感受大模型微调后的效果,相关是思路想法旨在起到抛砖引玉的效果,如果学习

分类 分享 标签 BERTScore、 LORA、 医疗领域、 大模型、 微调、 金融领域 发表评论

刚刚!梁文锋亲自贡献:DeepSeek全面开源优化并行策略!

下午2时 2025/02/27 作者 Datawhale

DeepSeek在OpenSourceWeek分享了多个开源项目,包括用于V3/R1训练的DualPipe、EPLB负载均衡算法以及用于深度学习模型的profile-data分析数据。

分类 分享 标签 DeepEP、 DualPipe、 GEMM库、 夜间运行、 梁文锋、 节省成本 发表评论

DeepSeek vs ChatGPT:谁可以预测股票市场与宏观经济?

下午2时 2025/02/26 作者 Datawhale

tl),祝武(清华大学)
2025 年春节前夕,DeepSeek 一经推出迅速“走红”,受到了国内外

分类 分享 标签 ChatGPT、 DeepSeek、 坏消息比率、 好消息比率、 宏观经济、 经济预测 发表评论

DeepSeek接入个人知识库,保姆级教程来了!

下午2时 2025/02/26 作者 Datawhale

通过 RagFlow 框架,介绍如何将 DeepSeek 接入个人知识库中。RagFlow 是一款基于深度文档理解的开源检索增强生成引擎,适用于多种场景如智能客服、文档生成等。

分类 分享 标签 15、 Datawhale、 DeepSeek、 RAGFlow、 张龙斐、 智能客服 发表评论

零基础入门:DeepSeek微调教程来了!

下午2时 2025/02/25 作者 Datawhale

的效果。
微调前:
微调后:
在此处可以看到很明显大模型进行微调后口吻已经发生了更改。据笔者使用下来

分类 分享 标签 交叉熵损失、 因果语言建模、 困惑度分析、 多任务学习、 微调模型、 混淆矩阵 发表评论

刚刚!DeepSeek开源DeepEP,GPU通信加速器,专为MoE设计!

下午2时 2025/02/25 作者 Datawhale

DeepSeek发布第二款开源软件库DeepEP,专为MoE模型训练与推理设计,提供高效的全对全通信计算核,支持FP8精度运算。

分类 分享 标签 DeepEP、 DeepSeek、 GitHub、 MoE模型、 全对全通信、 高效通信库 发表评论

Perplexity CEO最新访谈:用AI重做搜索,我们学到了什么

下午2时 2025/02/25 作者 Datawhale

需求,却深深嵌入了我们的日常生活。无论是查资料、买东西,还是了解新闻,搜索引擎早已成为我们获取信息的

分类 分享 标签 AI 搜索、 Aravind Srinivas、 Google、 全球化布局、 垂直领域整合、 用户导向 发表评论

全球首个混合推理模型:Claude 3.7 Sonnet来袭,主打编程能力

下午2时 2025/02/25 作者 Datawhale

模型的消息开始在 AI 社区广泛发酵,不过并不是期待中的 Claude 4.0,而是 3.7 Son

分类 分享 标签 Anthropic、 Claude、 Claude 3.7 Sonnet、 智能编码工具、 编程任务、 负责任扩展策略 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面11 页面12 页面13 … 页面26 下一页 →

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

近期文章

  • VS Code 1.100 重磅发布:AI 功能全面升级,开发体验大幅提升!
  • Qwen微调干货!对话、指令、Function Call、思考链数据集构造全流程揭秘!
  • 给MCP加上RAG,工具准确率提升200%,起飞~
  • 2025,我们又一次用AI,交了个朋友。
  • 五月组队学习,开设青少年编程课程!

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 5 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 4 月    

归档

  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×