跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

多层感知机

从零实现多层感知机

上午8时 2025/04/24 作者 NLP工程化

基于Eigen库的C++实现多层感知机(MLP),支持多种激活函数和损失函数,并采用小批量梯度下降与反向传播算法进行训练。

分类 开源 标签 Eigen库、 GitHub、 反向传播、 多层感知机、 小批量梯度下降、 模块化设计 发表评论

Claude团队开盒Transformer:AI大脑原来这样工作

下午11时 2025/03/28 作者 量子位

研究人员使用电路追踪方法揭示了大模型Claude的工作机制,包括其长逻辑推理、多语言处理和诗歌创作能力。

分类 资讯 标签 Claude团队、 交互式可视化、 多层感知机、 归因图、 电路追踪方法、 跨层编码器 发表评论

ICLR 2025 Spotlight SmODE: 神经常微分网络让深度强化学习的控制更加丝滑!

下午11时 2025/03/26 作者 极市干货

通过设计具有平滑特性的常微分方程作为神经元核心结构,构建平滑神经网络作为强化学习策略网络,显著提高

分类 学术 标签 Lipschitz常数、 SmODE、 低通滤波、 动作波动率、 多层感知机、 神经常微分神经网络 发表评论

揭示Transformer「周期建模」缺陷!北大提出新型神经网络FAN,填补周期性特征建模能力缺陷

上午11时 2024/11/26 作者 新智元

新智元报道
编辑:LRST
【新智元导读】
北京大学研究团队开发的FAN模型能有效捕捉数据中的周期性

分类 资讯 标签 FAN 模型、 周期性建模、 多层感知机、 时间序列预测、 泛化能力、 符号公式表示 发表评论

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Manus Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

近期文章

  • sktime 是一个用于 Python 的时间序列分析库
  • typed-ffmpeg:为Python开发者提供现代、易用的FFmpeg封装库
  • Unsloth AI发了一个动态1bit的DeepSeek-R1-0528量化模型
  • Awesome-LLM-Post-training:为LLM的推理能力提升提供一站式资源宝库
  • “数据要素×”安徽分赛高校宣讲走进中科大,气象服务与低空经济赛道引发热烈反响

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 5 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 4 月    

归档

  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×