大模型归档 - 第6页共37页

通过大模型调用 cloudflare 的 API 和功能

上午8时 2025/04/07 作者 NLP工程化

Cloudflare 推出 MCP 服务器支持大模型调用 Cloudflare API 和功能。相关代码库在 GitHub 上可获取。

Llama4模型四点核心总结及大模型推理数据合成工具Project Loong

下午2时 2025/04/06 作者老刘说NLP

经有了
很多标题党开始说RAG原地失业以及引领多模态的论调了，这并不好
，需要公正的看待这个模型本身

你了解大模型的生态体系吗？大模型从技术到应用的内容梳理

下午2时 2025/04/05 作者 AI探索时代

梳理了大模型体系构成和应用关系，介绍了神经网络作为机器学习的一种深度学习方式的基本原理及其在自然语言处理、计算机视觉等领域的结合应用，并阐述了不同架构如Transformer、RNN的工作机制，强调了神经网络并非万能及需要具体任务场景来发挥作用。

多榜单登顶！华为 & 哈工深团队提出 AdaReTaKe，突破长视频理解极限

下午4时 2025/04/04 作者机器之心

王霄的研究方向为多模态视频理解和生成，佀庆一的研究方向为多模态理解、LLM post-trainin

飞桨框架3.0正式发布，DeepSeek-R1满血版实现单机部署，吞吐提升144%！

下午11时 2025/04/03 作者开源AI项目落地

布
“自动并行训练、编译优化、推理加速、科学计算支持、国产硬件适配”
是这次的
核心升级方向，为开发

让AI替码农卷复杂任务，贾佳亚团队提出MoTCoder，准确率刷新SOTA

下午4时 2025/04/03 作者机器之心

论文提出MoTCoder模型，通过模块化思维显著提升大语言模型在复杂编程任务中的准确率与可维护性。团队已开源代码、模型和数据集供在线体验。

大模型除了聊天还能做什么？关于大模型的分类和应用

下午2时 2025/04/03 作者 AI探索时代

文章介绍了大模型分类的复杂性及用户和技术两个角度的大模型应用，并强调了实际需求的重要性，建议根据任务需求选择合适的模型，同时指出当前大模型评估标准缺失的问题，鼓励多尝试和研究。

1小时AI公开课上线啦~首期课程解密传统企业如何抓住AI革命！

上午11时 2025/04/03 作者 AIGC开放社区

在人工智能技术加速渗透各行各业的今天，《1小时AI公开课》系列直播课程推出，聚焦大模型、Agent、Prompt工程等前沿技术。首期课程将于4月11日晚8点开讲，由AIGC开放社区专家李扬主讲，内容涵盖AI进化论、AI百年演进与突破、AGI应用全景透视等多个模块，旨在为企业管理者、技术团队及个人开发者提供系统化的AI转型指引。

ICLR25｜史上最全面的多模态知识编辑基准！北京通用人工智能研究院BIGAI联合中科大提出MMKE – Bench！

下午11时 2025/04/02 作者极市干货

出MMKE – Bench，这是史上最全面的多模态知识编辑基准，涵盖跨越33个广泛的类别视觉实体编辑

idea满满的最新Test-Time Scaling综述！全面描述What, How, Where和How Well的问题

下午2时 2025/04/02 作者机器学习算法与自然语言处理

MLNLP社区发布一篇关于Test-Time Scaling（TTS）的survey论文，介绍大语言模型在测试阶段增加计算资源的方法，让模型能够更智能地解答问题。

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30