PyTorch研习社
在CPU上运行100B模型只需4MB内存!微软BitNet掀了英伟达的桌子!
微软发布BitNet推理框架,通过三值量化将LLM模型大小瘦身至原来的1/16,在CPU上实现2.37到6.17倍加速,并节能82.2%,甚至可在普通笔记本CPU上运行100B参数级大模型。
大模型是怎么“思考”的?五分钟看懂大模型的底层逻辑!
近年来ChatGPT爆火,让大语言模型走进大众视野。本文系统梳理了其原理、训练方式及其应用,涵盖数据、架构和训练三大要素,并展示了微调与实际应用场景,如客户服务、内容创作等。
RAG 正在重塑未来:最新 11 种新型 RAG 类型一次看懂!
多种最新的RAG类型包括协同式(CoRAG)、推理控制(ReaRAG)、多模态和多智能体(HM-RAG)等,展示了RAG技术在复杂任务中的应用和发展方向,帮助LLM提升推理能力、适应性和准确性。
智能体框架大PK!谷歌ADK VS 微软Semantic Kernel
谷歌 ADK 与微软 Semantic Kernel 比较,ADK 强调集成多种大语言模型并提供事件驱动架构,而 Semantic Kernel 则以其多语言支持和企业级应用特性著称。
MCP很好,但安全问题不容忽视,智能体安全框架可以解决
MCP 是一种标准化智能体通信接口,旨在简化不同 AI 智能体和工具之间的集成与协作。然而,其简洁性背后隐藏的安全漏洞引起了关注,包括共享内存中的数据篡改、工具调用的风险以及版本控制问题等,这些都可能导致严重的安全风险。
Google的Firebase Studio完爆了Cursor
Google 发布了 Firebase Studio,一个基于网页且易于上手的 AI 编程平台。它集成了 VS Code 的功能,并提供免费的模型供用户直接使用。Firebase Studio 支持原型开发、部署到 Cloud Run、集成 Google 地图等特性。
OpenAI发新模型o3和o4-mini!首次实现“图像思维”,可利用所有ChatGPT工具
OpenAI发布了两款新的推理模型o3和o4-mini,能够处理复杂的编程和视觉任务,并首次实现了‘图像思维’能力。这些模型提供了更快、更高效且更具成本效益的解决方案,向开源方向迈进的同时也推出了Codex CLI智能体以帮助用户执行编程任务。