大模型是否有自知之明?新研究发现LLM可以知晓自己的知识范围 下午4时 2025/03/01 作者 机器之心 识」?对于这个问题,目前还没人能给出非常确切的答案,但近日 Chandar Research Lab
刚刚,GPT-4.5问世!OpenAI迄今最大、最贵模型,API价格飞涨30倍,不拼推理拼情商 下午12时 2025/02/28 作者 机器之心 开始了直播,奥特曼并没有现身。直播不到 15 分钟就匆匆结束了。 OpenAI 正式发布了其最大、
DeepSeek-R1自写CUDA内核跑分屠榜!斯坦福学霸狂飙GPU编程自动化挑战人类 下午4时 2025/02/27 作者 新智元 定义CUDA内核,完爆了o1和Claude 3.5 Sonnet,拿下总排名第一。虽然目前只能在不到
全球首个混合推理模型:Claude 3.7 Sonnet来袭,真实编码力压一切对手 下午4时 2025/02/25 作者 机器之心 不过并不是期待中的 Claude 4.0,而是 3.7 Sonnet 版本。 图源:https://
浙大开源的一个专门用于表格数据处理的语言模型:TableGPT2 上午8时 2025/02/25 作者 NLP工程化 浙大开源表格数据处理语言模型TableGPT2,支持不规则表格和模糊查询,提供7B、72B两个版本,已在GitHub上开源。
一个基于AI可从任意文本中提取知识图谱的工具:kg-gen 上午8时 2025/02/21 作者 NLP工程化 kg-gen是一款基于AI的工具,可以从任意文本中提取知识图谱,支持长短文本处理及对话消息,具备实体和关系聚类、图谱合并等功能。
这届出题太难了!新基准让多模态模型集体自闭,GPT-4o都是零分 下午12时 2025/02/18 作者 机器之心 o、Gemini 2 Flash 等等…… 但这些大模型,遇到一个名为「ZeroBench」的视觉基
ICLR 2025|如何在ImageNet-1K上训练视觉基础模型? 下午11时 2025/02/13 作者 极市干货 练就可以在多项任务上达到跟别人所提供的预训练模型相当的性能。 >> 加入极市CV技术交流群,走在计算
Andrej Karpathy 带你扒 ChatGPT 老底:LLM 技术、认知与未来的深度解读 下午2时 2025/02/07 作者 子非AI 们就跟着 AI 大佬 Andrej Karpathy 一起,扒一扒 ChatGPT 背后的“秘密武器
DeepSeek-R1直接把提示工程师的饭碗整没了 下午10时 2025/01/29 作者 PaperAgent DeepSeek-R1不再接受复杂的提示工程,改用简洁的大白话描述目标。同时公布了关于其安全使用的建议和部署策略。