跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

语言模型

大模型是否有自知之明?新研究发现LLM可以知晓自己的知识范围

下午4时 2025/03/01 作者 机器之心

识」?对于这个问题,目前还没人能给出非常确切的答案,但近日 Chandar Research Lab

分类 学术、 资讯 标签 不确定性和困惑、 反思、 学习后扩展、 模糊不清回答、 知识范围、 语言模型 发表评论

刚刚,GPT-4.5问世!OpenAI迄今最大、最贵模型,API价格飞涨30倍,不拼推理拼情商

下午12时 2025/02/28 作者 机器之心

开始了直播,奥特曼并没有现身。直播不到 15 分钟就匆匆结束了。
OpenAI 正式发布了其最大、

分类 学术、 资讯 标签 GPT-4.5、 OpenAI、 幽默感、 理解上下文、 生成内容、 语言模型 发表评论

DeepSeek-R1自写CUDA内核跑分屠榜!斯坦福学霸狂飙GPU编程自动化挑战人类

下午4时 2025/02/27 作者 新智元

定义CUDA内核,完爆了o1和Claude 3.5 Sonnet,拿下总排名第一。虽然目前只能在不到

分类 资讯 标签 KernelBench、 OpenAI、 内核优化、 少样本调整、 机器学习代码、 语言模型 发表评论

全球首个混合推理模型:Claude 3.7 Sonnet来袭,真实编码力压一切对手

下午4时 2025/02/25 作者 机器之心

不过并不是期待中的 Claude 4.0,而是 3.7 Sonnet 版本。
图源:https://

分类 学术、 资讯 标签 Anthropic、 Claude 3.7 Sonnet、 Claude Code、 代理工作流程、 语言模型、 负责任扩展策略 发表评论

浙大开源的一个专门用于表格数据处理的语言模型:TableGPT2

上午8时 2025/02/25 作者 NLP工程化

浙大开源表格数据处理语言模型TableGPT2,支持不规则表格和模糊查询,提供7B、72B两个版本,已在GitHub上开源。

分类 开源 标签 7B版本、 TableGPT2、 企业级BI、 实际场景、 浙江大学、 语言模型 发表评论

一个基于AI可从任意文本中提取知识图谱的工具:kg-gen

上午8时 2025/02/21 作者 NLP工程化

kg-gen是一款基于AI的工具,可以从任意文本中提取知识图谱,支持长短文本处理及对话消息,具备实体和关系聚类、图谱合并等功能。

分类 开源 标签 FukkenLab、 KGGen工具、 图谱合并、 对话消息、 知识图谱、 语言模型 发表评论

这届出题太难了!新基准让多模态模型集体自闭,GPT-4o都是零分

下午12时 2025/02/18 作者 机器之心

o、Gemini 2 Flash 等等……
但这些大模型,遇到一个名为「ZeroBench」的视觉基

分类 学术、 资讯 标签 ZeroBench、 合成图像、 自然图像、 视觉问题、 语言模型、 难度区分 发表评论

ICLR 2025|如何在ImageNet-1K上训练视觉基础模型?

下午11时 2025/02/13 作者 极市干货

练就可以在多项任务上达到跟别人所提供的预训练模型相当的性能。
>>
加入极市CV技术交流群,走在计算

分类 学术 标签 扩散模型、 极市AI社区、 深度学习、 计算机视觉、 语言模型、 迁移学习 发表评论

Andrej Karpathy 带你扒 ChatGPT 老底:LLM 技术、认知与未来的深度解读

下午2时 2025/02/07 作者 子非AI

们就跟着 AI 大佬 Andrej Karpathy 一起,扒一扒 ChatGPT 背后的“秘密武器

分类 分享 标签 GPT-2、 Transformer、 伦理问题、 多模态交互、 深度学习、 语言模型 发表评论

DeepSeek-R1直接把提示工程师的饭碗整没了

下午10时 2025/01/29 作者 PaperAgent

DeepSeek-R1不再接受复杂的提示工程,改用简洁的大白话描述目标。同时公布了关于其安全使用的建议和部署策略。

分类 分享 标签 DeepSeek-R1、 安全使用、 安全性、 无需提示工程、 语言模型、 阿里巴巴云 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面3 页面4 页面5 页面6 下一页 →

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Manus Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

近期文章

  • 干货满满!图灵奖学术大牛和宇树、智谱等明星AI企业齐聚,探讨AI产业新风向
  • “AGI 五年内或将实现”:AI 教父 Bengio 呼吁中美达成共识,警惕 AI 沦为人类武器
  • 深夜突袭!谷歌Gemini 2.5 Pro更新蝉联榜一:推理超越o3,编程超越opus4
  • 强化学习之父Richard Sutton:人类数据耗尽,AI正在进入“经验时代”!
  • 免费约饭!美国CVPR 2025,相聚人才晚宴

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 6 月
一 二 三 四 五 六 日
 1
2345678
9101112131415
16171819202122
23242526272829
30  
« 5 月    

归档

  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×