跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

NLP工程化

阿里巴巴发布FantasyTalking,它可以对角色进行口型同步,并具有逼真的面部和全身动作

2025年4月12日8时 作者 NLP工程化

阿里巴巴发布FantasyTalking,能够实现角色口型同步,并具备逼真的面部和全身动作,表现优于现有SOTA方法。

分类 开源 标签 FantasyTalking、 OmniHuman-1、 SOTA方法、 口型同步、 逼真面部和全身动作、 阿里巴巴 发表评论

字节跳动刚发布 Seed-Thinking-v1.5 的技术细节报告

2025年4月12日8时 作者 NLP工程化

字节跳动发布Seed-Thinking-v1.5技术细节报告,其性能接近Gemini-2.5-Pro和O3-mini-high水平。

分类 开源 标签 DeepSeek-R1、 Gemini-2.5-Pro、 o3-mini-high、 Seed-Thinking-v1.5、 字节跳动、 强化学习 发表评论

让AI访问微信聊天记录的MCP:chatlog

2025年4月12日8时 作者 NLP工程化

支持Windows/macOS系统的AI助手MCP:chatlog可从本地微信聊天记录数据库文件中提取数据,提供命令行界面及终端菜单操作,并可通过API访问聊天记录、联系人、群聊和最近会话等信息。

分类 开源 标签 github.com/sjzar、 MacOS、 sjzar、 Windows、 微信3.x/4.0版本、 支持查询 发表评论

AI-Scientist-v2:AI驱动的自动化科学发现系统,助力科学研究迈向新高度

2025年4月11日8时 作者 NLP工程化

AI-Scientist-v2:一个利用AI驱动的自动化系统,显著提升科学研究效率,包括自动生成论文并被学术会议接受、跨领域探索及消除对人工模板依赖等。

分类 开源 标签 Agent tree search、 AI-Scientist-v2、 ICLR 2025、 SakanaAI、 学术研究、 论文提交 发表评论

OmniSVG:一个强大的矢量图形生成模型,能将文字描述瞬间转化为复杂精美的SVG图像

2025年4月11日8时 作者 NLP工程化

OmniSVG是一款强大的矢量图形生成模型,支持从简单图标到复杂动漫角色的多样化生成,采用预训练视觉语言模型,效果细腻逼真。

分类 开源 标签 OmniSVG、 复杂动漫角色、 多样化生成能力、 多种数据集、 细腻逼真效果、 预训练视觉语言模型 发表评论

MCP Server 实现了 Notion API, 包括获取post内容,评论,搜索等

2025年4月11日8时 作者 NLP工程化

MCP Server 实现了对 Notion API 的支持,包括获取 post 内容、评论和搜索等功能。

分类 开源 标签 MCP Server、 Notion API、 内容获取、 团队实现、 搜索支持、 评论功能 发表评论

DeepCoder-14B-Preview 一个完全开源的代码模型

2025年4月10日8时 作者 NLP工程化

DeepCoder-14B-Preview:一个完全开源的代码模型,与 o3-mini 相当,数据集、代码和训练日志已公开,可于Together AI试用。

分类 开源 标签 14B、 DeepCoder-14B-Preview、 O3-mini、 代码模型、 代码能力相当、 完全开源 发表评论

一款高颜值且功能强大的 AI 助手应用:5ire

2025年4月10日8时 作者 NLP工程化

支持多种AI模型和工具接入,提供本地知识库、API使用分析等特性,兼容Windows/macOS/Linux系统。

分类 开源 标签 AI模型、 GitHub、 MCP协议、 nanbingxyz、 操作系统、 本地嵌入模型 bge-m3 发表评论

英伟达官宣开源「超大杯」Llama Nemotron推理模型

2025年4月10日8时 作者 NLP工程化

英伟达发布开源Llama Nemotron模型,参数量为253B,在多项基准测试中性能超越两款405B参数的Llama模型。

分类 开源 标签 128Ktoken、 仅用一半参数实现接近4倍的性能提升、 多项基准测试中取得SOTA结果、 深度学习模型(Llama-3.1-Nemotron-Ultra-253B-v1)、 英伟达、 超大杯推理模型 发表评论

AI 代码模型Cogito v1 Preview开源

2025年4月10日8时 作者 NLP工程化

AI代码模型Cogito v1 Preview开源,包含5种规格的大型语言模型,其中70B模型表现超越最新发布的Llama 4 109B MoE模型。

分类 开源 标签 70B模型、 Alibaba Cloud、 Cogito v1 Preview、 DeepCognito、 Fireworks AI、 编码用例 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面27 页面28 页面29 … 页面74 下一页 →

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM MCP Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • 首个「万亿级时间点」预训练,清华发布生成式时序大模型日晷 ICML Oral
  • Andrej Karpathy最新演讲刷屏:软件 3.0 时代已经到来!
  • 31岁程序员搞副业,6个月喜提8000万刀退休金!氛围编程公司被光速收购
  • 埃夫特董事长游玮:推动具身智能及机器人技术在更多领域的应用
  • Code is cheap. Show me the chat.

2025 年 6 月
一 二 三 四 五 六 日
 1
2345678
9101112131415
16171819202122
23242526272829
30  
« 5 月    

归档

  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×