跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

NLP工程化

达摩院开源了一个从在线教学视频中提取的多模态数据集

上午8时 2025/01/17 作者 NLP工程化

达摩院发布多模态数据集,包含650万张图片和8亿文本,来自2.2万小时在线教学视频,涵盖数学、物理、化学等基础学科。

分类 开源 标签 2.2万小时在线教学视频、 650万张图片、 多个基础学科领域、 多模态数据集、 视觉-语言预训练语料库、 达摩院 3 条评论

腾讯推出的SVFR:通用视频人脸修复的统一框架

上午8时 2025/01/17 作者 NLP工程化

本文提出了一种新的方法SVFR,用于广义视频人脸恢复任务,通过集成视频BFR、修复和着色任务来提高恢复质量和时间稳定性。

分类 开源 标签 GVFR、 PSNR、 任务嵌入、 稳定视频人脸恢复、 统一框架、 统一潜在正则化 2 条评论

ComfyUI-TeaCache:集成了 TeaCache 的 ComfyUI 插件

上午8时 2025/01/16 作者 NLP工程化

ComfyUI-TeaCache 是一个集成 TeaCache 的 ComfyUI 插件,用于加速图像、视频和音频扩散模型的推理过程,支持多种模型并提供简单安装方法和推荐配置。

分类 开源 标签 TeaCache、 作者未提及、 加速推断、 扩散模型、 技术支持、 知识星球 发表评论

南京大学编译原理课程课件

上午8时 2025/01/16 作者 NLP工程化

南京大学魏恒峰教授编译原理课程课件及教学视频介绍,可参考文献,欢迎支持作者的知识星球。

分类 开源 标签 GitHub、 NLP工程化、 南京大学、 受学生好评、 编译原理、 魏恒峰 发表评论

assistant-ui:一个为AI聊天设计的React组件库

上午8时 2025/01/16 作者 NLP工程化

一个为AI聊天设计的React组件库,支持多种AI模型,简化聊天应用开发过程。

分类 开源 标签 AI模型接口、 Assistant UI、 NLP工程化、 ReAct、 知识星球、 简化难度 发表评论

Agentarium 是一个基于 Python 的开源框架,旨在简化 Agents 的管理和编排

上午8时 2025/01/15 作者 NLP工程化

Agentarium 是一个基于 Python 的开源框架,用于简化 Agents 的管理和编排,支持在模拟环境中进行交互、决策和学习。

分类 开源 标签 Agentarium GitHub、 Python、 Thytu、 多Agents互动、 简化Agents管理、 行为学习 发表评论

超全的开源提示词网站,还分门别类的进行了整理

上午8时 2025/01/15 作者 NLP工程化

超全的开源提示词网站整理并分类展示,附带参考文献和支持知识星球链接

分类 开源 标签 https://github.com/f/awesome-chatgpt-prompts、 https://prompts.chat/、 互联网文章、 分门别类的提示词库、 开源提示词网站、 未指定作者 发表评论

Gemini Search 是一个开源的 Perplexity 风格的搜索引擎

上午8时 2025/01/15 作者 NLP工程化

Gemini Search 是一个基于 Gemini 2.0 Flash 模型的开源 Perplexity 风格搜索引擎,提供实时网络资源和引文驱动的问题答案。

分类 开源 标签 Gemini Search、 Google、 Marco M. Magdon-Ismail、 Perplexity风格模型、 人工智能驱动的搜索引擎、 开源搜索引擎 发表评论

整理和提供用于构建通用语音、音频和音乐基础模型的数据集列表

上午8时 2025/01/14 作者 NLP工程化

整理和提供了用于构建通用语音、音频和音乐基础模型的数据集列表及其元数据和获取途径,来自sarulab-speech/audio-foundation-model-dataset GitHub。

分类 开源 标签 sarulab-speech/audio-foundation-model-dataset、 数据集、 整理与分享、 语音、 音乐、 音频 发表评论

英伟达开源的一款智能文档信息提取及结构化工具:nv-ingest

上午8时 2025/01/14 作者 NLP工程化

英伟达开源工具nv-ingest能高效处理大规模PDF、Word、PPT及图像文档,支持多文档同时处理和内容类型识别。

分类 开源 标签 nv-ingest、 Word和PPT文件、 大规模PDF、 文档处理与结构化、 英伟达、 表格 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面58 页面59 页面60 … 页面69 下一页 →

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Manus Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

近期文章

  • Claude Code 首席工程师揭秘 AI 如何重塑开发日常!
  • 对话智源王仲远:具身智能“小组赛”才刚刚开打,机器人需要“安卓”而非 iOS
  • 中外六大AI出战高考作文!实测结果出炉
  • 他山科技开源触觉模拟仿真,引领机器人触觉技术迭代方向
  • 成立四个月获三轮融资?机器人触觉技术研发商「猿声科技」完成新一轮战略融资

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 6 月
一 二 三 四 五 六 日
 1
2345678
9101112131415
16171819202122
23242526272829
30  
« 5 月    

归档

  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×