跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

NLP工程化

字节放出了:DreamO,统一图像定制框架

2025年5月14日8时 作者 NLP工程化

字节发布DreamO图像定制框架,支持换装、换脸、虚拟试穿等功能,适用于多种场景应用。

分类 开源 标签 四个能力、 图像定制框架、 字节跳动、 统一的图像处理任务、 虚拟试穿、 风格迁移 发表评论

阿里的移动端多模态大模型APP – MNN 又更新了

2025年5月14日8时 作者 NLP工程化

阿里的MNN移动端多模态大模型APP更新支持Qwen-2.5-omni-3b和7b,可以实现文本到文本、图像到文本等多种生成任务,提供速度优化的开发参考。

分类 开源 标签 GitHub、 MNN、 多模态模型、 文本到图像、 移动端大模型、 阿里巴巴 发表评论

使用Huggingface SmolVLM 和gglm llama.cpp 的实时摄像头AI识别演示

2025年5月14日8时 作者 NLP工程化

实时摄像头AI识别演示使用Huggingface SmolVLM和gglm llama.cpp,参考文献详述。

分类 开源 标签 500、 gglm、 llama.cpp、 ngxson、 SmolVLM、 实时摄像头AI识别 发表评论

Seed1.5-VL:一款强大的视觉-语言基础模型

2025年5月14日8时 作者 NLP工程化

Seed1.5-VL是专为通用多模态理解和推理设计的视觉-语言基础模型,仅用5.32亿视觉编码器和200亿参数的MoE LLM实现顶尖性能,在60个公共基准测试中有38项达到最佳水平。

分类 开源 标签 ByteDance、 LLM、 Seed1.5-VL、 公众基准测试、 复杂任务、 视觉-语言模型 发表评论

Cactus:让移动设备和可穿戴设备轻松运行AI模型的框架

2025年5月14日8时 作者 NLP工程化

Cactus是一款让移动设备和可穿戴设备运行AI模型的框架,支持多种开发平台,具有硬件感知的后端和低内存占用特点。

分类 开源 标签 AI模型运行框架、 Cactus团队、 低内存占用、 阿里云、 高性能、 高效节能 发表评论

IndexTTS-vLLM:让语音合成更快速、更高效

2025年5月14日8时 作者 NLP工程化

IndexTTS-vLLM通过vLLM加速语音合成过程,单个请求RTF从0.3降至0.1,GPT模型decode速度提升至280 token/s,支持多角色音频混合。

分类 开源 标签 0.1秒、 280 token/s、 IndexTTS-vLLM、 Ksuriuri、 显著提升、 语音合成技术 发表评论

COS:用 C 语言编写的微型 x86_64 操作系统

2025年5月13日8时 作者 NLP工程化

COS是一个用C语言编写的微型x86_64操作系统项目,目标是在最短的时间内实现系统调用和抢占式调度,目前有3000行代码,实现了中断处理、物理内存分配、可执行文件加载等功能。

分类 开源 标签 3000行代码、 C语言、 iyush、 x86_64、 抢占式调度、 操作系统 发表评论

unsloth 量化版本 Qwen3

2025年5月13日8时 作者 NLP工程化

同学使用的新版unsloth量化版本Qwen3已发布,社区反馈写代码和翻译质量有所提升。

分类 开源 标签 Hugging Face、 Qwen3、 代码编写、 开源模型、 知识星球、 翻译质量 发表评论

DeepSite (用AI在线生成前端页面) 的开源替代——LocalSite-ai

2025年5月13日8时 作者 NLP工程化

这个项目支持在线预览前端页面、所见即所得编辑,并且兼容多个AI API提供商及响应式设计。

分类 开源 标签 AIAPI、 GitHub、 stars_count、 weise25、 响应式设计、 所见即所得 发表评论

开源RAG平台——agentset

2025年5月13日8时 作者 NLP工程化

这是一个支持混合搜索和重新排序的平台,内置引用功能以告知结果来源,并提供辅助检查错误或幻觉的功能。

分类 开源 标签 50%、 AgentSet、 引用功能、 搜索引擎、 混合搜索、 重新排序技术 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面14 页面15 页面16 … 页面73 下一页 →

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Manus Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • 不需要RAG!在30分钟内构建一个问答AI智能体。万字长文,先收藏再看!
  • Kimi-Dev:强大的开源编程LLM,助力软件开发任务
  • SongGeneration:腾讯AI实验室推出的高质量歌曲生成项目
  • OpenDeRisk:AI原生风险智能管理系统,为你的应用系统提供7×24小时全面深度保护
  • MiniMax-M1:全球首个开源权重的大规模混合注意力推理模型,专为处理长输入和复杂任务而生

2025 年 6 月
一 二 三 四 五 六 日
 1
2345678
9101112131415
16171819202122
23242526272829
30  
« 5 月    

归档

  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×