跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

NLP工程化

CoGenAV 的核心理念是让 AI 模型也实现“音画同步”的深度理解

上午8时 2025/05/29 作者 NLP工程化

CoGenAV 框架结合 ResNet 3D CNN 和 Transformer 编码器提取音视频特征,并通过对比生成同步训练提升模型理解能力,实现‘听清+看懂’多模态理解。

分类 开源 标签 CoGenAV、 ResNet3D、 Seq2Seq Contrastive Learning、 Transformer、 对比生成同步训练、 预训练ASR 发表评论

Telegram Search:一个功能强大的Telegram聊天记录搜索客户端

上午8时 2025/05/29 作者 NLP工程化

Telegram Search:支持向量搜索和语义匹配的聊天记录搜索客户端,提供备份功能和智能检索技术。

分类 开源 标签 OpenAI技术、 Telegram、 向量搜索、 搜索功能、 精准搜索、 语义匹配 发表评论

Awesome-Diffusion-LLM:为扩散大语言模型研究者提供一站式资源

上午8时 2025/05/29 作者 NLP工程化

Awesome-Diffusion-LLM为扩散大语言模型研究者提供最新论文、教程和代码资源,持续更新中。

分类 开源 标签 commit_frequency_19、 Diffusion Language Model、 yczhou001、 代码片段、 教程、 论文列表 发表评论

WeChatPadPro 是基于 WeChat Pad 的高级微信管理工具

上午8时 2025/05/29 作者 NLP工程化

WeChatPadPro 提供自动抢红包、消息防撤回、好友管理等丰富的微信功能控制命令。

分类 开源 标签 WeChatPadPro、 好友管理、 朋友圈互动、 消息防撤回、 群管理操作、 自动抢红包 发表评论

go 写的操作文件系统的 MCP Server:mcp-filesystem-server

上午8时 2025/05/28 作者 NLP工程化

通过MCP可以操作本地文件系统,由Go编写的MCP Server在多种架构上都能运行。

分类 开源 标签 GitHub、 Go语言、 Mark3Labs、 MCP、 操作系统、 跨平台 发表评论

QwenLong-L1:迈向具备长上下文推理能力的大型语言模型的强化学习方法

上午8时 2025/05/28 作者 NLP工程化

本文提出了一种强化学习框架QwenLong-L1,旨在提升大语言模型在长上下文中的泛化能力,并通过逐步扩展上下文长度、混合奖励函数等方法实现这一目标。

分类 开源 标签 DAPO、 GRPO、 QwenLong-L1、 大语言模型、 强化学习框架、 精确率与召回率 发表评论

字节Dolphin:多模态文档图像解析模型

上午8时 2025/05/28 作者 NLP工程化

Dolphin 是一种新颖的多模态文档图像解析模型,采用‘分析后解析’范式,通过两阶段方法高效处理文本段落、图表、公式和表格等交织内容,实现了卓越的解析效率。

分类 开源 标签 Dolphin、 MBart、 Swin Transformer、 Transformers、 多模态文档图像解析、 高效并行解析 发表评论

App Runner和Task Pipeline中的数据库连接管理指南

上午8时 2025/05/28 作者 NLP工程化

文章讨论了Flask-Sqlalchemy在App Runner和任务管道中的数据库操作连接管理问题,并提出通过及时关闭连接解决长时间运行任务占用数据库连接的问题。

分类 开源 标签 Flask-Sqlalchemy、 分离错误、 及时关闭连接、 合理利用资源、 连接池策略、 高并发 发表评论

从零开始打造一切来掌握机器学习

上午11时 2025/05/27 作者 NLP工程化

通过github.com/amitshekhariitbhu/build-your-own-x-machine-learning项目掌握机器学习全貌

分类 开源 标签 Amitshekhariitbhu / Build Your Own X Machine Learning GitHub项目、 大语言模型、 机器学习算法、 深度学习、 线性回归、 阿米特·谢卡 发表评论

微软开源的AI数据可视化工具——data-formulator

上午8时 2025/05/27 作者 NLP工程化

微软开源工具SuperSet简化数据可视化和AI辅助SQL编写

分类 开源 标签 AI辅助SQL生成、 Data Formulator、 微软、 数据可视化工具、 用户交互、 自然语言处理 发表评论
较早文章
页面1 页面2 … 页面67 下一页 →

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Manus Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

近期文章

  • 重磅!Telegram官宣Grok将登陆!Ton应声暴涨16%
  • OpenMemory MCP:大模型的记忆中枢
  • CoGenAV 的核心理念是让 AI 模型也实现“音画同步”的深度理解
  • Telegram Search:一个功能强大的Telegram聊天记录搜索客户端
  • Awesome-Diffusion-LLM:为扩散大语言模型研究者提供一站式资源

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 5 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 4 月    

归档

  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×