日期: 2025 年 4 月 12 日
阿里巴巴发布FantasyTalking,它可以对角色进行口型同步,并具有逼真的面部和全身动作
阿里巴巴发布FantasyTalking,能够实现角色口型同步,并具备逼真的面部和全身动作,表现优于现有SOTA方法。
字节跳动刚发布 Seed-Thinking-v1.5 的技术细节报告
字节跳动发布Seed-Thinking-v1.5技术细节报告,其性能接近Gemini-2.5-Pro和O3-mini-high水平。
让AI访问微信聊天记录的MCP:chatlog
支持Windows/macOS系统的AI助手MCP:chatlog可从本地微信聊天记录数据库文件中提取数据,提供命令行界面及终端菜单操作,并可通过API访问聊天记录、联系人、群聊和最近会话等信息。
MCP新应用!这个开源神器让网站秒变AI知识库!零代码实现全站内容对话!
SiteMCP是一款GitHub上的开源工具,一键抓取网站内容并转化为MCP服务器,简化了AI处理网站信息的繁琐步骤,特别适合需要快速获取网站知识的用户。
AI编程相关开源数据集资源汇总
Stack Overflow QA Pairs、CodeSearchNet、CodeContests、HumanEval、BigCode Benchmark等数据集汇总,涵盖Python和SQL问题代码对、GitHub代码搜索数据集、机器学习编程数据集等多种类型。
2025年全球AI指数报告
《2025年AI指数报告》指出中美大模型竞赛中美占优但中模正迎头赶上。美国发布40个知名模型,中国15个,欧洲3个(均来自法国)。训练成本升高导致训练数量下降。2025年中国领先美国仅1.7%。中美合作开发的DeepSeek公司以600万美元训练出竞争力大模型震动金融市场。报告发现大多数大模型成本下降、能源效率提升及AI对人类工作产生潜在威胁,但多数人对未来持乐观态度。
CVPR 2025|突破边界:3D视觉分割的创新之路
COB-GS通过联合优化语义和视觉信息,显著提高了3D分割精度及对不准确掩模的鲁棒性。该方法在保持高视觉质量的同时产生清晰边界,适用于现实世界的复杂场景。