分享 – 第 45 页

发布即开源，又一大厂入局 AI 视频生成

下午4时 2024/12/03 作者特工宇宙

腾讯混元发布视频生成大模型并开源，参数量达130亿，支持多角度切换和流畅动作。该模型在文本视频一致性、运动质量和画面质量等方面表现领先，并且已在官网、代码库及Hugging Face上公开。

下午4时 2024/12/03 作者硅谷科技评论

2023年年底，
萨姆·奥特曼的阅读清单
在硅谷掀起了一股热潮，成为创始人、投资人和科技爱好者们热议

下午4时 2024/12/03 作者数字生命卡兹克

腾讯混元发布视频生成模型HunyuanVideo，宣布开源。模型具有超强的真实质感、很强的语义理解能力和切换镜头功能，被评为当前顶尖水平。

下午1时 2024/12/03 作者 PaperAgent

本文综述了LLM驱动的GUI智能体的发展和进步，讨论了它们的历史演变、核心组件和技术，并展示了智能体如何通过自然语言处理技术执行多种任务，包括Word、Photos、浏览器、Adobe Acrobat和PowerPoint操作等。

上午11时 2024/12/03 作者陳寳

李飞飞教授联合创办的世界实验室发布了首个‘空间智能’模型，该模型结合深度学习与计算机图形学实现了逼真的三维场景生成，覆盖影视制作、游戏开发、建筑设计等多个领域，并提出了潜在风险和解决方案。

上午11时 2024/12/03 作者 AI探索时代

AI Agent是让大模型能够与现实世界接触的方法，它结合函数调用、记忆和推理规划能力来完成复杂任务。

下午11时 2024/12/02 作者沃垠AI

历史性进步！现在有AI能够直出中文字幕和标题，支持多种样式和调整功能。

下午8时 2024/12/02 作者特工宇宙

程序员小帅穿越到量子计算机模拟世界AGI之王，召唤六位AI队友完成试炼。他发现这些AI比同事靠谱，开始反思现实问题。使用‘灵魂提取器’生成有趣人设，并借助多模态理解大模型阶跃星辰技术优化体验。

下午7时 2024/12/02 作者 AI好好用

文章介绍了国产和国际大模型在数学题上的表现。经过几个月的努力，国产大模型如Kimi、QwQ-32B-preview等在常规数学题上有所进步，但仍需改进解决实际生活中的数学问题。

下午12时 2024/12/02 作者 PaperAgent

本文综述了卡内基梅隆大学关于RAG（检索增强生成）技术的研究，介绍了其基本原理、架构、应用领域及面临的挑战和发展前景。

较早文章

较新文章