全球首个端侧全模态理解模型:Megrez-3B-Omni,能同时处理图片、音频、文本
Megrez-3B-Omni是无问芯穹研发的端侧全模态理解模型,基于Megrez-3B-Instruct扩展,在图像、语音和文本领域均取得最优精度。
Megrez-3B-Omni是无问芯穹研发的端侧全模态理解模型,基于Megrez-3B-Instruct扩展,在图像、语音和文本领域均取得最优精度。
苹果计划推出一款名为iPhone 17 Air的新机型,旨在填补中端市场轻薄设计与性能之间的空白。该产品预计将配备6.6英寸超高清显示屏、极窄边框和屏下Face ID功能,并可能采用全新的摄像头模组配置,支持ProMotion刷新率。
自GPT问世以来,AI技术快速发展。百度、字节、腾讯等巨头纷纷入局并落地AI应用,让大模型应用开发工程师成为炙手可热的岗位,甚至有60k*16高薪职位等待挖掘。知乎知学堂推出就业速成计划,帮助IT人掌握大模型技术,规划职业发展路径,享受AI带来的红利。
Robo Blogger是一款智能工具,能够将语音内容自动转化为结构化的专业博客文章,并支持引用参考资料和定制文章结构。适用于技术、生活随笔等场景,极大提升写作效率。
字节最新发布的INFP是一款新颖的声控头部生成框架,支持双边互动。它能够根据输入的双轨道音频实时生成虚拟头像,并实现角色自动切换、高度真实的表情与动作同步等特性。
OpenAI发布多项新产品和功能,包括全新推理模型o1、Pro订阅服务、Sora视频生成器、ChatGPT Canvas协作工具等。此外还增加了搜索功能、语音模式和电话服务,并发布了多个开发者工具更新。
清华大学AgentLand实验室举办Agent游戏工作坊,征集AI Agent游戏原型。活动涵盖线上投稿、线下试玩会和颁奖典礼,提供丰厚奖品及技术支持。