刚刚,「吉卜力狂欢」GPT-4o功臣被挖走!华南理工女学霸曾与奥特曼同台
OpenAI研究科学家Lu Liu和Allan Jabri跳槽Meta引发关注,两人曾主导GPT-4o多模态研究。此次挖角凸显OpenAI人才流失危机,Meta集结多位大牛或影响未来AI竞争格局。
OpenAI研究科学家Lu Liu和Allan Jabri跳槽Meta引发关注,两人曾主导GPT-4o多模态研究。此次挖角凸显OpenAI人才流失危机,Meta集结多位大牛或影响未来AI竞争格局。
17岁少女汉娜·凯罗推翻了Mizohata-Takeuchi猜想,这一成果震惊学术界。张瑞祥教授在她完成导师家庭作业时提供的一道题激发了她的研究兴趣,并最终成功证明该猜想不成立。
新智元报道
UC伯克利和香港大学团队的新工作LIFT首次系统性地剖析了冻结大语言模型作为文本编码器在多模态对齐中的优势来源、数据适配性和关键设计选择,显著提升了组合语义理解能力和长文本处理效果。
一位亚洲硕士拥有两篇顶会一作和高GPA(3.3),网友求教如何申请全球TOP 20博士项目,专家建议通过导师关系和论文发表来提升竞争力。
UC伯克利开发出仅需5000美元的人形机器人BHL,具有低门槛、全开源和可灵活修改三大优势。该机器人的关键组件采用3D打印技术制作,并结合了多种先进技术以提高性能和鲁棒性。
UC伯克利研究者提出”睡眠时计算”技术,让AI模型在空闲时间提前思考,从而提升推理效率。通过减少测试时计算量和降低查询成本,模型可在保持准确率的同时,大幅减少资源消耗。
UC伯克利和艾伦实验室团队提出了一种新的推理方法NoThinking,通过简单的prompt直接让模型生成最终解决方案,无需显式的思考过程。结果显示,在低资源情况下,NoThinking方法在多个任务上的表现优于传统Thinking方法,并且具有更高的效率。
英伟达等机构发布首个多模态模型DAM,仅3B参数即可精准描述图像和视频中的任何细节。通过焦点提示和局部视觉骨干网络创新,生成更详细、准确且连贯的描述。
研究提出「描述一切模型」(DAM),能生成图像或视频中特定区域的详细描述。用户可通过点、框等方式指定区域,DAM则提供丰富的上下文描述。此模型在多个任务中均表现优异,并支持多粒度输出。