分享
“动动嘴”就能编辑图像,豆包悄咪咪上线了这个超实用的新功能。
使用国产大模型豆包进行图像编辑时意外发现新功能——通过语音指令实现‘用嘴改图’,无需涂抹区域。该功能可直接上传图片并根据提示快速生成修改后的版本。
微软Ignite 2024:建立一个Agentic世界!
在今年的Microsoft Ignite 2024上,企业通过Copilot Studio创建了数万智能体,并且可以使用Azure目录中的1800个LLM模型。微软还宣布将在Microsoft 365中引入新的智能体,包括用于项目管理的新项目经理智能体、协作会议中的新Facilitator智能体、帮助员工理解和分享知识的Agent以及提供自助服务支持的员工自助服务智能体。
o1圈杀疯了,阿里又开源Marco-o1
阿里开源Marco-o1,旨在解决缺乏明确标准且奖励难以量化的开放式问题。Marco-o1结合链式思考、蒙特卡洛树搜索等技术增强推理能力,在MGSM上提高了准确性,并展示了扩展解决方案空间和利用更细粒度动作策略的优势。
NeurIPS’24|VL-SAM:北大出品,完全无训练的开放式检测分割模型
北大团队提出VL-SAM,结合视觉-语言模型和Segment-Anything模型,通过注意力图作为提示解决开放式物体检测与分割任务,性能在LVIS和CODA数据集上良好。