视觉感知归档

等到了！VLM-R1完整细节首度公开：RL的一小步，视觉语言模型推理的一大步

下午4时 2025/04/25 作者 PaperWeekly

VLM-R1 是一个专注于视觉感知任务的强化学习模型，它通过引入格式奖励和准确率奖励机制，在Referring Expression Compression和Open-Vocabulary Object Detection两个任务上取得了显著优势。论文详细解释了其技术细节，并展示了在大规模模型中的泛化能力和潜力。

OpenAI深夜发布满血o3和o4mini: 两个没想到

上午11时 2025/04/17 作者 AI寒武纪

OpenAI发布o3和o4-mini模型，具备连续调用超过600次工具的能力，超越人类工程师。主要特点包括全面工具访问与推理能力、图像推理能力的突破以及主动式工具使用。

深圳围绕具身智能与机器人要搞大动作了

下午4时 2025/03/04 作者机器人大讲堂

展智能科技有限公司、乐聚（深圳）机器人技术有限公司和深圳逐际动力科技有限公司，与企业负责人深入交流，

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30