这样看文献,一天不得20篇?智谱亮出论文杀手锏!导师:活久见了
AI领域科研人员面临背景知识缺失、长难句和复杂图表理解困难等问题。智谱推出GLM-Realtime、GLM-4-Air、GLM-4V-Plus等免费工具解决这些问题,提高论文阅读效率和准确性。
AI领域科研人员面临背景知识缺失、长难句和复杂图表理解困难等问题。智谱推出GLM-Realtime、GLM-4-Air、GLM-4V-Plus等免费工具解决这些问题,提高论文阅读效率和准确性。
Grok APP版在苹果App Store上线,凭借逼真图像生成和推理能力迅速成为生产力应用中的明星。尽管存在一些槽点,如对某些问题的回答错误、文本重复等,但其总体表现仍获好评。
何恺明团队入驻MIT后公布的研究成果包括使用连续标记的Fluid模型刷新FID和GenEval分数的文本到图像生成,以及跨不同机器人的异构预训练架构HPT。博士生邓明扬在竞赛中表现出色,黎天鸿负责表示学习和生成模型研究,并担任ICLR 2025区域主席。团队还包括白行健和Jake Austin等成员。
OmniControl 是一个最小但功能强大的通用控制框架,通过提供素材图生成图片,融合效果一般。它支持主题驱动控制和空间控制等特性,并且提供了快速开始指南及示例使用方法。
Luma AI 发布的视频模型Dream Machine支持图文结合生成视频,并且提供风格参考和角色参考等功能,让创作过程更加直观和可控。
使用国产大模型豆包进行图像编辑时意外发现新功能——通过语音指令实现‘用嘴改图’,无需涂抹区域。该功能可直接上传图片并根据提示快速生成修改后的版本。
mistral.ai发布了124B参数的Pixtral Large多模态模型及AI助手le Chat,支持网页搜索、Canvas编辑、文档理解等能力,并在数学推理任务上超过其他模型。