typed-ffmpeg:为Python开发者提供现代、易用的FFmpeg封装库
typed-ffmpeg是为Python开发者设计的现代、易用的FFmpeg封装库,支持304次提交的滤镜,提供JSON序列化和图形化滤镜图等特性。
“数据要素×”安徽分赛高校宣讲走进中科大,气象服务与低空经济赛道引发热烈反响
安徽省数据资源管理局指导的大赛在中科大举行,介绍气象服务和低空经济两大赛道。现场吸引了百余名青年学子,宣讲会强调了赛事的重要性、目标以及赛道方向。
光伏热斑AI精准诊断,极视角无人机算法重塑光伏场站巡检效率
光伏热斑AI精准诊断,无人机算法大幅提升光伏场站巡检效率。极视角与行业头部企业合作,利用无人机的灵活性和AI视觉算法的准确性,有效检测并报警组件中的热斑隐患,提升运维效能。
ICLR 2025|一个 Transformer 统一多模态理解和生成!Show-o:LLM 自回归做理解,MaskGIT做生成
生成任务相统一的Transformer模型
Show-o,它通过结合自回归和离散扩散建模,创新性地用
小米又发新模型!MiMo-VL多模态模型开源,仅7B参数部分性能直逼R1、o3-mini
小米大模型Core团队推出多模态开源模型MiMo-VL-7B系列,该模型在视觉理解和推理任务中表现出色,并在多个数学竞赛中超越了Qwen2.5-VL-7B和DeepSeek等同级别模型。
字节开源多模态理解与生成统一模型,对视觉的理解到达开源顶峰,AI图片编辑能力超强。
字节跳动开源多模态模型BAGEL,支持图像生成、修改及动态变化理解。具备聊天、生成图片、编辑图片、风格转换和导航等能力。