北航推出TinyLLaVA-Video,有限计算资源优于部分7B模型,代码、模型、训练数据全开源

北京航空航天大学团队发布小尺寸简易视频理解框架TinyLLaVA-Video,其参数量不超过4B,在多个视频理解基准上优于7B以上模型。该项目开源模型权重、训练代码和数据集,并支持模块化设计和自定义训练策略,降低研究门槛。

ICLR 2025 性能与效率的更优平衡!哈工深等提出极性感知线性自注意力机制

哈工大深圳、鹏城实验室和昆士兰大学合作提出了一种极性感知线性自注意力机制(Polarity-aware Linear Attention),解决了现有方法在保证注意力分数正值性时会忽视掉 Q,K 矩阵中的负值元素的问题,并在多个视觉任务上取得了精度与效率的平衡。

飞书接入DeepSeek-R1后,用一次顶一万次,而且再也不「服务器繁忙」了

文章介绍了DeepSeek-R1在多种场景下的应用案例,包括办公软件接入、文档处理、商品名称生成、文案写作和AI算命等。飞书通过整合DeepSeek-R1实现了便捷高效的多任务处理,并分享了使用教程。

ICML 2025杀疯了!

ICML投稿创纪录,咕泡科技提供一站式论文辅导服务。随着学术竞争加剧,高质量论文成为保研、申博和就业的重要凭证。咕泡科技汇聚顶尖导师资源,覆盖AI全方向和交叉学科,从选题到发表全程指导,助力学员克服挑战,提升论文质量与发表成功率。