视频大模型无损提速:删除多余token,训练时间减少30%,帧率越高效果越好 NeurIPS
卡内基梅隆大学提出了一种新的视频大模型加速方法Run-Length Tokenization(RLT),通过将连续相同的图像块合并为一个token,使得Transformer的视频处理速度大幅提升。精度几乎没有损失的前提下,训练时间可缩短30%,推理阶段提速率可达67%。
卡内基梅隆大学提出了一种新的视频大模型加速方法Run-Length Tokenization(RLT),通过将连续相同的图像块合并为一个token,使得Transformer的视频处理速度大幅提升。精度几乎没有损失的前提下,训练时间可缩短30%,推理阶段提速率可达67%。
2024年11月,长三角(芜湖)算力算法创新应用大赛在芜湖成功举办,吸引了国内外596支团队参赛。芜湖市政府主办,并通过吸引顶尖人才和项目落地,推动人工智能产业发展,加速“数字芜湖”建设。
百度世界大会上,百度网盘宣布推出‘自由画布’等新功能,旨在打造一站式内容存储、管理和消费平台。新功能包括AI创作工具、相册管理、简单系列学习工作工具以及摄影行业解决方案等。百度网盘正转型为数字生活中枢神经。
Chonkie 是一个轻量级的 RAG 分块库,提供多种分块器支持固定大小标记块、单词、句子和语义相似性分块,速度比竞争对手快3-2.5倍。通过 pip 安装 Chonkie 并使用 TokenChunker 等分块器进行文本分块。
kimi发布数学模型k0-math,可深入思考并展示解题过程。k0-math在多个数学基准测试中超过OpenAI的o1系列,并能详细解释其解题思路和决策过程。