字节跳动Seed1.5-VL复杂图表精准抽取,Deep Think是多模态未来的主流

Seed1.5-VL 是一个由 ByteDance 开发的多模态语言模型,在处理复杂表格、模糊图片和几何题目等方面表现出色。其架构包含视觉编码器和MoE LLM。预训练数据包括3万亿高质量token,遵循幂律和对数线性关系。Seed1.5-VL 在Hugging Face上可用体验,并通过强化学习后处理提升性能。

扩大 LLM 能实现 AGI吗?

计算机科学家Stuart Russell认为大型语言模型(LLM)不会导致通用人工智能(AGI),多数AI研究人员也持相似观点。Russell预测未来AI公司会探索替代方法,政府可能不会采取行动。他认为最坏的情况是「切尔诺贝利规模的灾难」,需要人类醒来并采取措施。

过去四周,AI推理爆了,GPU在燃烧,英伟达依旧供不应求

大摩报告指出,英伟达GPU因主要大型语言模型对推理芯片的巨大需求而面临供不应求局面。尽管如此,供应限制和毛利率压力影响了市场情绪,但摩根士丹利仍上调了2026财年的收入和每股收益预测,并认为英伟达长期增长潜力强劲。

中科院提出DEER:让Reasoning提前退出,推理提速50% 准确率涨10%

MLNLP是国内外知名的机器学习与自然语言处理社区。旨在促进学术界、产业界和爱好者的交流合作。近期提出DEER技术来解决大型语言模型冗长推理的问题,通过监测思考转折词和置信度评估实现。