月度归档: 2025 年 6 月
具有超能力的开源Markdown,用AI生成曲线图、PPT等多种样式再也不是问题。
Markdown使用广泛但样式有限,需依赖开源工具改进。Quarkdown作为基于Markdown的轻量级标记语言,支持函数调用、变量等强大功能,提高文档创作效率和多样性。
字节Seed新作:模型合并如何改变大模型预训练范式
字节跳动提出预训练模型平均(PMA)技术,在不增加计算成本的情况下显著提升大模型性能。通过合并稳定期检查点,PMA能预测衰减阶段表现,节省资源并加速训练进程。
AI搜索“新贵”查询量增长超20%
Perplexity人工智能搜索引擎5月收到7.8亿次查询,月增速超20%。公司CEO Aravind Srinivas称若维持当前增长率,一年后将实现每周10亿次查询。新开发的Comet浏览器或成为增长引擎。
比亚迪李云飞公开谈反“内卷”:比技术、拼产品,别阴阳、拉踩|快讯
比亚迪集团品牌及公关处总经理李云飞在重庆汽车论坛上表示,技术创新是反‘内卷’的关键,并强调了营销的守正之道。他提出拒绝夸大宣传、以量产为准、比技术产品以及维护清朗环境等策略。同时,他还建议国家为车企出口设置门槛。
小红书hi lab首次开源文本大模型,训练资源不到Qwen2.5 72B 的四分之一
小红书 hi lab 发布开源文本大模型 dots.llm1,参数量为 1420亿(142B),上下文长度32K。采用轻量级数据处理流程和MoE架构训练,相比Qwen2.5-72B在预训练阶段仅需13万GPU小时。支持多轮对话、知识理解与问答等任务,在多个测试中表现突出。