日期: 2025 年 4 月 19 日
大模型数据预处理——关于复杂文档在大模型应用中的解决方案
复杂文档处理是AI的基础但门槛高。常见文本类文档如Word/PDF格式复杂难处理,影响RAG应用效果。为提高效率,可将多种文档统一转为HTML或Markdown格式,并进行进一步处理。
已实锤:LLM确实不会真正的数学Reasoning
MLNLP社区发布论文指出大模型在基础数学运算上存在严重问题。研究表明,当前的LLM模型可能只是通过死记硬背来解答复杂的数学题,而无法真正理解数学概念。
让孩子也能学AI,首个面向中小学的开源AI通识课发布!
Datawhale发布的中小学AI通识课程源于公益活动,旨在让随迁儿童了解人工智能。通过实践发现中小学生也能理解复杂概念,课程已开源并发布江苏省首份课程纲要。
疯了!ControlNet大神又出手!FramePack让AI视频生成不再爆显存!笔记本也能跑?
AI 视频生成框架 FramePack 由 lllyasviel 大神发布,旨在解决显存和长度问题。它采用 O(1) 上下文打包技术保证固定长度上下文处理,抗漂移双向采样提高时间一致性,并已在 GitHub 爆红。