NLP工程化
QWQ-32B推理模型的魔改版本
Qwen2.5-QwQ-37B-Eureka-Triple-Cubed 是一个增强版的AI模型,专注于推理和思考能力。它采用了’Triple Cubed’方法,支持128K上下文,并适用于多种任务如科学研究、创意写作等,具有高温度推理支持和性能优化等特点。
SmolDocling-256M-preview 是一个多模态的图像-文本到文本模型
SmolDocling-256M-preview 是一个多模态的图像-文本到文本模型,专为高效的文档转换而设计,能够处理科学和非科学文档。
Skywork-R1V是首个开源的多模态推理模型,具备先进的视觉链式思维能力
Skywork-R1V是首个开源的多模态推理模型,具备视觉链式思维能力,能够进行复杂的图像问题分解、解决视觉数学问题和解释科学医学图像。
LanPaint:无需额外训练即可实现高质量图像修复的AI工具
LanPaint是一款无需额外训练的AI工具,能够与Stable Diffusion模型无缝对接进行高质量图像修复,支持‘思考模式’优化效果,并允许生成100%新内容。
注释版 NanoGPT
Two years ago, Andrej Karpathy released an influential video on recreating GPT-2 from scratch.