艾伦人工智能研究所
大模型处理PDF文档olmOCR,DeepSeek开源DeepGEMM高效的FP8矩阵乘法库,多模态推理R1-OneVision
本文介绍了五个AI工具包和模型,包括olmOCR用于处理PDF文档、DeepGEMM优化FP8矩阵乘法、R1-OneVision多模态大语言模型、Baichuan-Audio语音交互模型以及MyCoder AI编程工具。
超越DeepSeek V3!Ai2再祭开源杀器Tülu 3,强化学习打破性能瓶颈
艾伦人工智能研究所推出的新模型Tülu 3 405B在多项基准测试中超越Deepseek v3和GPT-4,采用全新后训练框架,并提供完全开源的数据、评估、训练代码及开发配方。
超越GPT-4o!开源科研神器登场,4500万篇论文检索增强生成靠谱回答
首个完全开源的科学助手语言模型OpenScholar在4500万篇论文数据存储库中表现优异,能够高效检索和回答科研相关问题。它比GPT-4o更可靠且成本更低。