HuggingFace
李飞飞、DeepSeek为何偏爱这个国产模型?
阿里云通义千问的Qwen模型在短短时间内取得了显著突破,仅用1000个样本在H100上监督微调26分钟就训练出与顶尖推理模型相当的新模型s1-32B。这一成果引起了AI社区的关注和赞誉,取代了Llama成为开源AI社区的重要标杆基座模型。
英伟达微软带头接入Deepseek,OpenAI急筹2800亿新融资
硅谷AI巨头纷纷支持DeepSeek,包括OpenAI、微软、英伟达等。OpenAI寻求新一轮400亿美元融资,估值翻番至3000亿美元。同时,Cursor和DeepSeek-R1模型已上线相关平台,引发业界广泛关注与讨论。
DeepSeek-R1持续刷屏,连Open R1都来了!抱抱脸发起,1天狂揽1.9k星
Open R1项目由HuggingFace发起,旨在复制DeepSeek-R1模型。该项目通过三个步骤实现这一目标,并借助官方技术报告进行指导。
吊打ChatGPT,脚踩Claude:DeepSeek 自我介绍
大模型已成为中国AI研究主流。DeepSeek在中文语义处理方面表现出色,成功翻译了俄罗斯教授的经济学导论。DeepSeek还提供了文本生成、分类与情感分析、问答系统等多样的功能。
23 年爆火的大模型综述,如今出纸质书了丨文末送书
优质的AI教学资源稀缺。清华NLP实验室等机构联合推出大模型公开课及教材《大语言模型》,覆盖全流程技术并配有配套代码与工具包,适合各类读者学习。新年之际发放十本电子版《大语言模型》作为福利。