程茜
通义开源32B视觉模型,阿里与DeepSeek前后脚上新!能看图说话
新模型Qwen2.5-VL-32B-Instruct在视觉理解和数学推理方面表现出色,并且其纯文本能力优于GPT-4o mini。该模型已在GitHub和Hugging Face上开源,可用于多种场景,包括对图片的理解、解决复杂的数学问题等。
DeepSeek又又开源了,这次拉爆GPU通信!
网友:突破AI基础设施极限。DeepSeek发布首个用于MoE模型训练和推理的开源EP通信库,支持NVLink和RDMA等硬件,提供高吞吐量且低延迟的全对全GPU内核,加速大规模MoE模型任务。
DeepSeek又得了个第一
DeepSeek在开源社区Hugging Face上的点赞数跃居第一,达约8730次,并持续增长。继在美区App Store免费榜登顶和模型Star数超越OpenAI之后,再次在海外平台创下新高。排名前十的模型中多数曾引爆大模型产业。
刚刚,DeepSeek创造历史!超越OpenAI狂揽7.8万星
刚刚DeepSeek在开源社区GitHub上的Star数首次超越OpenAI,DeepSeek-V3的Star数为7.78万,DeepSeek-R1为6.59万。DeepSeek力压ChatGPT登顶美区App Store免费榜,并创下一个又一个历史时刻。