OpenAI科学家盛赞中国大模型:算法非常强,算力用到极致!
OpenAI联合创始人Andrej Karpathy分享了中国开源大模型DeepSeek-v3,仅使用280万小时GPU算力即超越Llama-3。该模型在多种基准测试中表现优异,并采用MLA和MoE等高效策略节省大量计算资源。
OpenAI联合创始人Andrej Karpathy分享了中国开源大模型DeepSeek-v3,仅使用280万小时GPU算力即超越Llama-3。该模型在多种基准测试中表现优异,并采用MLA和MoE等高效策略节省大量计算资源。
专注AIGC领域的专业社区分享了法国开源大模型平台Mistral.ai发布的Pixtral Large多模态模型及其助手le Chat的最新进展。Pixtral Large参数量达1240亿,支持超过128K上下文,超越多项测试指标。le Chat新增网络搜索、引用和Canvas功能,提高了用户交互效率与创意工作能力。