DeepSeek-V3
破解合规难题,AI高质量数据集建设正当时
阿里开源的Qwen2.5系列训练数据规模达18万亿 token,推动AI大模型发展。但大规模训练带来幻象问题,RAG技术及工业场景应用以数据为中心成为趋势。国家和行业正积极推进数据标注产业发展规范,提升数据标注行业的合规能力。
建立强大AI智能体的关键:Pydantic AI+MCP+高级网络爬虫
本文通过一个超快速教程展示了如何使用Pydantic AI、MCP和高级网络爬虫技术构建强大的多智能体聊天机器人,并介绍了实时聊天机器人的功能及其背后的技术实现。
DeepSeek不能画图?不存在!一行提示词秒解锁隐藏功能,强到离谱!
本文介绍了如何利用DeepSeek的提示词生成高质量图像,包括翻译中文描述为英文提示词、使用API链接生成图像以及配合开源平台Pollinations.AI实现无限制画图自由。
3月27日周四 | Python热门项目
Python项目排行榜:Khoj(AI助手)、StarVector(SVG生成基础模型)、DeepSeek-V3(语言模型)、browser-use(浏览器自动化工具库)、devops-exercises(DevOps面试问题集合)、developer-portfolios(开发者作品集网站)、vllm(LLM推理引擎)、agno(多模态智能代理构建库)、minimind(小型语言模型)等。
新版DeepSeek-V3官方报告出炉:超越GPT-4.5,仅靠改进后训练
DeepSeek官方发布DeepSeek-V3模型更新技术报告,V3版本参数量约为660B,在数学、代码类评测集成绩超过GPT-4.5,并展示了其在前端开发、中文写作、中文搜索及工具调用等方面的提升。
DeepSeek V3新版本实测,Claude又输了?
今天早上看到大V测评DeepSeek新版本接近Claude后,立即体验发现Claude在贪吃蛇游戏和SQL修改方面表现更优,但双方代码生成能力均通过测试。总体来看,DeepSeek-V3提升了上下文理解能力,但仍需不断改进。
DeepSeek发布V3更新:代码和审美有了质的提升,附5大维度测评
DeepSeek发布最新版本V3,代码生成能力及审美大幅提升,参数规模达到685B,已在官网等平台开放使用。新版本在数学推理、代码编写、知识问答等方面表现优秀,并支持上下文窗从64k提升至128k。