AI编程相关开源数据集资源汇总
Stack Overflow QA Pairs、CodeSearchNet、CodeContests、HumanEval、BigCode Benchmark等数据集汇总,涵盖Python和SQL问题代码对、GitHub代码搜索数据集、机器学习编程数据集等多种类型。
Stack Overflow QA Pairs、CodeSearchNet、CodeContests、HumanEval、BigCode Benchmark等数据集汇总,涵盖Python和SQL问题代码对、GitHub代码搜索数据集、机器学习编程数据集等多种类型。
CodeScientist 是一个半自动化的科学发现系统,通过基因突变和LLM-as-a-mutator范式创建新的实验想法,并使用实验构建器来实现实验。
Python项目排行:涵盖PDF翻译库、AI友好的网络爬虫工具、WebUI框架等多个领域项目,LangFlow支持多智能体编排和主流大语言模型,Crawl4AI提供灵活的API用于实时数据提取,Hatchet为分布式任务管理。
Python项目排行榜:Khoj(AI助手)、StarVector(SVG生成基础模型)、DeepSeek-V3(语言模型)、browser-use(浏览器自动化工具库)、devops-exercises(DevOps面试问题集合)、developer-portfolios(开发者作品集网站)、vllm(LLM推理引擎)、agno(多模态智能代理构建库)、minimind(小型语言模型)等。
本教程介绍零样本提示技术,使语言模型无需示例执行任务。涵盖直接任务说明、基于角色提示、格式规范和多步推理等方法,并使用Python结合大模型进行实践。