NLP工程化
一个超牛的智能体框架项目:Pocket Flow
通过一个简单的100行代码框架,文章介绍了9种智能体结构图(单节点、工作流、共享、批量、异步、分支、并行、循环和嵌套),这些图帮助实现复杂任务,为理解智能体的本质提供了重要洞察。
解析Nginx负载均衡算法原理与应用实例
本文详细介绍了Nginx负载均衡算法的五种常用方法及其适用场景,包括轮询、加权轮询、IP哈希、最少连接数和基于哈希的方法,并通过示例代码展示了如何配置这些算法。
PYTORCH_CUDA_ALLOC_CONF基本原理和具体示例
PyTorch通过设置PYTORCH_CUDA_ALLOC_CONF环境变量中的max_split_size_mb参数来优化CUDA显存分配,从而缓解CUDA Out of Memory错误。
字节跳动发了个新模型:BAGEL-7B-MoT
这是一个混合专家多模态模型,基于Qwen2.5-7B-Instruct和siglip-so400m-14-980-flash-attn2-navit模型微调,并使用FLUX.1-schnell VAE模型,支持视觉理解、文本到图像生成及图像编辑。
llm-d:Kubernetes原生高性能分布式LLM推理框架,助力大规模语言模型推理部署
Kubernetes原生高性能分布式LLM推理框架,提升性能、灵活部署和优化资源利用。相关技术参考及服务内容介绍。
Magentic-UI:一个以人为本的实验性Web Agent,让复杂的网页任务变得轻松又安全
Magentic-UI是阿里巴巴开发的一个以人为本的实验性Web Agent,支持用户直接修改执行计划、随时接管操作,并在关键操作时需要用户批准以确保安全性。