开源
一个超牛的智能体框架项目:Pocket Flow
通过一个简单的100行代码框架,文章介绍了9种智能体结构图(单节点、工作流、共享、批量、异步、分支、并行、循环和嵌套),这些图帮助实现复杂任务,为理解智能体的本质提供了重要洞察。
字节开源了一款多模态神器!BAGEL上线,超越Qwen2.5-VL,媲美SD3!
字节跳动发布的BAGEL是首个支持多模态输入输出、思维链推理和MOT架构优化的跨模态超级AI模型,性能超越Qwen2.5-VL、InternVL-2.5。它能理解图像更准确,生成图像媲美Stable Diffusion 3,并在10+基准测试中表现优异。
解析Nginx负载均衡算法原理与应用实例
本文详细介绍了Nginx负载均衡算法的五种常用方法及其适用场景,包括轮询、加权轮询、IP哈希、最少连接数和基于哈希的方法,并通过示例代码展示了如何配置这些算法。
PYTORCH_CUDA_ALLOC_CONF基本原理和具体示例
PyTorch通过设置PYTORCH_CUDA_ALLOC_CONF环境变量中的max_split_size_mb参数来优化CUDA显存分配,从而缓解CUDA Out of Memory错误。
ViLAMP:蚂蚁集团和人民大学联手打造的长视频理解利器,单卡处理3小时视频!
蚂蚁集团和中国人民大学联合推出的ViLAMP模型通过混合精度策略和差分蒸馏技术实现高效处理长视频,显著降低计算成本和提高处理效率,在多个视频理解基准测试中表现优异。
开源智能助手II-Agent,字节跳动开源的多模态基础模型BAGEL
II-Agent是开源智能助手,旨在简化跨领域工作流程。BAGEL是字节跳动的多模态基础模型,擅长图像理解、生成和编辑任务。Gmail AutoAuth MCP Server简化了Claude与Gmail的交互方式。AingDesk是一款简单易用的AI助手,支持知识库、模型API和智能代理等功能。Crawl4AI RAG MCP Server提供网页抓取和RAG能力,为AI代理和编码助手提供了高级功能。
字节跳动发了个新模型:BAGEL-7B-MoT
这是一个混合专家多模态模型,基于Qwen2.5-7B-Instruct和siglip-so400m-14-980-flash-attn2-navit模型微调,并使用FLUX.1-schnell VAE模型,支持视觉理解、文本到图像生成及图像编辑。