老刘说NLP
大模型落地及Agent记忆的有趣观点:兼看SVG生成用多模态大模型怎么做?
今天是2025年4月11日,周五。文章讨论了大模型落地以及Agent记忆的有趣观点和SVG生成用多模态大模型的方法。其中提到企业转型最缺懂业务的变革翻译官、需要专注场景且避免技术参数导向ROI等观点;同时介绍了三种基于多模态大模型进行SVG生成的工作及其技术细节。
多模态RAG及多模态R1推理中如何为不同的视觉数据生成描述Caption?OMNICAPTIONER实现思路
度依赖开源,开源大多数只能赶凑合,能快速上线,但是带来的风险是会黑盒化,不可控。我们如果要开发自己的
清明假期大模型技术进展回顾:llama4大模型、EasyControl吉卜力风格开源模型及LLM后训练技术总结
今日介绍请清明假期大模型进展,涵盖Llama4开源评测及吉卜力风格图像生成模型EasyControl_Ghibli,指出中文支持效果不佳,建议谨慎使用。同时总结了多模态微调与继续预训练讨论,并推荐相关技术文章阅读。