字节开源 InfiniteYou:灵活且高保真的人像再创作技术,微软Playwright MCP:进行快速可靠的网页自动化操作

InfiniteYou利用Diffusion Transformer实现高保真、个性化图像生成与编辑;pdf-craft能将扫描书籍PDF转换为Markdown和EPUB格式;Playwright MCP通过结构化数据让大型语言模型进行网页自动化操作;Oliva Multi-Agent Assistant利用Langchain和Superlinked在Qdrant数据库中查找产品并提供多智能体助手支持;AI有声书自动化生成工具利用大模型(如Gemini)自动转化为有声书。

360AI推出DiT架构下”省钱版”ControlNet, 参数量骤减85%性能达到SOTA!

360人工智能研究院提出新一代控制相关性引导的高效可控生成框架RelaCtrl,通过优化控制信号集成方式,在Diffusion Transformer中实现了更加高效且资源优化的控制,显著减少模型参数和计算开销。

智驾公司下场搞AI视频生成,模型上线即开源

国内智能驾驶公司图森未来发布了开源视频生成模型Ruyi,无需输入提示词即可将图片转换为5秒最高分辨率720P的视频。其支持多种风格,并提供了详细的使用说明和代码链接。但模型仍存在一些问题,如手部畸形、面部细节崩坏等。