开源星探，作者每时AI

即梦图片3.0又重磅更新，这可能是对普通人最有用的一次。

2025-06-06 作者开源星探

昨天晚上发布的新版本图片3.0的智能参考功能上线，支持一键修改文字、风格转换和添加元素。展示了多款可爱萌宠海报及换字案例，并提醒透明PNG图片需注意格式问题。

2025-06-06 作者开源星探

Agentic-Doc 是一款强大的Python库，专为从复杂文档中提取结构化数据而设计。它支持PDF、图片和URL等多种格式，并通过计算机视觉和LLM实现精准解析表格、图表、图片等信息。

2025-06-05 作者开源星探

阿里巴巴通义实验室的WebDancer通过创新方法解决复杂信息检索问题，包括数据合成、轨迹采样、监督微调和强化学习等阶段。它展示了显著的进步，并有望在未来拓展到更广泛的场景和技术应用中。

2025-05-30 作者开源星探

几经波折测试后发现，新版DeepSeek R1在代码能力上大幅提升接近Claude4水平，而写作和数学能力提升有限。升级后的新版本代码和审美增强明显。

2025-05-30 作者开源星探

腾讯混元与腾讯音乐联合开源的数字人音频驱动模型HunyuanVideo-Avatar，支持单或多角色对话和多种图像风格生成。通过一张人物图片和一段音频（最长14秒），生成高保真语音驱动动画，并引入了三项关键创新。

2025-05-29 作者开源星探

字节跳动开源多模态AI模型Dolphin，通过两阶段机制精准解析复杂文档，支持页面级和元素级解析，并提供在线Demo及本地部署指南。

2025-05-28 作者开源星探

放报名，该竞赛是堪
比刷 LeetCode 更硬核的简历镀金术：在BlueField上留下你的git

2025-05-28 作者开源星探

Dify、Coze、n8n、Fastgpt、Ragflow
但是几乎每一篇文章的
评论区都有小伙伴问

2025-05-27 作者开源星探

一款简单易用的AI助手AingDesk简化了AI模型部署和使用流程，支持一键安装主流模型、本地知识库管理、联网搜索等，界面友好且免费开源。

2025-05-26 作者开源星探

文章介绍了SeleniumBase框架，它简化了Selenium的使用，并解决了加载时机、WebDriver问题和Cloudflare拦截等问题。它具有智能等待机制、多种编写方式、UC隐身模式、自动驱动管理等功能，适用于自动化测试、爬虫等场景，提供直观的报告和实时仪表板。