开源深度研究报告Shandu，阿里巴巴开源ViDoRAG提升视觉文档理解和问答效果，开源量化分析

关注我，记得标星⭐️不迷路哦～

Shandu是一款AI研究系统，利用先进语言模型、智能网络爬取，自动生成全面且结构化的研究报告。

Shandu是一个先进的AI研究系统，旨在通过深度、多来源的研究，对任何主题进行全面的知识合成，并生成结构良好、引用规范的报告。它利用强大的语言模型、智能网络爬取和迭代探索，自动化了从初始查询到深度内容分析和报告生成的完整研究过程。

地址：https://github.com/jolovicdev/shandu

ViDoRAG是基于动态迭代推理Agent的视觉文档检索增强生成框架，旨在提升视觉文档理解和问答效果。

ViDoRAG是一个视觉文档检索增强生成框架，它利用动态迭代推理代理来提高生成模型的噪声鲁棒性。它基于名为ViDoSeek的数据集进行评估。ViDoSeek是一个专门为视觉丰富的文档检索、推理和回答而设计的benchmark，非常适合评估大型文档语料库中的RAG。

地址：https://github.com/Alibaba-NLP/ViDoRAG

Klee是一款开源桌面平台，可安全本地运行AI，基于Ollama和LlamaIndex，方便易用。

Klee 是一个完全开源的平台，旨在将安全、本地的人工智能带到你的桌面。它基于 Ollama 和 LlamaIndex，让你能够：

地址：https://github.com/signerlabs/klee-client

HumanOmni是业界首个以人为中心的多模态大语言模型，能综合理解人类相关场景中的视频与语音信息。

HumanOmni 是一个以人为中心的 Omni 多模态大型语言模型，旨在全面理解以人为中心的场景。它具备以下关键特点：

大规模数据集：

基于 240 万个人物视频片段，包含 1400 多万条指令，以及 5 万个视频片段和超过 10 万条人工标注指令，涵盖情感识别、面部描述和特定说话人的语音识别等。
人脸、身体、交互分支：

采用三个分支分别处理人脸、身体和交互相关的场景，并根据输入指令动态调整融合权重，以确保在各种场景中都能做出准确响应。
音视频协同：

能够同时理解视觉和语音信息，从而更全面地理解复杂场景。
性能优越：

在情感理解和动态面部表情描述等任务上表现优于其他模型。

地址：https://github.com/HumanMLLM/HumanOmni

股票分析系统是A股专业分析工具，提供单股、批量扫描及高级技术指标分析，辅助投资决策。

股票分析系统是一个用于分析A股股票的工具，它提供全面的技术指标分析和投资建议。

系统主要功能:

单股票分析:

用户可以输入单个股票代码，系统会实时计算多种技术指标，并生成详细的分析报告，提供投资建议。
全市场扫描:

系统可以扫描所有A股股票，根据设定的技术指标进行评分，筛选出具有高潜力的股票，并按价格区间生成分析报告。
技术指标:

系统支持多种常用的技术指标，如移动平均线(MA)、相对强弱指数(RSI)、移动平均收敛/发散指标(MACD)、布林带(Bollinger Bands)等。
GUI界面:

提供友好的图形用户界面，方便用户操作和查看分析结果。

地址：https://github.com/DR-lin-eng/stock-scanner

（文：每日AI新工具）