关注我,记得标星⭐️不迷路哦~
✨ 1: Shandu
Shandu是一款AI研究系统,利用先进语言模型、智能网络爬取,自动生成全面且结构化的研究报告。

Shandu是一个先进的AI研究系统,旨在通过深度、多来源的研究,对任何主题进行全面的知识合成,并生成结构良好、引用规范的报告。它利用强大的语言模型、智能网络爬取和迭代探索,自动化了从初始查询到深度内容分析和报告生成的完整研究过程。
地址:https://github.com/jolovicdev/shandu
✨ 2: ViDoRAG
ViDoRAG是基于动态迭代推理Agent的视觉文档检索增强生成框架,旨在提升视觉文档理解和问答效果。

ViDoRAG是一个视觉文档检索增强生成框架,它利用动态迭代推理代理来提高生成模型的噪声鲁棒性。它基于名为ViDoSeek的数据集进行评估。ViDoSeek是一个专门为视觉丰富的文档检索、推理和回答而设计的benchmark,非常适合评估大型文档语料库中的RAG。
地址:https://github.com/Alibaba-NLP/ViDoRAG
✨ 3: Klee
Klee是一款开源桌面平台,可安全本地运行AI,基于Ollama和LlamaIndex,方便易用。

Klee 是一个完全开源的平台,旨在将安全、本地的人工智能带到你的桌面。它基于 Ollama 和 LlamaIndex,让你能够:
- 一键下载并运行本地大型语言模型 (LLM)
,无需终端操作和技术背景。 - 利用内置知识库安全地存储本地和私有文件
,保护数据安全。 - 使用内置的 Markdown 笔记功能将所有 LLM 响应保存到知识库中
。
地址:https://github.com/signerlabs/klee-client
✨ 4: HumanOmni
HumanOmni是业界首个以人为中心的多模态大语言模型,能综合理解人类相关场景中的视频与语音信息。

HumanOmni 是一个以人为中心的 Omni 多模态大型语言模型,旨在全面理解以人为中心的场景。它具备以下关键特点:
- 大规模数据集:
基于 240 万个人物视频片段,包含 1400 多万条指令,以及 5 万个视频片段和超过 10 万条人工标注指令,涵盖情感识别、面部描述和特定说话人的语音识别等。 - 人脸、身体、交互分支:
采用三个分支分别处理人脸、身体和交互相关的场景,并根据输入指令动态调整融合权重,以确保在各种场景中都能做出准确响应。 - 音视频协同:
能够同时理解视觉和语音信息,从而更全面地理解复杂场景。 - 性能优越:
在情感理解和动态面部表情描述等任务上表现优于其他模型。
地址:https://github.com/HumanMLLM/HumanOmni
✨ 5: Stock Analysis System
股票分析系统是A股专业分析工具,提供单股、批量扫描及高级技术指标分析,辅助投资决策。

股票分析系统是一个用于分析A股股票的工具,它提供全面的技术指标分析和投资建议。
系统主要功能:
- 单股票分析:
用户可以输入单个股票代码,系统会实时计算多种技术指标,并生成详细的分析报告,提供投资建议。 - 全市场扫描:
系统可以扫描所有A股股票,根据设定的技术指标进行评分,筛选出具有高潜力的股票,并按价格区间生成分析报告。 - 技术指标:
系统支持多种常用的技术指标,如移动平均线(MA)、相对强弱指数(RSI)、移动平均收敛/发散指标(MACD)、布林带(Bollinger Bands)等。 - GUI界面:
提供友好的图形用户界面,方便用户操作和查看分析结果。
地址:https://github.com/DR-lin-eng/stock-scanner
(文:每日AI新工具)