开源深度研究报告Shandu,阿里巴巴开源ViDoRAG提升视觉文档理解和问答效果,开源量化分析

关注我,记得标星⭐️不迷路哦~



✨ 1: Shandu

Shandu是一款AI研究系统,利用先进语言模型、智能网络爬取,自动生成全面且结构化的研究报告。

Shandu是一个先进的AI研究系统,旨在通过深度、多来源的研究,对任何主题进行全面的知识合成,并生成结构良好、引用规范的报告。它利用强大的语言模型、智能网络爬取和迭代探索,自动化了从初始查询到深度内容分析和报告生成的完整研究过程。

地址:https://github.com/jolovicdev/shandu

✨ 2: ViDoRAG

ViDoRAG是基于动态迭代推理Agent的视觉文档检索增强生成框架,旨在提升视觉文档理解和问答效果。

ViDoRAG是一个视觉文档检索增强生成框架,它利用动态迭代推理代理来提高生成模型的噪声鲁棒性。它基于名为ViDoSeek的数据集进行评估。ViDoSeek是一个专门为视觉丰富的文档检索、推理和回答而设计的benchmark,非常适合评估大型文档语料库中的RAG。

地址:https://github.com/Alibaba-NLP/ViDoRAG

✨ 3: Klee

Klee是一款开源桌面平台,可安全本地运行AI,基于Ollama和LlamaIndex,方便易用。

Klee 是一个完全开源的平台,旨在将安全、本地的人工智能带到你的桌面。它基于 Ollama 和 LlamaIndex,让你能够:

  • 一键下载并运行本地大型语言模型 (LLM)
    ,无需终端操作和技术背景。
  • 利用内置知识库安全地存储本地和私有文件
    ,保护数据安全。
  • 使用内置的 Markdown 笔记功能将所有 LLM 响应保存到知识库中

地址:https://github.com/signerlabs/klee-client

✨ 4: HumanOmni

HumanOmni是业界首个以人为中心的多模态大语言模型,能综合理解人类相关场景中的视频与语音信息。

HumanOmni 是一个以人为中心的 Omni 多模态大型语言模型,旨在全面理解以人为中心的场景。它具备以下关键特点:

  • 大规模数据集:
     基于 240 万个人物视频片段,包含 1400 多万条指令,以及 5 万个视频片段和超过 10 万条人工标注指令,涵盖情感识别、面部描述和特定说话人的语音识别等。
  • 人脸、身体、交互分支:
     采用三个分支分别处理人脸、身体和交互相关的场景,并根据输入指令动态调整融合权重,以确保在各种场景中都能做出准确响应。
  • 音视频协同:
     能够同时理解视觉和语音信息,从而更全面地理解复杂场景。
  • 性能优越:
     在情感理解和动态面部表情描述等任务上表现优于其他模型。

地址:https://github.com/HumanMLLM/HumanOmni

✨ 5: Stock Analysis System

股票分析系统是A股专业分析工具,提供单股、批量扫描及高级技术指标分析,辅助投资决策。

股票分析系统是一个用于分析A股股票的工具,它提供全面的技术指标分析和投资建议。

系统主要功能:

  • 单股票分析:
     用户可以输入单个股票代码,系统会实时计算多种技术指标,并生成详细的分析报告,提供投资建议。
  • 全市场扫描:
     系统可以扫描所有A股股票,根据设定的技术指标进行评分,筛选出具有高潜力的股票,并按价格区间生成分析报告。
  • 技术指标:
     系统支持多种常用的技术指标,如移动平均线(MA)、相对强弱指数(RSI)、移动平均收敛/发散指标(MACD)、布林带(Bollinger Bands)等。
  • GUI界面:
     提供友好的图形用户界面,方便用户操作和查看分析结果。

地址:https://github.com/DR-lin-eng/stock-scanner

(文:每日AI新工具)

欢迎分享

发表评论