AI探索时代
为什么分块在RAG技术中很重要?但又很没有存在感?
RAG技术涉及多个环节和多种技术,如向量数据库、embedding等。文章强调文本分块(chunk)在RAG中的重要性,分块将长文本切分成小段落便于管理和检索,提高模型处理效率及搜索准确性。
关于大模型的幻觉问题,大模型有可能做到百分之百的准确率吗?
大模型技术已在部分企业应用场景中使用,但其不确定性(幻觉)问题成为限制因素,尤其在医疗、自动驾驶等对准确率要求高的领域。虽然解决幻觉问题是大势所趋,但也有人认为适度的“幻觉”有助于创新和错误带来的新发现。
18家大模型厂商齐聚!全国首部AI知产标准欢迎参编!
中国电子商会启动《生成式人工智能知识产权运营管理指南》团体标准编制,旨在解决AI引发的知识产权新议题。该标准涵盖研发、应用全过程,将于12月中旬召开研讨会,已有多家科技企业参与。
怎么解决大模型知识库的检索问题,RAG检索增强之——ReRank(重新排序)
文章介绍了RAG技术在数据检索中的问题,并引入了ReRank技术来优化检索效率和准确性。ReRank技术通过多轮筛选的方式快速定位所需数据,解决了传统暴力搜索算法在大规模数据集上的低效问题。
人工智能的未来——AI Agent和Agentic AI的区别与联系
Agentic AI 和 AI Agent 是人工智能领域的两个概念,Agentic AI 更注重人工智能自主性、适应性和目标导向行为的能力描述;AI Agent 则是实现这些能力的一种具体形式,专注于完成特定任务的智能实体。
使用大模型实现一个聊天机器人思路以及困难点
实现简单但复杂的是聊天机器人功能。使用大模型服务商提供的SDK或API接口即可快速启动;主要通过system和user角色定义对话,并利用会话记录确保上下文理解;应用场景广泛,但需解决知识不足和技术准确性的挑战。
讨论一个技术问题,大模型流式返回
最近在对接GPT实现一个功能过程中遇到流式返回的问题,并介绍了从后端到前端如何适配流式返回的方案。文中提到websocket和SSE协议的区别以及使用Flux处理大模型流式返回的技术细节。