当前位置: 首页 > news >正文

零基础实现把知识库接到聆思CSK6大模型开发板上

前言

大模型作为一个语言模型,实际上没有真正的记忆功能。所谓的对话记忆只是开发者将对话历史向GPT发送消息时将最近的对话历史通过提示工程组发送给ChatGPT。换句话说,如果对话历史超过了大模型的最大上下文,GPT会忘记之前的部分,这是大语言模型共有的局限性。

另外对专业领域知识的训练缺乏也是非常明显的短板。尽管这些模型在理解和生成自然语言方面有极高的性能,但它们在处理专业领域的问答时,却往往不能给出明确或者准确的回答。在医学、法律、工程等领域,人工智能可能被要求要理解和运用相当复杂和专业化的知识,然而这在目前的模型中仍是一个巨大的挑战。

针对专有和专业知识在大模型的应用落地出现不少解决方案,而向量数据库就是其中之一。当我们很多文档(例如客服培训资料或者产品操作手册)需要大模型根据它们的内容进行回答时,我们可以先将这份文档的所有内容转化成向量(这个过程称之为 Vector Embedding),然后当用户提出相关问题时,我们将用户的搜索内容转换成向量,然后在数据库中搜索最相似的向量,匹配最相似的几个上下文,最后将上下文返回给大模型。这样不仅可以大大减少模型的计算量,从而提高响应速度,更重要的是降低成本,并巧妙的减少 tokens 限制所带来的问题。

针对这种需求,聆思CSK6大模型开发板也配套提供了一个知识库方案,参考下面文档三步就能在智能硬件上接入自建的知识库

一、创建私有知识库

新建

在聆思大模型平台点击侧边栏的“知识库”模块,进入知识库页面,点击创建知识库即可进行知识创建流程;

在弹出的窗口输入知识库名称点击确定即可完成知识库创建。

上传文档

点击对应的知识库应用,点击右侧的“上传文件”按钮,即可进入文档上传流程;

文档支持txt、doc、pdf格式,请将要建立索引的文档转换至上述格式再进行上传。

设置分片策略

平台提供两种分片策略,首次可以先选择智能分片方式快速了解流程。

智能分片

系统自动拆分片段,无需关注数据库底层的分片细节,适合应用在一些篇幅较长并且没有固定格式的泛文本内容。同时为了提高检索效果和效率,每个片段会控制在250token以内。

自定义分片

支持自定义分片符号(同时支持正则表达式)对文档进行分片,你可以填写\n\n,代表将文档中两个连续换行符视为分割符号进行文档分割。例如下方纯文本内容则会把一个QA对视为一个片段进行分割。

二、在大模型语音交互应用中关联私有知识库

创建私有应用

1、点击应用模板中心中大模型套件的添加应用按钮。

2、在弹出的对话框中给应用命名后点击【确定】。

3、进入【我的应用】,可以看到刚才创建的【说明书】应用入口

在语音交互处理流程中引入知识库

双击点开【说明书】,点击【关联知识库】。

在弹出的界面中打开自建的知识库后点击【确定】

关联成功后会显示关联的知识库个数。在下方也可以自己配置每次问答需要搜索结合几条知识点来生成回答,默认是3条。

三、开发板接入知识库流程

完成云端配置后,仅需将产品ID与密钥写入设备,才能让设备连接对应的产品并完成鉴权服务。

配置产品管理信息

1、打开产品管理,点击右上方的【创建产品】

在弹出的页面中点击【配置应用】,选择前面配置的【说明书】应用,然后保存。

开发板关联新流程

在开发板应用首页下滑调出菜单,以此点击设置图标应用,进入应用信息查看页:

点击右下角扫码接入按钮调出相机,将 LSPlatform 待接入的产品二维码置于屏幕绿色扫描框内,完成扫`描后,请在应用配置信息处检查product_idsecret_id是否已更新:

至此完成知识库接入到硬件的操作流程,此时语音交互会先从知识库中取结果,知识库没有的话就会由大模型来处理生成回复。

本文使用的聆思CSK6大模型开发板开箱联网就可以使用大模型语音交互,按照以上步骤就可以零基础接入自建知识库,详细功能参考:套件简介 | 聆思文档中心

博客持续更新实操和示例讲解,欢迎关注,也可以在评论区提问交流。



排错指引:

语音交互链路较长,包含云服务配置、网络传输、开发板端鉴权等,如果遇到问题可以参考以下流程按顺序检查处理。

一、排错流程顺序参考

二、云端鉴权问题处理

原因1:聆思平台(platform)云端产品管理页没有添加开发板的设备ID

处理方法:按序号顺序操作,添加开发板设备ID

查看设备ID:

在开发板应用首页下滑调出菜单,以此点击设置图标应用,进入应用信息查看页:

原因2、更换过联网环境,DNS解析失败

如果不是以上两个原因,可以查下串口日志,如果出现以下信息则是网络问题

处理方法:重启设备,重新尝试。若多次尝试失败,建议更换网络。

三、提问无回复语音的处理

原因1:开发板关联了无效的product id和应用

如果开发板上的product id错误,使用开发板重新扫描上图位置中的二维码即可修正;

如果是配置应用显示为0,如下图所示,选择对应服务保存即可。

原因2:自建服务没有启动

测试环境和正式环境需要有一个是正常运行状态,如果是服务运行异常,可以启动对应服务来解决

四、回复未调用知识库的处理

如果知识库相关的问题回复内容跟接入的知识库无关,此时可以判定为知识库调用失败。

1、首先,在聆思平台(LSPlatform)后台查看语音请求是否正确理解,并落域到正确的节点处理

2、其次,检查大模型流程的【知识库】或【知识点检索】节点关联的[知识库ID]信息是否正确。

3、然后,使用【知识库体验】测试知识库回复内容是否符合预期

4、如果回复不符合预期,可以点击调用的知识库进入切片内容界面,通过关键词搜索快速定位切片信息,检查切片内容是否正确。

5、如果要补充问答信息,可以使用【QA管理功能】进行补充

五、知识库文档格式要求

如果使用智能分片处理文档生成的内容不符合预期,采用自定义分片的方式。

文档导入知识库前需要对文档内容和格式进行处理,可以参考官方文档进行:知识库文档最佳规范指南 | 聆思文档中心

本文使用的聆思CSK6大模型开发板开箱联网就可以使用大模型语音交互,按照以上步骤就可以接入自建知识库,详细功能参考:套件简介 | 聆思文档中心

相关文章:

零基础实现把知识库接到聆思CSK6大模型开发板上

前言 大模型作为一个语言模型,实际上没有真正的记忆功能。所谓的对话记忆只是开发者将对话历史向GPT发送消息时将最近的对话历史通过提示工程组发送给ChatGPT。换句话说,如果对话历史超过了大模型的最大上下文,GPT会忘记之前的部分&#xff0…...

docker 部署前、后端分离项目详细步骤(从打包到部署)

在平常的开发工作中,一个项目经历需求、开发、测试、上线等步骤。在开发测试完成后,我们需要部署测试环境、生产环境等,那么我们用 docker 方式应该怎么部署呢?前后端分离的项目又该如何部署呢?那么,今天我…...

【深度学习的灵魂】图片布局生成模型LayoutPrompt(1)

🌈 个人主页:十二月的猫-CSDN博客 🔥 系列专栏: 🏀《深度学习理论直觉三十讲》_十二月的猫的博客-CSDN博客 💪🏻 十二月的寒冬阻挡不了春天的脚步,十二点的黑夜遮蔽不住黎明的曙光 目…...

BG开发者日志429:故事模式的思路

1、故事模式已有的一关试验关中,直接揭示了一些重要真相,白给了。 /原设计思路是玩家可以直接玩故事模式,很快就能通关本模式的所有关卡,知道所有真相。 /原表现方式是步行模拟,到地点看对话。 (现在看来…...

Linux批量管理:Ansible自动化运维指南

引言 在服务器规模化的时代,Ansible就像一位"自动化指挥官"🎖️,让你轻松管理成百上千台Linux主机!本文将带你全面掌握Ansible的核心用法,从基础架构到高级Playbook,从主机管理到应用部署。无论…...

【AI提示词】第一性原理

提示说明 擅长运用第一性原理思维进行深度问题分析与创新解决方案构建的专家。 提示词 # Role: 第一性原理思考导师## Profile - language: 中文 - description: 擅长运用第一性原理思维进行深度问题分析与创新解决方案构建的专家 - background: 具备理论物理学与哲学复合背…...

【LeetCode】螺旋矩阵

题目 题目链接 请按照 顺时针螺旋顺序 ,返回矩阵中的所有元素,示例如下: 思路 整体思路为模拟。具体地,可以采用“减而治之”的思想,将整个遍历过程拆分为一次次对每一行和每一列的遍历,每次只考虑一行/…...

给 BBRv2/3 火上浇油的 drain-to-target

最近彻底跟 BBR 杠上了,再读一篇落实性论文 Promises and Potential of BBRv3,结论依然是 BBRv3 并未如声称的那般优化公平性,反而可能更糟糕,不得不说又是任重而道远。 说一个我遇到的,讲理之外顺带吐槽。 BBRv1 在…...

后端id类型为long类型时,返回给前端浏览器四舍五入,导致id精度缺失问题

背景 今天在代码里,掉了别人写的接口,有个id的字段是long类型的,我这边加点参数返回给前端,然后前端根据id修改,结果修改的数据记录有,但是没起作用,后来发现根据他传给我的id在后台数据库查不…...

《云原生》核心内容梳理和分阶段学习计划

🤟致敬读者 🟩感谢阅读🟦笑口常开🟪生日快乐⬛早点睡觉📘博主相关 🟧博主信息🟨博客首页🟫专栏推荐🟥活动信息文章目录 云原生核心内容梳理和分阶段学习计划一、云原生核心技术栈(2025年重点方向)二、分阶段学习计划(6-12个月系统性进阶)**阶段1:基础入…...

跟我学C++中级篇——控制死锁

一、同步和死锁 在前面学习多线程和网络编程时,都对线程中数据的同步和数据结构多线程访问的安全问题进行了分析和说明。其实,多线程编程之所以难,难点之一就在这里,数据同步意味着效率和安全的平衡,而这里的安全有一…...

「Mac畅玩AIGC与多模态08」开发篇04 - 基于 OpenAPI Schema 开发专用 Agent 插件

一、概述 本篇介绍如何在 macOS 环境下,通过编写 OpenAPI Schema,开发自定义的专用插件,让智能体可以调用外部 API,扩展功能至任意在线服务。实践内容基于 Dify 平台,适配 macOS 开发环境。 二、环境准备 1. 确认本地开发环境 macOS 系统Dify 平台已完成部署并可访问本…...

“兴火·燎原”总冠军诞生,云宏信息《金融高算力轻量云平台》登顶

“兴火燎原”创新马拉松公开赛2024年度全国总决赛于4月18日在福州举办,云宏科技股份有限公司(以下简称:云宏)的《金融高算力轻量云平台》项目脱颖而出,夺得全国总冠军。 作为数字中国创新大赛金融领域的核心赛事&…...

MySQL 索引与事务详解

MySQL 索引与事务详解 一、索引(Index) 1. 索引的作用与原理 索引是数据库的"目录",能够大幅提高查询速度,但会增加写入开销。MySQL 使用 BTree 作为主要索引结构。 2. 索引类型 (1) 普通索引 CREATE INDEX idx_n…...

洛谷题解 | CF111C Petya and Spiders

目录 题目描述输入格式输出格式输入输出样例 #1输入 #1输出 #1 输入输出样例 #2输入 #2输出 #2 说明/提示题目简化题目思路AC 代码 题目描述 Little Petya loves training spiders. Petya has a board $ nm $ in size. Each cell of the board initially has a spider sitting…...

【深度对比】Google Play与IOS 马甲包处理差异分析

在移动应用发布与推广过程中,马甲包(Cloned App / Alternate Version) 曾被广泛用于流量测试、风险隔离、多品牌运营等场景中。随着 Google Play 与 Apple App Store 审核政策不断收紧,开发者们越来越关注两个平台对“马甲包”的态…...

【C++】C++11新特性(二)

目录 完美转发 引用折叠: lambda表达式 完美转发 引用折叠: 引用折叠是 C的类型系统规则,用于处理“引用的引用”(如 T& &)。 在推导过程中,必须折叠成有效的单一引用类型。直接声明引用的引用…...

高等数学-第七版-下册 选做记录 习题9-4

1. 3. 4. 8....

特殊权限管理

特殊权限的类型 SUID(Set User ID):当一个可执行文件设置了 SUID 权限后,在执行该文件时,进程会以文件所有者的身份运行,而不是以执行用户的身份。例如,/usr/bin/passwd文件用于修改用户密码&a…...

最新的30个Android Kotlin面试题

以下是2025年最新的30个Android Kotlin面试题及其核心解析,综合了协程、密封类、高阶函数、扩展函数等高频考点,并附有相关引用来源: 一、协程与并发编程 协程与线程的核心区别是什么? 协程是轻量级线程,通过挂起而非阻…...

牛客周赛 Round 91

赛时成绩如下: A. while 题目描述 小歪找到了一个由五个字符构成的字符串,它一次可以选择任意一个字符,将其修改为另一个字符,他想要知道,将这个字符串修改为 "while" 需要的最少操作次数。 解题思路&#x…...

Kafka 的服务端的物理存储架构是什么?零拷贝,mmap,sendfile、DMA gather又是什么?

Kafka 服务端的物理存储架构 Kafka 的物理存储架构设计旨在支持高吞吐、低延迟的数据处理,其核心特点包括: 1. 分区与日志段 主题(Topic)与分区(Partition): Kafka 将每个主题划分为多个分区&…...

1.7 点云数据获取方式——视觉SLAM

图1-7-1 Visual SLAM生成的点...

双向流热固耦合的收敛

1 收敛性 如果想把流固耦合计算过程的收敛性弄清楚,必须理解流固耦合的求解过程和对流场与固体场的定义设置: -这个与其他的真实物理场可能有所不同 -例如你的初始条件可能是不同的当遇到收敛困难时,需要看一下的求解过程用户使用监测点和…...

C++之类和对象:构造函数,析构函数,拷贝构造,赋值运算符重载

前提:如果一个类是空类,C中空类中真的什么都没有吗,不是的,编译器会自动生成6个默认成员函数。默认成员函数:用户没有显式实现,编译器会生成的成员函数称为默认成员函数。 默认成员函数:构造函…...

Vue2 相关知识点整理

一、Vue2 核心机制 1. Vue2 的响应式原理是什么? 答案: Vue2 通过 Object.defineProperty 给对象的每个属性添加 getter 和 setter,当数据被访问或修改时,自动触发视图更新。通俗解释: 就像给每个数据绑了一个“监控…...

CSS:编写位置分类及优先级

文章目录 一、行内样式二、内部样式三、外部样式(推荐)四、优先级五、编码风格 一、行内样式 最好不这样写 二、内部样式 可以使用 三、外部样式(推荐) 四、优先级 行内样式 > 内部样式 外部样式 五、编码风格...

Tauri 跨平台开发指南及实战:用前端技术征服桌面应用(合集-万字长文)

厌倦了笨重的Electron应用?想要构建体积小、性能高、安全可靠的跨平台桌面应用?Tauri将是你的不二之选!本教程带你从入门到精通,掌握这个下一代桌面应用开发框架,并通过实战APK分析工具项目,将理论知识转化…...

深入解析 Linux 进程池:原理、实现与高并发优化

引言 当你的服务器需要同时处理 10,000 个客户端请求时,传统的"来一个请求创建一个进程"模式会导致严重的性能瓶颈。此时,进程池(Process Pool) 便成为关键解决方案。它像一支训练有素的特种部队,通过预先创…...

[Python]非零基础的快速上手

从js转的python,没有从初学者阶段开始,主打一个快速上手能写再说. pycharm:一种编辑器 数据类型 基本数据类型:整型(整数)、浮点型、字符型、布尔型 复杂数据类型:列表(数组)、集合区{1,2,3}、元组(1,3.4)字典{n’:2,b:1} 模板字符串 输出模板字符串…...

《算法笔记》10.5小节——图算法专题->最小生成树 问题 E: Jungle Roads

题目描述 The Head Elder of the tropical island of Lagrishan has a problem. A burst of foreign aid money was spent on extra roads between villages some years ago. But the jungle overtakes roads relentlessly, so the large road network is too expensive to mai…...

数据中心网络架构:高效规划与自动化设计实践

在数据中心网络架构规划设计中,面临如下难点: 设备数量庞大: 服务器、交换机等设备数量多,如何合理规划机柜布局和空间分配,避免资源浪费或密度超标,成为设计难点。 线缆设计复杂: 海量线缆…...

Mysql存储引擎、锁机制

Mysql存储引擎 InnoDB​(MySQL 5.5 及以后版本中的默认存储引擎) ​​事务支持​​:支持 ​​ACID 事务​​,适合需要高可靠性的场景(如支付、订单)。 ​​锁机制​​:默认使用 ​​行级锁​​…...

UVA1537 Picnic Planning

目录 题目算法标签: 最小生成树, k r u s k a l kruskal kruskal重构树, 树形 d p dp dp思路重构树代码 题目 UVA1537 Picnic Planning 算法标签: 最小生成树, k r u s k a l kruskal kruskal重构树, 树形 d p dp dp 思路 将 1 1 1号点设置为终点, 然后执行重构树计算度数…...

通过AWS Console连接服务器,简化运维过程

简单通过AWS Console连接您的Linux服务器 本文作者: 封磊 Eclicktech SA | AWS Community Builder DevTool | AWS UGL | 亚马逊云科技云博主 阿里云&InfoQ&CSDN签约作者 文章目录 简单通过AWS Console连接您的Linux服务器本文作者: 封磊Eclicktech SA | AWS Community …...

公交实时查询小程序功能点开发

线路查询:用户可输入公交线路号码,小程序实时显示该线路车辆位置与发车信息,能一键切换行驶方向,助用户依实时情况选合适候车站点。站点查询:输入车站信息,小程序呈现经过该站所有公交线路及公交信息&#…...

nginx配置集群服务器中的tcp负载均衡器

文章目录 前言1. Ubuntu下nginx安装2. nginx的tcp负载配置 前言 假设一台机器支持两万的并发量,现在我们需要保证八万的并发量。首先想到的是升级服务器的配置,比如提高 CPU 执行频率,加大内存等提高机器的物理性能来解决此问题。但是单台机…...

Qt/C++开发监控GB28181系统/获取设备信息/设备配置参数/通道信息/设备状态

一、前言 设备注册成功后,接下来要做的就是获取设备的信息,尤其是通道信息,根据国标协议,永远只有两个层级,一个是设备,然后就是设备下面多个通道,设备编码在整个系统中唯一,通道编…...

Linux系统基础:基础指令简介(网络概念部分)

简介:Linux 是一种开源的类 Unix 操作系统内核,由 Linus Torvalds 于 1991 年首次发布。经过多年发展,它已成为服务器、嵌入式设备和个人计算机领域的重要操作系统。 网络基础概念 初始协议 简单来说,协议是一种约定&#xff0…...

labview项目文件架构

为了使 LabVIEW 项目更具可扩展性和易于维护,合理规划和设计项目文件结构是非常重要的。 以下是一些基于行业经验和最佳实践的建议: 1. ### 文件夹层次划分 将不同的功能模块分开存储在一个清晰的分层目录结构中是一个常见的做法。通常情况下&#xff…...

nuxt项目中引入并配置 iview

安装iview npm install iview --save注:想要加入其它的配置,可以在 nuxt.config.js 的 plugins 配置项中加入,同时在 plugins 文件夹下加入引入逻辑。 在nuxt.config.js文件中写: {src: ~plugins/iview, ssr: true}同时新建 plugi…...

Origin绘图操作:点线图符号显示不全解决方法

一、问题说明 在用origin绘制点线图时,图表刻度线处的点符号显示不完全,如图所示: 二、解决方法 方法一:调整坐标轴刻度,使其能够显示全部数据点。 方法二:有时为了图表美观,则不对坐标轴刻…...

【进程与线程】

文章目录 一、实验目的二、实验内容与设计思想实验内容设计思路 三、实验代码实现四、总结 一、实验目的 1.深刻理解进程和线程的概念,掌握线程与进程在组成成分上的差别; 2.进一步认识并发执行的实质。 二、实验内容与设计思想 实验内容 用pipe()创…...

项目实战-飞机大战【补档】

和项目实战-贪吃蛇大作战【补档】-CSDN博客一样,这也是一个我在大一和网友完成的项目的补档。Dont waste your youth—time flies. 目录 1.工具&环境 2.项目简介 3.需求文档 4.流程图 5.产品原型图 6.可行性分析 7.源代码 8.实战效果 ​编辑 9.心得…...

算法基础学习|02归并排序——分治

一、思路 (1)确定分界点:mid(lr)/2 ——这里和快排不同 (2)递归排序(left right) (3)归并——合二为一 时间复杂度nlogn 二、题目练习 三、模板 归并排序 …...

测试基础笔记第十六天

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 一、UI自动化介绍1.认识UI自动化测试2.实施UI自动化测试前置条件3.UI自动化测试执行时机4.UI自动化测试核心作用和劣势 二、认识Web自动化测试工具-Selenium021.Sel…...

Android项目中使用ComposeUI

首先确认项目环境kotlin版本,以下是本机的版本 使用命令 ./gradlew -version 这里kotlin 版本是1.5.31 然后查看build.gradle sdk版本 这里是32 属于低版本 然后需要添加以下配置 buildFeatures {compose true}composeOptions {kotlinCompilerExtensionVersio…...

springboot中有关数据库信息转换的处理

现代项目一般都是前后端分离的,前端只负责展示数据,不负责对数据处理,所以所有数据处理工作都由后端进行 比如在仿京东中的status,审核信息展示,数据库中是以0/1显示,但是前端需要以"审核/未审核&quo…...

HHsuite同源序列搜索数据库构建

HHsuite 可用的数据库格式简介 HHsuite 是用于蛋白质序列比对和同源性检测的工具套件,它使用特定的数据库格式以实现高效的数据存储和快速的检索。HHsuite 常用的数据库格式主要基于 FFINDEX(Flat-File Index),这是一种简单而高效的文件索引系统,它将数据文件(如蛋白质序…...

大模型推理:Qwen3 32B vLLM Docker本地部署

Qwen3基础知识 此次Qwen3开源8个模型(MOE架构:Qwen3-235B-A22B、Qwen3-30B-A3B,Dense架构:Qwen3 0.6B/1.7B/4B/8B/14B/32B),新版本的Qwen3特性包括: 支持混合思维模式,即推理/非推…...