当前位置: 首页 > news >正文

AI大模型学习二十、利用Dify+deepseekR1 使用知识库搭建初中英语学习智能客服机器人

一、说明

很多情况下 LLM 知识库可以让 Agent 从中定位到准确的信息,从而准确地回答问题。在一些特定领域,比如客服、检索工具等有应用。

传统的客服机器人往往是基于关键词检索的,当用户输入了关键词以外的问题,机器人就无法解决。知识库正是为了解决这样一个问题,能够做到语义级别上的检索,降低人工的负担。

请记住知识库的核心是检索而非 LLM,是 LLM 增强了输出的过程,但真正的需求仍然是生成答案

什么是 embedding?

” Embedding “是一种将离散型变量(如单词、句子或者整个文档)转化为连续的向量表示的技术。

直白地说,在我们将自然语言处理为数据时会将文本转为向量,这个过程被称作 embedding。语义相似的文本的向量会位置相近,语义相反的文本的向量位置相反。LLM 使用这样的数据做训练,预测出后续的向量,从而生成文本。

知识点

  • Chatflow 的基础使用
  • 知识库、外部知识库的使用
  • embedding 的概念

二、添加Embedding模型

 

三、创建知识库

可以看到右侧有分段预览。Dify 会根据文本内容的不同自动将文章切分为许多个段落。你也可以在自定义中设置其他的切分规则。 

 

索引方式

通常情况下选择 高质量,但是需要额外消耗 token。选择 经济 无需消耗 token。

在社区版 Dify 里有采用 Q&A 分段模式,选择对应的语言可以将文本内容整理为问答格式,需要额外消耗 token。

Embedding 模型

请在使用前查阅模型供应商的使用文档、模型定价等信息。

不同的 embedding 模型适用场景不同。例如 Cohere 的 embed-english 适用于英语文档,embed-multilingual 适用于多语言文档。

检索设置

Dify 提供了向量检索、全文检索、混合检索三种检索功能,其中常用的检索是混合检索。

混合检索中可以设置权重或者使用重新排序(Rerank)模型。使用权重设置时,可以设置检索更侧重语义还是关键词,例如下图中语义占 70% 的权重,关键词占30%的权重。

点击最下面的保存并处理

查看知识库文档状态 

 

召回测试

四、 创建应用

1、创建好APP

 2、创建问题分类节点

你需要使用问题分类节点将用户的不同需求分离开。有的情况下用户甚至会聊无关的话题,对此也需要设置一个分类。

为了让分类更准确,你需要选择更优秀的 LLM,分类需要写的足够具体、区分度足够大

 

以下是一个学习英语的参考分类: 

由于我们知识库自由一个,所以其实演示自由两种1 就是无关问题,其它都是使用我们前面创建的初中英语学习知识库,在实际项目中可以建立多种知识库

1、用户询问与学习英语学习无关问题

2、用户询问学习英语基础知识点类的问题

3、用户询问学习英语语言技能训练类的问题

4、用户询问学习英语学习策略与工具类的问题

5、用户询问学习英语互动与情景应用类的问题

6、用户询问学习英语错误纠正与反馈类的问题

7、用户询问学习英语文化背景与拓展类的问题

8、用户询问学习英语技术支持与用户体验类的问题

 

 如果是“用户询问与学习英语学习无关问题”,可以直接回复

如果是其它类型问题,看下一节添加知识检索节点

3、添加知识检索节点

 

 

 4、LLM 节点

在知识检索节点的下一个节点,你需要选择 LLM 节点来整理知识库召回的内容。

LLM 需要根据用户的提问,调整回复,使得回复内容更加得体。

上下文:需要将知识检索节点的输出作为 LLM 节点的上下文。

你可以在提示词书写区域输入 / 或者 { 来引用变量。在变量中,sys. 开头的变量是系统变量,请查询帮助文档相关说明。

此外,你可以打开 LLM 记忆让用户的对话体验更加连贯。

 

5、添加直接回复节点 

6、其它分类 

 

五、测试

1、预览

 

 

 

完整回答内容:

Thinking...好的,我现在来思考一下用户的问题:“curious单词是什么意思?”首先,我需要确认这个词的拼写是否正确。用户写的是“curious”,而正确的拼写应该是“curious”。所以,这里可能存在一个拼写错误。

接下来,我要确定这个词的意思。根据我的记忆,“curious”是一个形容词,意思是好奇、好问或者对某事物有疑问。例如,在句子中可能会用作“Mary is curious about the new technology.” 这里表示玛丽对新技术感到好奇。

然后,我需要考虑用户为什么会询问这个单词的含义。这可能是因为他们在学习英语,正在阅读或写作时遇到了这个词,并且不确定其含义。也有可能是他们在做某种练习题,或者在日常交流中遇到了这个词,但不太确定如何使用。

此外,考虑到用户提到了“语法”方面的知识,比如被动语态,这可能意味着他们对英语的其他语法点也有兴趣。因此,在解释“curious”的时候,或许可以稍微提及一些相关的内容,比如它在句子中的作用或与其他词性的差异,这样回答会更全面。

最后,我要确保用词准确,并且表达清晰,让用户能够理解这个单词的含义以及它的常见使用方式。可能还需要提供一个例句来辅助说明,例如:“I'm curious to see the exhibition.” 这样用户可以更直观地理解这个词在句子中的运用。

"Curious" is an adjective that means curious or interested. It describes someone who is asking questions, wondering about things, or wanting to learn more.

Example: "She was curious about how they survived." (她对它们如何生存感到好奇)

引用

【人教版】八年级上册英语电子课本.pdf

【人教版】八年级下册英语电子课本.pdf

【人教版】八年级上册英语电子课本.pdf

 

2、发布并测试 

测试就不做了,和前面一样 

相关文章:

AI大模型学习二十、利用Dify+deepseekR1 使用知识库搭建初中英语学习智能客服机器人

一、说明 很多情况下 LLM 知识库可以让 Agent 从中定位到准确的信息,从而准确地回答问题。在一些特定领域,比如客服、检索工具等有应用。 传统的客服机器人往往是基于关键词检索的,当用户输入了关键词以外的问题,机器人就无法解决…...

kubuntu系统详解

Kubuntu 系统深度解析(从系统架构到用户体验) 一、定位与核心特性 Kubuntu 是 Ubuntu 的官方 KDE 衍生版,基于 Ubuntu 的稳定底层(Debian 技术栈),搭载 KDE Plasma 桌面环境,主打 “功能丰富、…...

【AutoGen革命】多智能体协作系统的架构设计与工程实践

目录 🌍 前言🏗️ 技术背景与价值🚨 当前技术痛点🛠️ 解决方案全景👥 目标读者画像 🧠 一、技术原理剖析🖼️ 系统架构图解💡 核心运行机制⚙️ 关键技术组件🔄 技术选型…...

西电 | 2025年拟录取研究生个人档案录取通知书邮寄通知

各位考生: 我校2025年硕士研究生录取工作已结束,根据相关工作管理规定,现将个人档案转调及录取通知书邮寄信息确认等有关事宜通知如下: 一、个人档案转调 (邮寄档案请务必使用EMS) 1.全日制考生 录取类…...

9.0 C# 调用solidworks介绍1

一、C# 与 SolidWorks 联合开发概述 SolidWorks 提供了完整的 API(应用程序接口),允许开发者使用 C# 等编程语言进行二次开发,实现自动化设计、定制功能等。 主要技术要点包括: 1. API 结构:SolidWorks API 是基于 COM 的接口,包含数百个对象和数千个方法…...

Linux复习笔记(三) 网络服务配置(web)

遇到的问题,都有解决方案,希望我的博客能为你提供一点帮助。 二、网络服务配置 2.3 web服务配置 2.3.1通信基础:HTTP协议与C/S架构(了解) ​​HTTP协议的核心作用​​ Web服务基于HTTP/HTTPS协议实现客户端&#xff…...

git和gdb

git基础使用 相关概念 本地仓库:自己电脑上git客户端 远端仓库:管理员端的git服务端 多人协作:文件开源,可以多个人一起修改 前提 1.一个仓库 2.确认git有没有安装 3.把远端仓库clone 这一步执行完后我们执行ll可以看到&…...

CSRF记录

CSRF(Cross-site request forgery)跨站请求伪造:攻击者诱导受害者进入第三方网站,在第三方网站中,向被攻击网站发送跨站请求。利用受害者在被攻击网站已经获取的注册凭证,绕过后台的用户验证,达…...

嵌入式MCU和Linux开发哪个好?

MCU与Linux:十年磨剑后的选择之道 MCU和Linux到底怎么选?这是一个老生畅谈的问题。 而我更想说,这不是简单的优劣对比,而是两条不同的道路,通往不同的风景。今天,我想以一个老兵的视角,聊聊这…...

2024年北理工Python123第六章编程题整理

这章的编程题都好少,难度也不高 开始进入文件的输入输出 一、字典翻转输出 我的代码: ori_dic eval(input()) dic{} if(not isinstance(ori_dic,dict)):#验证输入格式print(输入错误) else:for item in ori_dic.keys():dic[ori_dic.get(item)]itempri…...

一、HAL库的设计理念详解:从架构到实践

HAL库的设计理念详解:从架构到实践 一、HAL库的诞生背景与核心目标 STM32 HAL库(Hardware Abstraction Layer)是STMicroelectronics在2016年推出的新一代驱动框架,旨在解决STM32系列芯片不断扩展带来的开发复杂性问题。随着STM3…...

【Python】UV:单脚本依赖管理

一、基础概念 什么是 Python 脚本 以 .py 结尾的文件,可通过 python script.py 独立执行。UV 工具优势:无需手动创建或激活虚拟环境,自动为每个脚本生成隔离环境,保证依赖互不干扰。 环境管理原理 graph LRA[系统 Python 环境] -…...

多线程(2)——Thread类及常见方法

目录 构造方法常见属性前台线程,后台线程 启动一个线程——start()中断(终止)一个线程方法1:通过变量方法2:使用 isInterrupted() ---线程内置的标志位 等待一个线程——join()join设置等待时间 获取当前线程引用---cu…...

Neo4j 入门级使用

一、集成步骤 (一)创建 Spring Boot 项目 使用 Spring Initializr 创建项目时,选择 Maven 或 Gradle 作为项目构建工具,选择合适的 Spring Boot 版本,并添加 “Spring Data Neo4j” 依赖。 (二&#xff…...

解决 CJSON 浮点数精度问题:从 `cJSON_AddNumberToObject` 到 `cJSON_AddRawToObject`

在使用 CJSON 库处理浮点数时,开发者常会遇到一个棘手问题:浮点数的小数位精度丢失。例如,数值 3.1400 可能被简化为 3.14,甚至 5.0 被显示为 5。这种默认行为在需要严格保留小数位的场景(如金融、物联网传感数据&…...

ESP32开发入门(九):HTTP服务器开发实践

一、HTTP服务器基础 1.1 什么是HTTP服务器? HTTP服务器是能够处理HTTP请求并返回响应的网络服务程序。在物联网应用中,ESP32可以作为轻量级HTTP服务器,直接接收来自客户端(如浏览器、手机APP)的请求。 1.2 ESP32作为HTTP服务器的特点 轻量…...

谱聚类,大模型

使用谱聚类将相似度矩阵分为2类的步骤如下: 1. **构建相似度矩阵**:提供的1717矩阵已满足对称性且对角线为1。 2. **计算度矩阵**:对每一行求和得到各节点的度,形成对角矩阵。 3. **计算归一化拉普拉斯矩阵**:采用对…...

K8S Ingress、IngressController 快速开始

假设有如下三个节点的 K8S 集群: ​ k8s31master 是控制节点 k8s31node1、k8s31node2 是工作节点 容器运行时是 containerd 一、理论介绍 1)什么是 Ingress 定义:Ingress 是 Kubernetes 中的一种资源对象,它定义了外部访问集群内…...

AI边缘网关_5G/4G边缘计算网关厂家_计讯物联

AI边缘网关是边缘计算与人工智能技术深度融合的产物,作为连接终端设备与云端的桥梁,在网络边缘实现数据采集、实时分析、智能决策和协议转换,显著降低了数据传输延迟,节省了云端资源,并提升了隐私保护能力,…...

【Vue】Composables 和 Utils 区别

1. 核心功能与状态管理 • Composables 用于封装有状态的逻辑,通常结合 Vue 的响应式 API(如 ref、reactive)和生命周期钩子(如 onMounted),可管理组件内部的状态和副作用。例如,封装鼠标位置…...

右值和移动

值类别(value categories) lvalue 通常可以放在等号左边的表达式, 左值 例子 变量&#xff0c;函数或数据成员的名字返回左值引用的表达式&#xff0c;如x, x 1, cout << ’ . x 1 和 x返回的都是对x的int&. x则返回的是int字符串字面量如 “hello world” rva…...

如何在 Bash 中使用 =~ 操作符 ?

在 Bash 脚本世界中&#xff0c;有各种操作符可供我们使用&#xff0c;使我们能够操作、比较和测试数据。其中一个操作符是 ~ 操作符。这个操作符经常被忽视&#xff0c;但功能非常强大&#xff0c;它为我们提供了一种使用正则表达式匹配字符串模式的方法。 ~ 操作符语法 语法…...

消息队列RocketMQ-docker部署保姆级教程(从0到1)(2)

目录 引言 1. 准备工作 1.1 准备虚拟机 1.2 将虚拟机的ip设置为静态ip地址 1.3 什么是nat网络 1.4 测试网络 2. 准备docker环境 2.1 卸载旧docker&#xff08;如果有&#xff09; 2.2 安装依赖包 2.3 添加 Docker 官方仓库&#xff08;国内推荐使用阿里云镜像&#xf…...

《算法导论(第4版)》阅读笔记:p32-p38

《算法导论(第4版)》学习第 12 天&#xff0c;p32-p38 总结&#xff0c;总计 7 页。 一、技术总结 1.analyzing algorithms (1)running time(运行时间) worst-case running time, average-case running time&#xff0c;best-case running-time。 2.order of growth/rate …...

《Effective Python》第1章 Pythonic 思维详解——深入理解流程控制中的解构利器match

《Effective Python》第1章 Pythonic 思维详解——深入理解流程控制中的解构利器match 引言 Python 3.10 引入了全新的 match 语句&#xff0c;它不仅是一个“类 switch”的语法结构&#xff0c;更是一种**结构化模式匹配&#xff08;structural pattern matching&#xff09…...

【氮化镓】横向GaN 器件注入隔离区的电场相关载流子传输特性

文章的关键结论和发现如下: 在GaN横向功率器件中,注入隔离区的载流子传输具有明显的电场依赖性,且其泄漏电流和击穿特性主要由注入的GaN区域决定,与缓冲层和UID GaN层的性质关系不大。 载流子传输机制随电场强度变化呈现三个不同区域:低电场下为欧姆传导,符合变程跃迁(V…...

电子电器架构 --- 借力第五代架构,驱动汽车产业创新引擎

我是穿拖鞋的汉子&#xff0c;魔都中坚持长期主义的汽车电子工程师。 老规矩&#xff0c;分享一段喜欢的文字&#xff0c;避免自己成为高知识低文化的工程师&#xff1a; 钝感力的“钝”&#xff0c;不是木讷、迟钝&#xff0c;而是直面困境的韧劲和耐力&#xff0c;是面对外界…...

【ROS2】通信部署概述(以话题(Topic)通信为例)

写在前面 很多内容参考了赵虚左老师的ROS2教程 概念说明 工作空间&#xff1a;相当于一个项目&#xff0c;比如一台机械臂&#xff0c;或者一个机器人 功能包&#xff1a;相当于一个项目中的一台设备&#xff0c;如电机、雷达、相机等 大概构建流程 以话题通信机制为例 创…...

1.8 梯度

&#xff08;知识体系演进逻辑树&#xff09; 一元导数&#xff08;1.5&#xff09; │ ├─→ 多元偏导数&#xff08;1.6核心突破&#xff09; │ │ │ └─解决&#xff1a;多变量耦合时的单变量影响分析 │ │ │ ├─几何&#xff1a;坐标轴切片切线斜率…...

Pycharm中No Conda enviroment selected

最近在学习Anaconda&#xff0c;换了台新电脑重新安装PyCharm和Anaconda后&#xff0c;打算创建环境&#xff0c;创建后发现找不到刚刚在Anaconda中创建的环境&#xff0c;经过不断摸索后找到解决方案 将选择的路径从Anaconda目录下的python.exe换成Anaconda\Library\bin下的c…...

continue通过我们的开源 IDE 扩展和模型、规则、提示、文档和其他构建块中心,创建、共享和使用自定义 AI 代码助手

​一、软件介绍 文末提供程序和源码下载 Continue 使开发人员能够通过我们的开源 VS Code 和 JetBrains 扩展以及模型、规则、提示、文档和其他构建块的中心创建、共享和使用自定义 AI 代码助手。 二、功能 Chat 聊天 Chat makes it easy to ask for help from an LLM without…...

关于读写锁的一些理解

同一线程的两种情况&#xff1a; 读读&#xff1a; public static void main(String[] args) throws InterruptedException {ReentrantReadWriteLock lock new ReentrantReadWriteLock();Lock readLock lock.readLock();Lock writeLock lock.writeLock();readLock.lock();S…...

Ubuntu网络部署LNMP环境

目录 1. 安装nginx 2. 安装mysql 3. 安装PHP 4. 配置nginx&#xff0c;修改默认配置文件 5. 配置PHP 1. 安装nginx apt install -y nginx#开启 systemctl start nginx#浏览器访问页面 192.168.180.200:80#nginx网页html存放路径 ls /usr/share/nginx/#查看nginx版本号 ng…...

榜单按行显示

手机芯片_SoC天梯榜_安兔兔跑分排行_安兔兔 我只关注 骁龙7Gen1&#xff0c;天玑7300&#xff0c;骁龙6Gen1&#xff0c;天玑900 除了 50,64,75,86 行都隐藏。 var uls document.getElementsByClassName(newrank-c); var s 50,64,75,86; var sa s.split(,); for (var i0…...

DVWA在线靶场-xss部分

目录 1. xxs&#xff08;dom&#xff09; 1.1 low 1.2 medium 1.3 high 1.4 impossible 2. xss&#xff08;reflected&#xff09; 反射型 2.1 low 2.2 medium 2.3 high 2.4 impossible 3. xss&#xff08;stored&#xff09;存储型 --留言板 3.1 low 3.2 medium 3.3 high 3.…...

将本地文件上传到云服务器上

使用 SCP 命令&#xff08;最常用&#xff09; # 基本语法 scp [本地文件路径] [用户名][服务器IP]:[目标路径]# 示例&#xff1a;上传单个文件 scp /path/to/local/file.txt root192.168.1.100:/path/to/remote/# 上传整个目录 scp -r /path/to/local/directory root192.168.…...

关系实验课--笛卡尔积

import sympy as sym a, b sym.symbols(a b) # 定义符号 a 和 b A sym.FiniteSet(a,b) # 创建包含 a 和 b 的有限集合 B sym.FiniteSet(1,2,3,4) AxB sym.cartes(A,B) # 返回迭代器。迭代器不会直接显示内容&#xff0c;而是需要手动遍历或转换为其他数据类型&#xff08;如…...

从0开始学习大模型--Day07--大模型的核心知识点

AI常见名词 知识库 分为传统知识库与AI知识库&#xff0c;前者是单纯的存储各个领域的知识&#xff0c;后者则是与LLM结合&#xff0c;使AI系统能够更好地利用本地知识来响应查询和执行任务。比如&#xff0c;假如公司新来了个维修人员&#xff0c;他可以直接调用AI知识库去学…...

无线定位之 二 SX1302 网关源码 thread_down 线程详解

前言 笔者计划通过无线定位系列文章、系统的描述 TDOA 无线定位和混合定位相关技术知识点, 并以实践来验证此定位系统精度。 笔者从实践出发、本篇直接走读无线定位系统关键节点、网关 SX1302 源码框架,并在源码走读过程 中、着重分析与无线定位相关的PPS时间的来龙去脉、并在…...

MINIX 1.0 文件系统的实现(C/C++实现)

MINIX 1.0 文件系统简介&#xff1a; Linux 0.11操作系统启动时需要加载一个根目录&#xff0c;此根目录使用的是MINIX 1.0文件系统&#xff0c;其保存在硬盘的第一个分区中。Linux 0.11操作系统将硬盘上的两个连续的物理扇区&#xff08;大小为512字节&#xff09;做为一个物理…...

Spring Data Elasticsearch 中 ElasticsearchOperations 构建查询条件的详解

Spring Data Elasticsearch 中 ElasticsearchOperations 构建查询条件的详解 前言一、引入依赖二、配置 Elasticsearch三、创建模型类&#xff08;Entity&#xff09;四、使用 ElasticsearchOperations 进行 CRUD 操作1. 保存数据&#xff08;Create&#xff09;2. 获取数据&am…...

keil 解决 Error: CreateProcess failed, Command: ‘XXX\ARM\ARMCC\bin\fromelf.exe

参考文章链接&#xff1a; https://blog.csdn.net/qq_39172792/article/details/145499880 自己的&#xff1a; D:\Program Files\keil529\Keil_v5\ARM\ARMCLANG\bin\fromelf.exe --bin -o …/…/firmware_bin/L.bin ./Object/L.axf...

针对面试-mysql篇

1.如何定位慢查询? 1.1.介绍一下当时产生问题的场景(我们当时的接口测试的时候非常的慢&#xff0c;压测的结果大概5秒钟))&#xff0c;可以监测出哪个接口&#xff0c;最终因为是sql的问题 1.2.我们系统中当时采用了运维工具(Skywalkin就是2秒&#xff0c;一旦sql执行超过2秒…...

HNUST软件测试B考前最终复习

最近根据各个专业整理的考试重点&#xff0c;这两天总结出了以下内容&#xff0c;并附上了我自己复习的一些记忆小技巧&#xff0c;供大家参考&#xff0c;大家就图一乐。希望对你们的复习有所帮助&#xff0c;预祝大家考试顺利&#xff0c;加油&#xff01; 本次考试和去年的题…...

网络编程epoll和udp

# epoll模型核心要点## 1. epoll核心概念### 1.1 高效IO多路复用- 监视列表与激活列表分离- 内核使用红黑树存储描述符- 边缘触发模式(EPOLLET)支持### 1.2 事件触发机制- **水平触发(LT)**&#xff1a;- 默认模式&#xff0c;类似select/poll- 数据未读完持续触发事件- **边缘…...

【速写】use_cache参数与decode再探讨

序言 纳什最近指出一个小细节&#xff0c;比如在Qwen系列模型中&#xff0c;两个special token&#xff1a; eos_token(<|im_end|>): 151645&#xff08;im_end 中的 im 指的是 instruct message&#xff09;pad_token(<|endoftext|>): 151643。 这是很有趣的事…...

智能网联汽车“内外协同、虚实共生”的通信生态

我是穿拖鞋的汉子&#xff0c;魔都中坚持长期主义的汽车电子工程师。 老规矩&#xff0c;分享一段喜欢的文字&#xff0c;避免自己成为高知识低文化的工程师&#xff1a; 钝感力的“钝”&#xff0c;不是木讷、迟钝&#xff0c;而是直面困境的韧劲和耐力&#xff0c;是面对外界…...

《Python星球日记》 第64天:NLP 概述与文本预处理

名人说&#xff1a;路漫漫其修远兮&#xff0c;吾将上下而求索。—— 屈原《离骚》 创作者&#xff1a;Code_流苏(CSDN)&#xff08;一个喜欢古诗词和编程的Coder&#x1f60a;&#xff09; 目录 一、NLP 简介1. 什么是自然语言处理&#xff1f;NLP 的应用场景&#xff1a; 2.…...

Java中堆栈

文章目录 Java中堆栈1. 栈&#xff08;Stack&#xff09;特点示例 2. 堆&#xff08;Heap&#xff09;特点示例 3. 核心区别4. 常见问题5. 内存可视化示例内存布局示意图&#xff1a; 总结 Java中堆栈 在 Java 中&#xff0c;“堆栈” 通常指的是堆&#xff08;Heap&#xff0…...

模块化PCB设计中联排半孔的应用

随着电子产品的快速发展&#xff0c;高密度、多功能和小型化已成为未来的趋势。电路板上的元件几何指数在增加&#xff0c;而PCB尺寸却越来越小&#xff0c;因此需要与支撑板做配合。如果用助焊剂将圆孔焊接到母板上&#xff0c;由于圆孔体积较大&#xff0c;会产生冷焊&#x…...