《AI大模型应知应会100篇》第64篇:构建你的第一个大模型 Chatbot
第64篇:构建你的第一个大模型 Chatbot
手把手教你从零开始搭建一个基于大模型的聊天机器人
摘要
你是否想过,自己也能构建一个像 ChatGPT 一样能对话、能思考的聊天机器人(Chatbot)?别担心,这并不需要你是 AI 博士或资深工程师。
本文将手把手带你完成 从零到一构建一个完整的大模型 Chatbot 的全过程。我们将使用 Python + FastAPI 构建后端服务,通过 OpenAI API 接入 GPT-3.5 或 GPT-4 大模型,并结合 Streamlit 实现前端交互界面,最后教你在本地和云端部署上线。
无论你是 AI 初学者还是有一定编程基础的开发者,这篇文章都将为你打开通往 AI 应用开发的大门。
核心概念与知识点
1. Chatbot 基础架构
大模型的选择
模型名称 | 提供方 | 是否开源 | 特点 |
---|---|---|---|
GPT-3.5 / GPT-4 | OpenAI | 否 | 表现优秀,适合商用 |
Llama / Llama2 | Meta | 是 | 可本地部署,性能强 |
ChatGLM | Zhipu AI | 是 | 中文友好,推理速度快 |
✅ 本文以 OpenAI 的 GPT-3.5-turbo 为例,便于快速上手。
前后端通信机制
- 前端(用户输入 → 发送请求)
- 后端(调用模型 → 返回结果)
- 使用 RESTful API 进行通信(JSON 格式)
对话状态管理策略
- 简单实现:每次只传当前消息
- 高级实现:维护历史记录,传递上下文(
messages
数组)
2. 核心功能实现【实战部分】
初始化项目环境(Python + FastAPI)
安装依赖:
pip install fastapi uvicorn openai streamlit
创建目录结构:
chatbot/
├── backend/
│ └── main.py # FastAPI 主程序
├── frontend/
│ └── app.py # Streamlit 前端
└── requirements.txt
集成大模型 API(如 OpenAI)
# backend/main.py
import openai
from fastapi import FastAPI, HTTPException
from pydantic import BaseModel
from typing import Listapp = FastAPI()# 设置 OpenAI API Key
openai.api_key = "your_openai_api_key"# 定义请求数据模型
class ChatRequest(BaseModel):message: strhistory: List[dict] = []@app.post("/chat")
async def chat(req: ChatRequest):try:# 调用 GPT-3.5 模型response = await openai.ChatCompletion.acreate(model="gpt-3.5-turbo",messages=req.history + [{"role": "user", "content": req.message}])return {"response": response.choices[0].message.content}except Exception as e:raise HTTPException(status_code=500, detail=str(e))
📌
history
字段用于传递对话历史,使得模型能理解上下文。
实现基本对话接口
运行后端服务:
cd backend
uvicorn main:app --reload
访问 http://localhost:8000/docs
查看自动生成的 Swagger 文档,测试 /chat
接口。
示例输入输出:
{"message": "你好,请介绍一下你自己。","history": []
}
返回:
{"response": "我是由 GPT-3.5 支持的 AI 助手,可以帮你回答问题、写故事、写邮件等任务。"
}
3. 前端界面搭建【实战部分】
使用 Streamlit 构建简易 UI
# frontend/app.py
import streamlit as st
import requestsst.set_page_config(page_title="我的第一个 Chatbot")
st.title("💬 我的第一个大模型 Chatbot")if "messages" not in st.session_state:st.session_state.messages = []for message in st.session_state.messages:with st.chat_message(message["role"]):st.markdown(message["content"])prompt = st.chat_input("请输入你想问的问题")if prompt:with st.chat_message("user"):st.markdown(prompt)st.session_state.messages.append({"role": "user", "content": prompt})# 调用后端 APIpayload = {"message": prompt,"history": st.session_state.messages}response = requests.post("http://localhost:8000/chat", json=payload).json()answer = response.get("response", "")with st.chat_message("assistant"):st.markdown(answer)st.session_state.messages.append({"role": "assistant", "content": answer})
✅ 使用 Streamlit 的
session_state
实现简单的“记忆”功能。
运行前端:
cd frontend
streamlit run app.py
4. 部署与上线
本地运行 vs 云端部署
方式 | 优点 | 缺点 |
---|---|---|
本地运行 | 免费、简单 | 无法公网访问 |
HuggingFace Space | 快速部署、支持 GPU | 需注册账号 |
Vercel / Render | 支持前后端分离部署 | 学习成本略高 |
使用 Ngrok 内网穿透测试
安装 ngrok:
npm install -g ngrok
启动穿透:
ngrok http 8000
复制生成的 URL 替换前端代码中的 http://localhost:8000
,即可让他人访问你的服务。
实战案例研究
案例一:构建一个问答型客服机器人
功能需求:
- 用户提问常见问题(如价格、发货时间)
- 机器人自动识别意图并回复标准答案
技术实现:
- 在
/chat
接口中添加关键词匹配逻辑 - 如果是 FAQ 类问题,直接返回预设答案
faq_map = {"运费": "我们提供全国包邮服务。","退货政策": "7天内无理由退换货。"
}if any(keyword in req.message for keyword in faq_map):return {"response": faq_map[req.message]}
案例二:创建个人助手型聊天应用
功能需求:
- 记录待办事项
- 查询天气
- 自动总结长文本
技术实现:
- 添加多个工具函数(如
get_weather
,summarize_text
) - 在
/chat
中判断意图并调用对应工具
def get_weather(city):# 模拟获取天气信息return f"{city}今天气温22°C,多云。"
总结与扩展
如何加入语音识别能力?
你可以使用以下方式为 Chatbot 添加语音输入/输出:
- 语音识别:Google Speech-to-Text / Whisper
- 语音合成:ElevenLabs / Azure TTS
集成 LangChain 提升复杂任务处理能力
LangChain 是一个强大的框架,可以帮助你:
- 将多个模型串联执行复杂任务
- 构建 Agent(代理),自动选择工具执行操作
安装:
pip install langchain
示例:
from langchain.agents import initialize_agent
agent = initialize_agent(llm, tools, agent="structured-chat-zero-shot-react-description")
结语
通过本文的学习,你应该已经掌握了如何:
✅ 搭建一个基于大模型的 Chatbot 后端服务
✅ 实现对话历史传递与上下文理解
✅ 构建一个具备交互能力的前端界面
✅ 在本地和云端部署上线你的 Chatbot
下一步,你可以尝试将其扩展为一个企业级客服系统、智能助手平台,甚至集成语音能力,打造更丰富的交互体验。
如需进一步定制化开发或团队培训,欢迎联系作者!
相关文章:
《AI大模型应知应会100篇》第64篇:构建你的第一个大模型 Chatbot
第64篇:构建你的第一个大模型 Chatbot 手把手教你从零开始搭建一个基于大模型的聊天机器人 摘要 你是否想过,自己也能构建一个像 ChatGPT 一样能对话、能思考的聊天机器人(Chatbot)?别担心,这并不需要你是…...
鸿蒙OSUniApp 实现精美的用户登录和注册页面#三方框架 #Uniapp
UniApp 实现精美的用户登录和注册页面 前言 在开发鸿蒙APP时,登录注册页面作为用户与应用交互的第一道门槛,其体验与质量往往决定了用户的第一印象。去年我接手了一个电商小程序项目,产品经理特别强调要做一个既美观又实用的登录注册页面。…...
c#中equal方法与gethashcode方法之间有何关联?
文章目录 前言一、对hash运算的深入思考二、equal与gethashcode的关联三、 equal与gethashcode不同步的后果四、 规范的重写gethashcode 前言 大家有没有遇到过,当你重写了c#对象的equal方法之后,编译器会提示你对相应的gethashcode进行重写,…...
查询公网IP地址的方法:查看自己是不是公网ip,附内网穿透外网域名访问方案
本地搭建服务并提供互联网连接时,较为传统的方法是使用公网IP地址。因此,如何查询本地自己是不是公网IP,是必须要掌握的一种技巧。当面对确实无公网IP时,则可以通过内网穿透方案,如nat123网络映射工具,将本…...
【轻松学 C:编程小白的大冒险】— 16 函数的定义与调用
在编程的艺术世界里,代码和灵感需要寻找到最佳的交融点,才能打造出令人为之惊叹的作品。而在这座秋知叶i博客的殿堂里,我们将共同追寻这种完美结合,为未来的世界留下属于我们的独特印记。 【轻松学 C:编程小白的大冒险…...
【Tools】CPU 分析
CPU 分析 Windows SDK 本指南提供了可用于调查影响评估指标的中央处理单元 (CPU) 相关问题的详细技术。 特定于评估的分析指南中的各个指标或问题部分确定了需要调查的常见问题。 本指南提供了可用于调查这些问题的技术和工具。 本指南中的技术使用 Windows Performance Too…...
进阶2_1:QT5多线程与定时器共生死
1、在widget.ui中使用 LCD Number控件 注意:若 LCD 控件不是多线程,LCD控件则会瞬间自增到最大的数值,如上图,说明两者都是多线程处理 2、实现方式 1、创建 LCD 控件并修改为 LCD1 2、创建任务类 mytask. h,对任务类…...
ECharts:数据可视化的强大引擎
在当今这个信息爆炸的时代,如何有效地展示和理解复杂的数据成为了每一个开发者和技术爱好者面临的挑战。Apache ECharts 作为一款基于 JavaScript 的开源可视化库,以其强大的功能、丰富的图表类型以及高度的可定制性,迅速成为了数据可视化领域…...
记录 QT 在liunx 下 QFileDialog 类调用问题 ()Linux下QFileDialog没反应)
1. 2025.05.14 踩坑记录 因为QT 在 liunx 文件系统不同导致的 Windows : QString filePath QFileDialog::getOpenFileName(nullptr, "选择文件", ".", "文本文件 (*.txt);所有文件 (*.*)"); 没问题 liunx 下 打不开ÿ…...
通用软件项目技术报告 - 导读III
现在,我们正式进入报告的第六个主要领域:6. 领域六:与第三方服务/API 集成 (含 LLM API)。 连接: 在现代软件开发中,很少有应用程序是完全孤立的。我们经常需要与各种外部的第三方服务或 API 进行集成,以利用它们提供的特定功能(如支付处理、地图服务、社交媒体登录、云…...
Kali Linux 桌面环境安装与配置指南
一、为什么选择 Kali Linux? Kali Linux 由 Offensive Security 维护,集成了数百种安全测试工具(如 Metasploit、Nmap 和 Burp Suite),非常适合安全研究。但需要注意的是,Kali 默认以 root 用户运行&#…...
FFmpeg视频编码的完整操作指南
步骤如下: 安装和准备FFmpeg:确保包含所需编码器(如libx264)。基本命令行编码:使用ffmpeg命令进行转码,设置视频编码器、CRF、预设等。API编码流程(针对开发者): a. 注册…...
【网络协议】TCP、HTTP、MQTT 和 WebSocket 对比
从协议本质、工作原理、特点、应用场景等方面详细对比 TCP、HTTP、MQTT 和 WebSocket。 1. TCP(Transmission Control Protocol,传输控制协议) 本质 协议类型:传输层协议(OSI模型第4层)。核心功能&#x…...
Leetcode数组day1
704 二分查找 注意点,左闭右闭 class Solution { public:int search(vector<int>& nums, int target) {//整数类型的动态数组的引用。int left0;int right nums.size()-1;while (left < right){int middle (rightleft)/2;if (nums[middle]>targ…...
leetcode2934. 最大化数组末位元素的最少操作次数-medium
1 题目:最大化数组末位元素的最少操作次数 官方标定难度:中 给你两个下标从 0 开始的整数数组 nums1 和 nums2 ,这两个数组的长度都是 n 。 你可以执行一系列 操作(可能不执行)。 在每次操作中,你可以选…...
常见相机焦段的分类及其应用
相机焦段是指镜头的焦距范围,决定了拍摄时的视角、画面范围和透视效果。不同焦段适合不同的拍摄场景和主题,以下是常见焦段的分类及其应用: 一、焦段的核心概念 焦距:镜头光学中心到成像传感器的距离(单位:…...
FPGA在光谱相机中的核心作用
FPGA(现场可编程门阵列)作为光谱相机的核心控制与加速单元,通过硬件级并行处理能力和动态可编程特性,实现高速、高精度的光谱数据采集与处理。以下是其具体作用分类: 一、高速光电信号处理 实时光谱复原 通过硬…...
【证书与信任机制】证书透明度(Certificate Transparency):如何防止恶意证书颁发?
证书透明度(Certificate Transparency, CT)的核心原理 证书透明度(CT)是一项由Google主导的开放标准,旨在通过公开记录所有SSL/TLS证书的颁发行为,防止恶意CA错误或故意颁发虚假证书。其核心机制如下&#…...
【RabbitMq C++】消息队列组件
RabbitMq 消息队列组件 1. RabbitMq介绍2. 安装RabbitMQ3. 安装 RabbitMQ 的 C客户端库4. AMQP-CPP 库的简单使用4.1 使用4.1.1 TCP 模式4.1.2 扩展模式 4.2 常用类与接口介绍4.2.1 Channel4.3.2 ev 5. RabbitMQ样例编写5.1 发布消息5.2 订阅消息 1. RabbitMq介绍 RabbitMq - …...
基于SpringBoot+Vue的房屋租赁管理系统源码包(完整版)开发实战
基于SpringBootVue的房屋租赁管理系统源码包(完整版)开发实战 一、引言 随着城市化进程加速,房屋租赁市场规模持续扩大,传统管理方式已无法满足高效、精准的业务需求。本文基于SpringBootVue框架,设计并实现了一套完…...
《AI大模型应知应会100篇》第61篇:FastAPI搭建大模型API服务
第61篇:FastAPI搭建大模型API服务 摘要 随着大语言模型(LLM)在各行各业的广泛应用,构建一个高性能、可扩展的大模型 API 服务变得尤为重要。FastAPI 以其异步支持、类型安全、自动生成文档等优势,成为当前最流行的选择…...
Java 源码 HashMap源码分析
Java 源码 HashMap源码分析 1 初始容量 /*** The default initial capacity - MUST be a power of two.* 默认的初始容量,必须为2的幂*/static final int DEFAULT_INITIAL_CAPACITY 1 << 4; // aka 16容量表示哈希表中槽的数量(即哈希数组的长度…...
requestAnimationFrame 与 requestIdleCallback 对比
提示:记录工作中遇到的需求及解决办法 文章目录 前言一、背景与问题场景二、核心API对比分析三、选择 requestIdleCallback 的核心原因四、特殊场景处理建议五、最佳实践总结六、结论前言 看过埋点库 sunshine-track ,很多人疑惑为啥批量上报埋点信息的时候,用的是 request…...
【C/C++】自定义类型:结构体
文章目录 前言自定义类型:结构体1.结构体类型的声明1.1 结构体回顾1.1.1 结构的声明 1.1.2 结构体变量的创建和初始化1.2 结构的特殊声明1.3 结构的自引用 2.结构体内存对齐2.1 对⻬规则2.2 为什么存在内存对齐?2.3 修改默认对⻬数 3. 结构体传参4.结构体…...
视频编解码学习十二之Android疑点
一、android.view.SurfaceControl.setDisplaySurface的作用 android.view.SurfaceControl.setDisplaySurface 是 Android 系统中一个 native 层级别的 API,主要用于 设置某个物理显示屏(Display)的输出 Surface,属于 SurfaceFlin…...
web第三次课后作业--基于JDBC对mysql数据库的增删查改操作
一、工程搭建步骤 1.新建java项目,添加jdbc依赖 2.写java程序 3.添加mysql数据源,连接本地数据库 4.运行程序二、运行结果 三、代码 代码解析 加载数据驱动 try {Class.forName("com.mysql.jdbc.Driver"); } catch (ClassNotFoundExceptio…...
fiftyone-数据库配置和config与app_config配置文件
一数据库配置:(以本地为例) fiftyone数据库信息存在配置文件中: 配置文件地址: ~/.fiftyone/config.json 这个配置文件的作用:存放数据库地址信息;(如果不配置,fiftyon…...
Nginx的核心功能--正向代理、反向代理、缓存和Rewrite
Nginx作为高性能的Web服务器,其核心功能主要体现在以下四大模块: 一、正向代理 主要用于客户端访问外部网络的中转服务。典型配置示例: server {listen 8080;resolver 8.8.8.8;location / {proxy_pass http://$http_host$request_uri;prox…...
mac latex vscode 配置
mac latex vscode 配置 安装mactex.pkg 这里有个快速下载的镜像 https://mirrors.aliyun.com/CTAN/systems/mac/mactex/ 可以检查是否将 PATH 写入 export PATH"/Library/TeX/texbin:$PATH"vscode 下载插件 Latex Workshop 在配置文件 settings.json 中输入如下的…...
【GESP真题解析】第 4 集 GESP一级 2023 年 3 月编程题 1:每月天数
大家好,我是莫小特。 这篇文章给大家分享 GESP 一级 2023 年 3 月编程题第 1 题:每月天数。 题目链接 洛谷链接:B3835 每月天数 一、完成输入 根据题目要求,我们需要输入两个整数,分别表示一个日期的年份和月份。 年…...
国产免费工作流引擎star 6.5k,Warm-Flow升级1.7.2(新增案例和修复缺陷)
文章目录 主要更新内容项目介绍功能思维导图设计器流程图演示地址官网Warm-Flow视频 主要更新内容 [feat] 开启流程实例,新增流程定义是否存在校验[feat] 新增合同签订流程案例[feat] 新增企业采购流程案例[update] mybatis-plus逻辑删除,删除值和未删除…...
计算机网络:移动通信蜂窝网络指的是什么?
无线基站的蜂窝网络(Cellular Network)是现代移动通信系统的核心架构,其核心思想是通过蜂窝状小区划分和频率复用,实现广域覆盖、高效频谱利用和动态资源管理。以下从设计原理、网络架构、关键技术及实际挑战等方面深入解析蜂窝网络。 一、蜂窝网络的设计原理 1. 蜂窝结构…...
scratch基础-外观模块
一、本次任务 二、内容详解 1、模块介绍 1、说[你好] (2)秒:临时对话框,短暂对话 2、说[你好]:持续显示对话框,长文本显示 3、思考[嗯…] (2)秒:临时显示思考气泡,用于角色思考 4、思考[嗯…] :…...
前端服务器部署分类总结
目前所了解的部署有三种方式: 一是本地服务器部署;二是 nginx 服务器部署;三是云服务器部署 本地部署,准备好部署的包 以Vue项目为例,执行npm run build 命令打成前端包 第二步:将打包结果交给服务器(本地…...
精益数据分析(58/126):移情阶段的深度实践与客户访谈方法论
精益数据分析(58/126):移情阶段的深度实践与客户访谈方法论 在创业的漫长旅途中,正确识别和验证问题是成功的第一步。今天,我们继续围绕《精益数据分析》中创业阶段的核心内容,深入探讨移情阶段的关键实践…...
MK米客方德SD NAND:无人机存储的高效解决方案
在无人机技术迅猛发展的当下,飞控系统的数据记录对于飞行性能剖析、故障排查以及飞行安全保障极为关键。以往,SD 卡是飞控 LOG 记录常见的存储介质,但随着技术的革新,新的存储方案不断涌现。本文聚焦于以 ESP32 芯片为主控制器的无…...
LVDS系列12:Xilinx Ultrascale系可编程输入延迟(二)
本节讲解Ultrascale IDELAYE3的参数; IDELAYE3参数: REFCLK_FREQUENCY:如果使用COUNT模式,保持300MHz的默认值即可; 如果使用TIME模式,则该值与IDELAYCTRL参考时钟要匹配; DELAY_SRC&#…...
Spring的bean的生命周期?
Spring中bean的生命周期包括以下步骤: 通过BeanDefinition获取bean的定义信息。 调用构造函数实例化bean。 进行bean的依赖注入,例如通过setter方法或Autowired注解。 处理实现了Aware接口的bean。 执行BeanPostProcessor的前置处理器。 调用初始化…...
OpenCV CUDA模块中逐元素操作------逻辑运算
操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 算法描述 比较、AND、OR、NOT等。这类操作可用于创建基于条件的掩码,这对于图像分割或特征选择非常有用。 主要函数 1. 按位与 (cv::cuda::b…...
微信开发者工具里面模拟操作返回、录屏、网络速度、截屏等操作
微信开发者工具里面模拟操作返回、录屏、网络速度、截屏等操作...
Void: Cursor 的开源平替
GitHub:https://github.com/voideditor/void 更多AI开源软件:发现分享好用的AI工具、AI开源软件、AI模型、AI变现 - 小众AI Void,这款编辑器号称是开源的 Cursor 和 GitHub Copilot 替代品,而且完全免费! 在你的代码库…...
【MySQL】日志缓冲区详解 以及 InnoDB内存结构总结
📢博客主页:https://blog.csdn.net/2301_779549673 📢博客仓库:https://gitee.com/JohnKingW/linux_test/tree/master/lesson 📢欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正! &…...
在Spark搭建YARN
(一)什么是SparkONYarn模式 Spark on YARN(Yet Another Resource Negotiator)是 Spark 框架在 Hadoop 集群中运行的一种部署模式,它借助 Hadoop YARN 来管理资源和调度任务。 架构组成 ResourceManager:作…...
postman 用法 LTS
postman 用法 LTS File ---- View ---- Show Postman Console...
Spring Boot requestBody postman
Spring Boot requestBody postman 在处理Spring Boot应用程序中的RequestBody注解时,通常用于接收客户端(如Postman)发送的JSON格式数据。如果你在Postman中配置请求,并希望将JSON数据发送到Spring Boot后端,你可以按…...
OpenHarmony 开源鸿蒙南向开发——linux下使用make交叉编译第三方库——wget
准备工作 请依照这篇文章搭建环境 OpenHarmony 开源鸿蒙南向开发——linux下使用make交叉编译第三方库——环境配置_openharmony交叉编译-CSDN博客 编译依赖 Wget依赖Gnutls库,gnutls库依赖gmp、nettle、libunistring库 上述库可在历史文章中自行查找 下载 w…...
枢轴支压点策略
一种基于枢轴点(Pivot Point)的交易策略,主要用于在趋势行情中进行交易。 策略的核心思路是通过计算前一天的最高价、最低价和收盘价来确定当天的枢轴点,并据此计算出第一和第二阻力位以及第一和第二支撑位。 可以根据这些关键点位…...
【SSL部署与优化】TLS 1.3的核心改进与性能优化
TLS 1.3 的核心改进与性能优化 TLS 1.3 是当前最安全的 TLS 协议版本,通过简化协议、增强加密算法和优化握手流程,显著提升了性能和安全性。以下是其核心改进、性能优化及关键技术的详细解析: 一、TLS 1.3 核心改进 精简加密套件 • 移除弱算…...
等经纬度投影下求经纬度的行列号
一 概述 使用等经纬度投影(Equirectangular Projection), 将经纬度转换为行列号。 二 C实现 1 代码 以下是C的实现方法。该实现将地球的经纬度范围划分为固定分辨率的网格,每个网格对应一个行列号。 #include <cmath> #in…...
MetaHipMer2:从头组装宏基因组
Terabase-scale metagenome coassembly with MetaHipMer | Scientific Reports https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkaf369/8126258 安装 配置环境 berkeleylab / upcxx / wiki / INSTALL — Bitbucket mamba create -n mhm2_env -c conda-fo…...