当前位置：首页 > news >正文

基于 Dify + vLLM插件 + Qwen3 构建问答机器人Docker版

news 来源：原创 2025/7/16 14:32:33

前提条件

硬件要求：
- 推荐 NVIDIA GPU (至少 16GB 显存，Qwen3 可能需要更多)
- 至少 32GB 内存
- 足够的存储空间 (Qwen3 模型文件较大)
软件要求：
- Docker 和 Docker Compose
- Python 3.8+
- CUDA 和 cuDNN (与你的 GPU 兼容的版本)

安装步骤

1. 安装 Dify

根据官方文档，你可以通过以下方式安装 Dify

https://blog.csdn.net/qq_60245590/article/details/147661284?sharetype=blogdetail&sharerId=147661284&sharerefer=PC&sharesource=qq_60245590&spm=1011.2480.3001.8118

2. 安装 vLLM

vLLM 是一个高效的大语言模型推理引擎，我们需要安装支持 Qwen 的版本：

pip install vllm
# 或者使用特定版本
pip install vllm==0.3.3

查看vllm安装路径：

3. 下载 Qwen3 模型

下载 Qwen3 模型 👈

# huggingface方式下载
pip install huggingface_hub
python -c "from huggingface_hub import snapshot_download; snapshot_download(repo_id='Qwen/Qwen3-8B', local_dir='./Qwen3-8B')"python -c "from huggingface_hub import snapshot_download; snapshot_download(repo_id='Qwen/Qwen3-0.6B', local_dir='./Qwen3-4B')"#ModelScope（阿里云镜像）下载
pip install modelscope
python -c "from modelscope import snapshot_download; snapshot_download('Qwen/Qwen3-0.6B', cache_dir='./qwen3-4b')"

4. 配置 Dify 使用 vLLM 和 Qwen3

4.1 创建模型目录

在 dify/docker 目录下执行：

# 创建 qwen3-7b 目录
mkdir -p qwen3-7b

目录结构示例：

dify/└── docker/├── qwen3-7b/    # 你新建的目录├── docker-compose.yml└── .env

4.2 通过环境变量配置（推荐）

修改 dify/docker/.env 文件，添加以下内容：

# vLLM 配置
VLLM_ENABLED=true
VLLM_SERVER_URL=http://vllm-server:8000  # 如果vLLM单独容器部署# Qwen3 模型配置
MODEL_PROVIDER=vllm
MODEL_NAME=qwen3-4b

修改 dify/docker/docker-compose.yml，在 api 服务部分添加 vLLM 相关环境变量：

services:# API serviceapi:image: langgenius/dify-api:0.15.3restart: alwaysenvironment:<<: *shared-api-worker-env  # 保留锚点合并GOOGLE_STORAGE_BUCKET_NAME: ""  # 可以覆盖为空VLLM_ENABLED: "true"        # 改为冒号键值对VLLM_SERVER_URL: "http://vllm-server:8000"MODEL_PROVIDER: "vllm"MODEL_NAME: "qwen3-4b"MODE: "api"SENTRY_DSN: "${API_SENTRY_DSN:-}"SENTRY_TRACES_SAMPLE_RATE: "${API_SENTRY_TRACES_SAMPLE_RATE:-1.0}"SENTRY_PROFILES_SAMPLE_RATE: "${API_SENTRY_PROFILES_SAMPLE_RATE:-1.0}"depends_on:- db- redisvolumes:- ./volumes/app/storage:/app/api/storagenetworks:- ssrf_proxy_network- default

4.3 启动 vLLM 服务

建议使用单独的 Docker 容器运行 vLLM，修改 docker-compose.yml：

services:vllm-server:image: vllm/vllm-openai:latest  # 从Docker Hub拉取deploy:resources:reservations:devices:- driver: nvidiacount: allcapabilities: [gpu]command:- --model=/data/qwen3-4b- --trust-remote-code- --host=0.0.0.0- --port=8000volumes:- ./qwen3-4b:/data/qwen3-4bports:- "8000:8000"networks:- default  # 必须和 api 在同一网络

这个镜像是什么？

镜像名称: ghcr.io/vllm/vllm-openai:latest

用途: 这是 vLLM 官方提供的镜像，用于部署高性能的 OpenAI 兼容 API 服务（支持类似 ChatGPT 的接口）。

典型场景: 在 dify 等 LLM 应用框架中，用于连接本地模型（如你配置的 qwen3-4b）。

4.4 启动服务：

cd dify/docker
docker compose down 
docker compose up -d

服务启动过程中如遇

Error response from daemon: could not select device driver "nvidia" with capabilities: [[gpu]]

表示 Docker 无法找到 NVIDIA 驱动接口

Connection refused
因为 vLLM 需要 GPU 才能启动，没有 GPU 支持时服务会直接失败

解决方案步骤

① 验证 NVIDIA 驱动
nvidia-smi  # 确认驱动已安装且正常工作
如果无输出，需先安装驱动：
# Ubuntu 示例（根据你的系统调整）
sudo apt-get install -y nvidia-driver-535
sudo reboot
② 安装 NVIDIA Container Toolkit
# 添加仓库
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list# 安装工具包
sudo apt-get update
sudo apt-get install -y nvidia-container-toolkit# 重启 Docker
sudo systemctl restart docker
拉取 CUDA 镜像并验证 GPU

手动拉取镜像并运行 nvidia-smi：

镜像加速（推荐）
tee /etc/docker/daemon.json <<EOF
{
"registry-mirrors": ["https://docker.mirrors.ustc.edu.cn"]
}
EOF
修改后重启 Docker：
systemctl restart docker# 运行测试（验证 GPU 是否可见）
docker run --rm --gpus all nvidia/cuda:12.2.0-base nvidia-smi
③ 验证 Docker GPU 支持
docker run --rm --gpus all nvidia/cuda:12.2.0-base nvidia-smi
应该会显示与主机 nvidia-smi 相同的输出。

④ 重建 vLLM 服务
cd /dify/docker
docker compose down
docker compose up -d vllm-server
⑤ 检查服务状态
docker compose logs -f vllm-server | grep -i error
curl http://localhost:8000/v1/models

4.5 验证配置

检查 vLLM 服务是否正常运行：

curl http://localhost:8000/v1/models

curl http://localhost:8001/v1/models

检查 Dify API 是否识别到模型：

curl http://localhost/v1/models -H "Authorization: Bearer your-api-key"

5. 在 Dify 中创建应用

访问 Dify 控制台 (通常是 http://localhost:80)
创建新应用，选择"对话型应用"
在模型设置中，选择 vLLM 作为提供商，然后选择 Qwen3-7B 模型
配置提示词和对话流程

6. 测试和优化

在 Dify 的 playground 中测试问答功能
根据性能调整 vLLM 参数：
- --tensor-parallel-size: 张量并行度
- --gpu-memory-utilization: GPU 内存利用率
- --max-num-seqs: 最大序列数

常见问问题解决

GPU 内存不足：

你的 RTX 3090 只有 24GB 显存
QWen-4B 模型需要约 20GB+ 显存（加载后）
剩余内存不足以处理请求（需要额外空间用于计算）

查看显存状态

nvidia-smi
watch -n 1 nvidia-smi  # 动态监控

启用量化（显存减半）

pip install auto-gptq  # 先安装量化支持python3 -m vllm.entrypoints.openai.api_server \--model=/data/qwen3-4b \--quantization=gptq \                # 启用4bit量化--gpu-memory-utilization=0.9

基于 Dify + vLLM插件 + Qwen3 构建问答机器人Docker版

前提条件硬件要求： 推荐 NVIDIA GPU (至少 16GB 显存，Qwen3 可能需要更多) 至少 32GB 内存足够的存储空间 (Qwen3 模型文件较大) 软件要求： Docker 和 Docker Compose Python 3.8 CUDA 和 cuDNN (与你的 GPU 兼容的版本) 安装步骤…...

编程日记 2025/7/16 14:32:33

【Linux】Linux应用开发小经验

基于Petalinux工具链的Linux应用开发小经验，未完待续... 部分图片和经验来源于网络，若有侵权麻烦联系我删除，主要是做笔记的时候忘记写来源了，做完笔记很久才写博客。专栏目录：记录自己的嵌入式学习之路-CSDN博客目录…...

编程日记 2025/6/29 8:16:13

第39课绘制原理图——绘制命令在哪里？

绘制原理图符号的命令在哪里？ 在新建完原理图之后，我们就可以在原理图上绘制各种相关的符号了。我们基本会从以下的两个地方，找到绘制各种符号的命令： 菜单栏中的“放置”菜单； 悬浮于设计窗口中的快速工具条在初…...

编程日记 2025/6/29 6:48:37

第十四篇：系统分析师第三遍——15章

目录一、目标二、计划三、完成情况四、意外之喜(最少2点)1.计划内的明确认知和思想的提升标志2.计划外的具体事情提升内容和标志五、总结六、后面准备怎么做？ 一、目标通过参加考试，训练学习能力，而非单纯以拿证为目的。 1.在复习过程中&…...

编程日记 2025/6/29 8:04:49

市面上所有大模型apikey获取指南(持续更新中)

阿里云(千问) 官方文档： 百炼控制台 1. 登录百炼控制台 2.前往我的api页面百炼控制台 3.创建api4. 添加描述（用于aichat） Deepseek 官方文档：首次调用 API | DeepSeek API Docs 1. 登录api平台 DeepSeek 开放平台 2. Deep…...

编程日记 2025/6/29 6:33:42

运行环境 Eclipse IDE for Enterprise Java and Web Developers 下载Eclipse解压Eclipse到文件夹 Maven 下载Maven解压Maven到文件夹配置环境变量MAVEN_HOME为Maven安装位置配置环境变量path为%MAVEN_HOME%\bin Redis 下载Redis解压Redis到文件夹配置环境变量path为Redis安装位…...

编程日记 2025/6/29 6:36:48

计网_可靠传输ARQ机制

2024.09.04：网工老姜&beokayy网工学习笔记第5节可靠传输机制 5.1 可靠传输5.2 ARQ机制、ARQ协议5.3 ARQ简介（可靠传输）5.3.1 停止等待协议（1）无差错情况（2）有差错情况确认丢失确认迟到 5.…...

编程日记 2025/6/29 5:18:16

实验-组合电路设计1-全加器和加法器（数字逻辑）

目录一、实验内容二、实验步骤 2.1 全加器的设计 2.2 加法器的设计三、调试过程 3.1 全加器调试过程 2.加法器的调试过程四、实验使用环境五、实验小结和思考一、实验内容 a) 介绍在这次实验中，你将熟悉 Logisim 的操作流程，并且学习…...

编程日记 2025/7/16 14:10:35

软件管理（安装方式）

1.rpm安装 1.1.rpm介绍 rpm软件包名称: 软件名称版本号(主版本、次版本、修订号) 操作系统 -----90%的规律举例：openssh-6.6.1p1-31.el7.x86_64.rpm 数字是版本号：第一位主版本号，第二位次版本号，带横杠的是修订号， el几---操作系统的版本。 #用rpm安装需要考虑如下信…...

编程日记 2025/6/29 6:38:21

工作记录 2015-07-15

工作记录 2015-07-15 序号工作相关人员 1 在CDAEditor上增加签名的处理，已经基本改完。明天整理说明文档，更新193服务器。郝需要改了签名的处理增加了签名的按钮： 已经签名过的会有提示： 签名后PDF的预览如下&#xf…...

编程日记 2025/7/16 14:09:27

《算法导论(第4版)》阅读笔记：p4-p5

《算法导论(第4版)》学习第 3 天，p4-p5 总结，总计 2 页。一、技术总结 1.instance Thus, given the input sequence h31; 41; 59; 26; 41; 58i, a correct sorting algorithm returns as output the sequence h26; 31; 41; 41; 58; 59i. Such an inp…...

编程日记 2025/7/16 14:05:59

【Mytais系列】Update语句执行流程

以下是通过时序图和文字说明详细描述的 MyBatis 执行 UPDATE/INSERT/DELETE 语句的完整流程，包括缓存清理、事务提交和数据库操作的各个环节： 时序图（Sequence Diagram） 详细执行流程解析 1. 客户端发起更新请求客户端调用…...

编程日记 2025/6/29 7:17:25

LeetCode —— 145. 二叉树的后序遍历

😶‍🌫️😶‍🌫️😶‍🌫️😶‍🌫️Take your time ! 😶‍🌫️😶‍🌫️😶‍🌫️😶‍🌫️…...

编程日记 2025/6/29 8:12:54

Python函数参数机制深度解析与最佳实践

引言在Python开发中，函数的参数机制是构建灵活、可维护代码的核心要素。本文将通过7个关键维度深入剖析函数参数的底层原理与高级用法，结合代码实例揭示参数传递的本质规律，助您掌握工业级函数设计技巧（基于Python 3.12环境验证…...

编程日记 2025/7/16 14:12:42

ARM 算数指令

加法 ADD 减法 SUB 取负 NEG 比较 CMP 乘法 MUL 移位 LSL、LSR、ASL、ASR、ROL、ROR加法和减法绝大多数微处理器都实现了带进位的加法指令，能够将两个操作数和条件码寄存器中的进位位加到一起。这条指令会使字长大于计算机固有字长的链接运算更加方便。说明了如何…...

编程日记 2025/7/16 13:57:33

普通IT的股票交易成长史--20250502 突破（2）

声明：本文章的内容只是自己学习的总结，不构成投资建议。文中观点基本来自yt站方方土priceaction，综合自己的观点得出。感谢他们的无私分享。送给自己的话： 仓位就是生命，绝对不能满仓！！&#…...

编程日记 2025/7/16 14:27:03

什么是 Redis？

什么是 Redis？ Redis（全称是 Remote Dictionary Server，远程字典服务器）是一个非常快的开源内存数据库，它主要用来存储“键-值”对类型的数据。与传统的数据库不太一样，Redis的数据主要存放在内存中，所以它读写速度特别快。通俗比喻：想象你有一个小仓库，里面放了…...

编程日记 2025/7/16 13:56:27

IEEE LaTeX会议模板作者对齐、部门长名称换行

第二行作者对齐参考链接： https://tex.stackexchange.com/questions/458204/ieeetran-document-class-how-to-align-five-authors-properly/458208#458208https://tex.stackexchange.com/questions/582487/how-to-align-four-author-names-in-the-ieee-conferenc…...

编程日记 2025/6/29 5:27:09

前端面经-VUE3篇（二）--vue3组件知识（二）依赖注入、异步组件、生命周期、组合式函数、插件

目录一、依赖注入 1、依赖注入是什么？ 2、最基础的使用 3、为什么使用依赖注入？ 4、使用 Symbol 作注入名二、异步组件 1、什么是异步组件？ 2、最基础用法：defineAsyncComponent 3、在模板中使用异步组件 4、配置加载状态…...

编程日记 2025/6/29 8:14:33

Manus联合创始人：公司产品基于Claude和阿里千问大模型开发

3月11日消息，日前，Manus官方在社交平台转发了公司联合创始人、首席科学家季逸超对Manus的技术解读，季逸超在评论区回复网友关于“Manus使用了哪一个基础大模型”这一问题时回复称，“我们用过Claude，也用过不同版本的Qw…...

编程日记 2025/6/29 6:17:13

华为云Flexus+DeepSeek征文｜快速搭建Dify LLM应用开发平台教程

目录部署Dify-LLM应用开发平台开始使用一键卸载注意事项部署Dify-LLM应用开发平台 1、首先需要访问快速搭建Dify-LLM应用开发平台-华为云 2、使用"一键部署"功能快速搭建Dify平台快速搭建Dify LLM应用开发平台-云社区-华为云，本文在这里选择一键部署&…...

编程日记 2025/6/29 6:09:04

简介QML中的Canvas

2025年5月3日，周六晚上 QML中的Canvas是一个强大的绘图组件，允许开发者通过JavaScript在界面上进行动态的2D图形绘制。它类似于HTML5的<canvas>元素，适用于实现自定义图形、动画、游戏开发以及图表绘制等场景。核心特性绘图能力 • …...

编程日记 2025/6/29 7:25:21

装饰器@wraps(func)详解

1. wraps(func) 的核心作用 wraps 是 Python 标准库 functools 提供的装饰器，用于保留被装饰函数的原始元信息。它通过将原函数的 __name__、__doc__、__module__ 等属性复制到装饰器内部的包装函数中，避免装饰器对函数身份信息的“掩盖”。 2. 元信息…...

编程日记 2025/6/29 5:18:13

vue的diff算法是什么、比较方式，原理分析、示例解释讲解

Vue Diff算法概述 Vue 的 Diff 算法是一种高效的虚拟 DOM 更新机制，用于最小化真实 DOM 的操作开销。它通过比较新旧 Virtual DOM 树中的差异，仅更新那些实际发生改变的部分，从而提升性能。定义 Diff 算法的核心目标是在 MVVM 开发模式下…...

编程日记 2025/7/16 13:59:44

Day04 新增套餐

###今天的任务主要是自主完成套餐管理的模块### 1.新增套餐在前端页面接口中我们可以看到在新增套餐的时候需要选择添加到菜单中的菜品因此我们需要设计一个接口可以通过根据分类id（category_id）来查询该分类下的菜品 1.1根据分类id查询分类下的菜…...

编程日记 2025/7/16 14:27:04

WEB前端小练习——记事本

一、登陆页面 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>记事本登录注册</title><link…...

编程日记 2025/6/29 5:31:41

在多线程环境下如何设计共享数据结构保证原子操作与数据一致性

在多线程环境下如何设计共享数据结构保证原子操作与数据一致性 1. 引言在现代软件开发中，多线程编程是提升程序性能和响应速度的重要手段。然而，多线程环境下的共享数据管理极具挑战性，若处理不当，可能引发竞争条件（Race Conditions）、数据不一致（Data Inconsiste…...

编程日记 2025/7/16 13:58:32

洛谷 P1850 [NOIP 2016 提高组] 换教室

题目传送门前言终于自己想出概率期望 d p dp dp 的状态了，但是依旧没能相对转移方程。（招笑） 暴力这题部分分和特殊情况分给的挺多的，所以先拿部分分。一、思路先跑一边 F l o y d Floyd Floyd 最短路求出两点间最短距…...

编程日记 2025/6/29 7:27:08

1penl配置

好的，根据您提供的 1pctl 命令输出信息，我们来重新依次回答您的所有问题： 第一：1Panel 怎么设置 IP 地址？ 根据您提供的 user-info 输出： 面板地址: http://$LOCAL_IP:34523/93d8d2d705 这里的 $LOCAL_I…...

编程日记 2025/6/29 5:13:33

Windows下调试WebRTC源码

一、引言《Windows下编译WebRTC源码》讲述了Windows下编译WebRTC源码的方法。本文在其基础之上，讲述使用Visual Studio调试WebRTC源码的方法。二、生成Visual Studio工程文件按照《Windows下编译WebRTC源码》编译出webrtc.lib 后，执行下面的命令生…...

编程日记 2025/7/16 14:25:52

基于大模型的肾结石诊疗全流程风险预测与方案制定研究报告

目录一、引言 1.1 研究背景与意义 1.2 国内外研究现状 1.3 研究目标与内容二、大模型技术原理与应用概述 2.1 大模型的基本原理 2.2 大模型在医疗领域的应用进展 2.3 适用于肾结石预测的大模型选择与依据三、术前风险预测与准备 3.1 患者身体状况评估 3.2 结石情…...

编程日记 2025/6/29 5:27:21

《ATPL地面培训教材13：飞行原理》——第5章：升力

翻译：刘远贺；工具：Cursor & Claude 3.7；过程稿第5章：升力目录空气动力系数基本升力方程回顾升力曲线升力曲线的解释速度-动压关系密度高度翼型剖面升力特性阻力特性简介升阻比飞机重量对最小飞行速度的影响表…...

编程日记 2025/7/16 14:11:33

STM32部分：2、环境搭建

飞书文档https://x509p6c8to.feishu.cn/wiki/DQsBw76bCiWaO4kS8TXcWDs0nAh Keil MDK用于编写代码，编译代码芯片支持包，用于支持某类芯片编程支持STM32CubeMX用于自动生成工程，减少手动重复工作 STM32F1系列芯片支持包软件下载直接下载&am…...

编程日记 2025/7/16 14:08:25

STL之list容器

list的介绍 1.list的底层是双向链表结构，双向链表中的每个元素在互不相关的独立结点中，在结点中通过指针指向前一个元素和后一个元素 2.list是可以在常数范围内在任意位置的插入和删除的序列式容器，并且该容器可以前后双向迭代 3.vector的…...

编程日记 2025/7/16 13:58:31

DNS 域名解析

DNS（Domain Name System） 是一个将域名转换为IP地址的系统。它的主要功能是使用户能够通过易于记忆的域名访问互联网资源，而不是记住复杂的IP地址。DNS类似于“互联网的电话簿”，帮助计算机找到彼此的位置。一、DNS的基本概念 …...

编程日记 2025/7/16 14:18:52

我写了一个分析 Linux 平台打开文件描述符跨进程传递的工具

Linux 系统的设计中，继承了 Unix “一切皆文件” (Everything is a file) 的思想，系统中的众多对象，都可以表示为文件，可以对它们执行文件操作，如 read()、write()、mmap()、ioctl()、close() 和 poll() 等。Linux 系统…...

编程日记 2025/6/29 5:13:36

QML图像提供器 (Image Provider)

QML 中的图像提供器是一种自定义图像加载机制，允许你从非文件源（如数据库、网络或程序生成的内容）提供图像数据。主要类型 QQuickImageProvider - 基础图像提供器 QPixmapImageProvider - 提供 QPixmap 图像 QImageImageProvider - 提供 …...

编程日记 2025/7/15 13:45:49

【Java学习】通配符?

面向对象系列八：泛型(二) 一、通配符? 二、泛型符<> 1.泛型类里 2.泛型类外 2.1使用过程中 2.2使用最后末三、限制 1.泛型类里的限制 2.延申处的限制 2.1extend限制上界 2.1.1返回值接 2.1.2形参传 2.2super限制下界 2.2.1形参传 2.2.2返回值…...

编程日记 2025/6/29 6:30:27

安卓基础（悬浮窗和摄像）

ACTION_MANAGE_OVERLAY_PERMISSION 的作用就是打开系统设置的「悬浮窗权限管理页面」 Intent intent new Intent(Settings.ACTION_MANAGE_OVERLAY_PERMISSION,Uri.parse("package:" getPackageName()) ); startActivity(intent); 直接跳转目标应用的权限…...

编程日记 2025/6/29 6:32:36

一种实波束前视扫描雷达目标二维定位方法——论文阅读

一种实波束前视扫描雷达目标二维定位方法 1. 专利的研究目标与实际问题意义2. 专利提出的新方法、模型与公式2.1 运动平台几何建模与回波信号构建2.1.1 距离历史建模2.1.2 回波信号模型2.2 距离向运动补偿技术2.2.1 匹配滤波与距离压缩2.3 加权最小二乘目标函数2.3.1 方位向信号…...

编程日记 2025/6/29 8:05:04

基于springboot的金院银行厅预约系统的设计及实现(源码+lw+部署文档+讲解)，源码可白嫖!

摘要随着信息技术在管理上越来越深入而广泛的应用，信息管理系统的实施在技术上已逐步成熟。信息管理系统是一个不断发展的新型学科，任何一个单位要生存要发展，要高效率地把内部活动有机地组织起来，就必须建立与自身特点相适应的…...

编程日记 2025/6/29 6:50:44

AVFormatContext 再分析零

随着对于AVFormatContext 各个参数的学习，逐渐可以从整体架构上再认识一下 AVFormatContext 了。还是从解封装的第一步开始。 int avformat_open_input(AVFormatContext **ps, const char *url, ff_const59 AVInputFormat *fmt, AVDictionary **options); 实际上…...

编程日记 2025/6/29 5:13:40

【学习心得】魔塔（ModelScope）和抱抱脸（Hugging Face）下载模型小细节

介绍常用的两种在模型社区如魔塔（ModelScope）和抱抱脸（Hugging Face），下载预训练模型的方法，然后说明各种方法里面的小细节。一、SDK下载对于希望直接通过编程方式集成模型下载功能到自己的项目中的开发…...

编程日记 2025/6/29 5:22:58

嵌入式硬件篇---STM32 系列单片机型号命名规则

文章目录前言一、STM32 型号命名规则二、具体型号解析1. STM32F103C8T6F103：C：8：T6：典型应用2. STM32F103RCT6F103：R：C：T6：典型应用三、命名规则扩展1. 引脚数与封装代码2. Flash 容量代码3. 温度范围代码四、快速识别技巧性能定位：F1/F4后缀差异硬件设计参考：引脚数…...

编程日记 2025/6/29 6:10:38

关于算法设计与分析——拆分表交换问题

题目： 用蛮力法设计一个算法，将A{a1, a2, ..., an}拆成B和C两个表，使A中值大于等于0的元素存入表B，值小于0的元素存入表C，要求表B和C不另外设置存储空间而利用表A的空间。 1）问题分析题目要求设计一个算…...

编程日记 2025/6/29 8:09:24

在pycharm profession 2020.3上离线安装.whl类型的包（以PySimpleGUI为例）

今天写个小代码，用到了PySimpleGUI。在pycharm profession 2020.3的项目中的Terminal里运行如下代码即可安装。 python3 -m pip install --force-reinstall --extra-index-url https://PySimpleGUI.net/install PySimpleGUI 安装方法如图： 安装后使用…...

编程日记 2025/6/29 6:42:46

c++回调函数

函数指针 //函数 bool lengthCompare(const string&, const string&); //pf为指针，指向一个函数，函数的类型为：bool (const string&, const string&) bool (*pf)(const string&, const string&); //函数&#xff0…...

编程日记 2025/6/29 5:13:43

mysql主从复制搭建，并基于‌Keepalived + VIP实现高可用

以下是基于 ‌Keepalived VIP‌ 实现 MySQL 主从复制高可用的详细步骤，涵盖主从复制搭建与故障自动切换： 一、MySQL 主从复制搭建（基础步骤回顾） 1. ‌主库（Master）配置‌ 修改配置文件‌ /etc/my.cnf&…...

编程日记 2025/6/29 5:13:41

时间交织（TIADC）的失配误差校正处理（以4片1GSPS采样率的12bitADC交织为例讲解）

待写…有空再写，有需要的留言。存在失配误差的4GSPS交织校正完成后的4GSPS交织...

编程日记 2025/6/29 8:38:52

K8S自动弹性伸缩机制详解

Kubernetes (K8S) 自动弹性伸缩机制详解 Kubernetes 通过多种控制器和指标系统实现自动弹性伸缩，主要包括 Pod水平伸缩（HPA）、垂直伸缩（VPA）、集群节点伸缩（CA） 三种方式。以下是核心机制和实…...

编程日记 2025/6/29 8:50:12

前提条件

安装步骤

1. 安装 Dify

2. 安装 vLLM

3. 下载 Qwen3 模型

4. 配置 Dify 使用 vLLM 和 Qwen3

4.1 创建模型目录

4.2 通过环境变量配置（推荐）

4.3 启动 vLLM 服务

这个镜像是什么？

4.4 启动服务：

解决方案步骤

① 验证 NVIDIA 驱动

② 安装 NVIDIA Container Toolkit

拉取 CUDA 镜像并验证 GPU

镜像加速（推荐）

③ 验证 Docker GPU 支持

④ 重建 vLLM 服务

⑤ 检查服务状态