当前位置: 首页 > news >正文

Spring Boot中接入DeepSeek的流式输出

第一步,添加依赖:

 <!-- WebFlux 响应式支持 -->
<dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-webflux</artifactId>
</dependency>

第二步,配置WebClient。这里需要设置WebClient实例,用于向DeepSeek的API发送请求。需要配置baseUrl,可能还需要添加认证头,比如Authorization Bearer token

@Configuration
public class DeepSeekConfig {@Value("${deepseek.api.key}")private String apiKey;@Value("${deepseek.api.url}")private String apiUrl;@Beanpublic WebClient deepseekWebClient() {return WebClient.builder().baseUrl(apiUrl).defaultHeader(HttpHeaders.AUTHORIZATION, "Bearer " + apiKey).defaultHeader(HttpHeaders.CONTENT_TYPE, MediaType.APPLICATION_JSON_VALUE).codecs(configurer ->configurer.defaultCodecs().maxInMemorySize(16 * 1024 * 1024)) //处理大响应.build();}
}

第三步,创建服务类,使用WebClient发送请求并处理流式响应。这里可能需要将响应转换为Flux,然后处理每个数据块。比如,读取每个chunk的数据,提取需要的内容,可能还要处理不同的数据格式,比如JSON对象或者特定格式的文本。

@Service
@RequiredArgsConstructor
public class DeepSeekService {private final WebClient deepSeekClient;public Flux<String> streamCompletion(String prompt) {Map<String, Object> requestBody = new HashMap<>();requestBody.put("model", "deepseek-reasoner");requestBody.put("messages", List.of(Map.of("role", "user", "content", prompt)));// 启用流式requestBody.put("stream", true);requestBody.put("temperature", 0.7);return deepSeekClient.post().contentType(MediaType.APPLICATION_JSON).bodyValue(requestBody).retrieve().bodyToFlux(String.class).filter(data -> !"[DONE]".equals(data)) // 过滤结束标记.map(this::extractContent).onErrorResume(e -> {// 错误处理return Flux.error(new RuntimeException("API调用失败: " + e.getMessage()));});}// 解析响应数据private String extractContent(String data) {try {JsonNode node = new ObjectMapper().readTree(data);return (Strings.isBlank(node.at("/choices/0/delta/reasoning_content").asText()) || "null".equalsIgnoreCase(node.at("/choices/0/delta/reasoning_content").asText())) ? node.at("/choices/0/delta/content").asText() : node.at("/choices/0/delta/reasoning_content").asText();} catch (Exception e) {return "";}}}

第四步,创建控制器

@RestController
@RequiredArgsConstructor
@Slf4j
public class StreamController {// 添加速率限制private final RateLimiter rateLimiter = RateLimiter.create(10); // 10次/秒private final DeepSeekService deepSeekService;@GetMapping(value = "/chat/stream", produces = MediaType.TEXT_EVENT_STREAM_VALUE)public Flux<String> streamChat(@RequestParam String message) {if (!rateLimiter.tryAcquire()) {return Flux.error(new RuntimeException("请求过于频繁"));}return deepSeekService.streamCompletion(message).map(content -> "data: " + content + "\n\n") // SSE格式.doOnComplete(() -> log.info("流式传输完成")).doOnError(e -> log.error("流式错误: {}", e.getMessage())).log("deepseek-stream", Level.FINE) // 详细日志.metrics();// 集成Micrometer监控}
}

配置

spring.application.name=deepseek_demo
server.port=8080deepseek.api.key=sk-?????????????
deepseek.api.url=https://api.deepseek.com/v1/chat/completions

测试:

@SpringBootTest
class DeepseekDemoApplicationTests {@Autowiredprivate DeepSeekService deepSeekService;@Testvoid contextLoads() {Flux<String> flux = deepSeekService.streamCompletion("springboot如何接入deepseek的流式输出,给出详细的步骤及代码实现");StepVerifier.create(flux).thenConsumeWhile(content -> {System.out.print(content);return true;}).verifyComplete();}
}

相关文章:

Spring Boot中接入DeepSeek的流式输出

第一步&#xff0c;添加依赖&#xff1a; <!-- WebFlux 响应式支持 --> <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-webflux</artifactId> </dependency> 第二步&#xff0c;配置We…...

路由交换网络专题 | 第四章 | 生成树 | VRRP | 边缘端口

拓扑图 &#xff08;1&#xff09;SW1、SW2、SW3 三台交换机之间存在环路问题&#xff0c;需要通过生成树协议破环&#xff0c;请简述二层环路可能导致的问题。 因为交换机在收到一个广播帧之后&#xff0c;会对非接收端口进行转发。每台交换机都转发的话&#xff0c;就行形成一…...

SFOS2:常用容器(布局)介绍

一、前言 最近在进行sailfish os的开发&#xff0c;由于在此之前并没有从事过QT开发的工作&#xff0c;所以对这一套颇为生疏&#xff0c;以此记录一下。以下内容不一定完全准确&#xff0c;开发所使用的是Qt Quick 2.6与Sailfish.Silica 1.0两个库。 二、布局 1.Qt Quick 2.…...

VS qt 联合开发环境下的多国语言翻译

添加Linguist 文件方法&#xff0c;如同添加类文件的方式&#xff0c;那样&#xff1a; 其他跟QT的一样的流程&#xff0c;另外在main函数里要注册一下&#xff0c; QTextCodec::setCodecForLocale(textCodec); QTranslator translator5; QString trans5 fi…...

基于 Python 的 ROS2 应用开发全解析

引言 在机器人操作系统&#xff08;ROS&#xff09;不断发展的进程中&#xff0c;ROS2 作为新一代的机器人框架&#xff0c;带来了诸多显著的改进与新特性。Python 作为一种简洁、高效且具有强大数据处理能力的编程语言&#xff0c;在 ROS2 应用开发中占据着重要地位。本文将深…...

AI分析师

01 实操 人工 公司需要开发了一个XX系统&#xff0c;在文件夹中包含了XX.csv&#xff0c;其中每一行表示一个XX样本&#xff0c;最后一列为每个样本的标签&#xff0c;现需要设计模型与系统&#xff0c;请按照以下要求完成算法测试。根据要求完成以下任务&#xff0c;将完成的…...

Redis核心数据类型在实际项目中的典型应用场景解析

精心整理了最新的面试资料和简历模板&#xff0c;有需要的可以自行获取 点击前往百度网盘获取 点击前往夸克网盘获取 Redis作为高性能的键值存储系统&#xff0c;在现代软件开发中扮演着重要角色。其多样化的数据结构为开发者提供了灵活的解决方案&#xff0c;本文将通过真实项…...

LLamaIndex中经常使用的三个模块

from aiostream import stream from fastapi import Request from fastapi.responses import StreamingResponse from llama_index.core.chat_engine.types import StreamingAgentChatResponse这四个模块每一个都很实用&#xff0c;在实际开发中经常用到&#xff0c;下面我就详…...

Idea集成AI:CodeGeeX开发

当入职新公司&#xff0c;或者调到新项目组进行开发时&#xff0c;需要快速熟悉项目代码 而新的项目代码&#xff0c;可能有很多模块&#xff0c;很多的接口&#xff0c;很复杂的业务逻辑&#xff0c;更加有与之前自己的代码风格不一致的现有复杂代码 更别提很多人写代码不喜…...

软考 中级软件设计师 考点知识点笔记总结 day12 计算机网络基础知识

文章目录 计算机网络基础5.1、计算机网络基础知识5.1.1 计算机网络分类5.1.2 七层网络体系结构5.1.3 网络标准5.1.4 TCP/IP协议族5.1.5 IP地址和IPv6简介5.1.6 Internet服务 计算机网络基础 要求掌握以下内容 5.1、计算机网络基础知识 网络体系结构 传输介质 传输技术 传输…...

【扩散模型(十三)】Break-A-Scene 可控生成,原理与代码详解(中)Cross Attn Loss 代码篇

系列文章目录 【扩散模型&#xff08;一&#xff09;】中介绍了 Stable Diffusion 可以被理解为重建分支&#xff08;reconstruction branch&#xff09;和条件分支&#xff08;condition branch&#xff09;【扩散模型&#xff08;二&#xff09;】IP-Adapter 从条件分支的视…...

C语言数字图像处理---2.31统计滤波器

本文介绍空域滤波器中的一种:统计滤波器 [定义与算法] 统计滤波(Statistic Filter)定义:基于图像处理中的邻域统计方法,对邻域内的像素信息进行统计,如基于均值和方差的信息,用于平滑或去噪图像,同时保留边缘信息。 算法步骤如下: 统计滤波器的优点和缺点主要包…...

流程设计实战:流程架构设计六步法

目录 简介 1、梳理业务模式及场景 2、甄别核心业务能力 3、搭建差异化的业务流程框架 4、定义L4流程能力 5、L4流程串联 6、展开L5业务流程 作者简介 简介 以往在设计流程的时候&#xff0c;我多数都是采用的自下而上的方式&#xff0c;从具体场景、具体问题出发去做流…...

SDK游戏盾如何接入?复杂吗?

接入SDK游戏盾&#xff08;通常指游戏安全防护类SDK&#xff0c;如防DDoS攻击、防作弊、防外挂等功能&#xff09;的流程和复杂度取决于具体的服务商&#xff08;如腾讯云、上海云盾等&#xff09;以及游戏类型和技术架构。以下是一般性的接入步骤、复杂度评估及注意事项&#…...

STM32F103C8T6 单片机入门基础知识及点亮第一个 LED 灯

目录 一、引言 二、STM32F103C8T6 基本特性 1. 内核与性能 2. 存储器 3. 时钟系统 4. GPIO&#xff08;通用输入输出&#xff09; 5. 外设 三、开发环境搭建 1. 硬件准备 2. 软件安装 四、点亮第一个 LED 灯 1. 硬件连接 2. 软件实现 &#xff08;1&#xff09;创…...

JavaScript Worker池实现教程

JavaScript Worker池实现教程 Worker池是一种管理和复用Web Workers的有效方法&#xff0c;可以在不频繁创建和销毁Worker的情况下&#xff0c;充分利用多线程能力提升应用性能。下面我将详细介绍如何在JavaScript中实现一个功能完善的Worker池。 为什么需要Worker池&#xf…...

【统信UOS操作系统】python3.11安装numpy库及导入问题解决

一、安装Python3.11.4 首先来安装Python3.11.4。所用操作系统&#xff1a;统信UOS 前提是准备好Python3.11.4的安装包&#xff08;可从官网下载&#xff08;链接&#xff09;&#xff09;&#xff0c;并解压到本地&#xff1a; 右键&#xff0c;选择“在终端中打开”&#xff…...

Navicat导入JSON数据到MySQL表

&#x1f91f;致敬读者 &#x1f7e9;感谢阅读&#x1f7e6;笑口常开&#x1f7ea;生日快乐⬛早点睡觉 &#x1f4d8;博主相关 &#x1f7e7;博主信息&#x1f7e8;博客首页&#x1f7eb;专栏推荐&#x1f7e5;活动信息 文章目录 Navicat导入JSON数据到MySQL表1. 导入入口2.…...

体育比分小程序怎么提示日活

要提高体育比分小程序的日活跃用户(DAU)&#xff0c;您可以考虑以下几个方面的策略&#xff1a; 一、核心功能优化 1.实时推送&#xff1a;确保比分更新真正实时&#xff0c;延迟不超过2秒&#xff0c;推荐接入熊猫比分API体育数据&#xff0c;比分实时更新 2.个性化订阅&am…...

【星海随笔】Python-JSON数据的处理

JSON 是一种轻量级的数据交换格式&#xff0c;主要用于在客户端和服务器之间传输数据。 JSON 在 python 里是一个标准库 https://www.jyshare.com/compile/9/ import json data {name: Alice, age: 30, city: New York} json_string json.dumps(data) print(json_string)js…...

Tomcat与Servlet

目录 1 Tomcat 1.1 目录结构 1.2 启动服务器 1.3 部署 2 Servlet 2.1 创建项目 &#xff08;1&#xff09;创建Maven项目 &#xff08;2&#xff09;目录结构 &#xff08;3&#xff09;引入依赖 &#xff08;4&#xff09;创建必要的目录结构 &#xff08;5&#xf…...

MySQL MVCC工作流程详解

MySQL MVCC工作流程详解 1. 基础概念 MVCC&#xff08;多版本并发控制&#xff09;是通过在每行记录后面保存多个版本来实现并发控制的技术&#xff0c;主要用于提供并发事务访问数据库时的读一致性。 2. 核心要素 2.1 事务ID&#xff08;DB_TRX_ID&#xff09; 每个事务都…...

unityTEngine 框架学习记录1

目前项目再用QF框架其中的UI部分&#xff0c;突然有天想学习一下其他好用的框架UI&#xff0c;根据我多年网友胖菊大佬的推荐TE映入眼帘,网上找了一下发现学习教程没有几个&#xff0c;不太适合啥都不会的小白&#xff0c;然后我就加入了ET官方群&#xff0c;里面人长得又帅又有…...

算法的时间复杂度

整理了下算法的时间复杂度&#xff0c;跟大家一起分享下。 时间复杂度O是表示算法运行时间与输入数据规模&#xff08;通常用 n 表示&#xff09;之间的关系。算法执行时间随输入数据规模增长的变化趋势。 1、O(1) — 常数时间 无论输入数据多大&#xff0c;执行时间固定不变…...

深度学习 从入门到精通 day_01

Pytorch安装 torch安装 python版本3.9.0 在官方文档里面找到适合你设备的PyTorch版本及对应的安装指令执行即可&#xff1a;https://pytorch.org/get-started/previous-versions/ 针对我的网络及设备情况&#xff0c;我复制了如下指令完成了Torch的安装&#xff1a; …...

AutoToM:让AI像人类一样“读心”的突破性方法

引言&#xff1a;AI如何理解人类的“内心世界”&#xff1f; 如何让AI像人类一样理解他人的意图、情感和动机&#xff1f;这一问题的核心是心智理论&#xff08;Theory of Mind, ToM&#xff09;&#xff0c;即通过观察行为推断心理状态的能力。近日&#xff0c;约翰霍普金斯大…...

Java实现Redis

String类型 代码 package com.whop.changyuan2.redisTest;import org.junit.jupiter.api.Test; import org.springframework.beans.factory.annotation.Autowired; import org.springframework.boot.test.context.SpringBootTest; import org.springframework.data.redis.cor…...

DAY09:【pytorch】nn网络层

1、卷积层 1.1 Convolution 1.1.1 卷积操作 卷积运算&#xff1a;卷积核在输入信号&#xff08;图像&#xff09;上滑动&#xff0c;相应位置上进行乘加卷积核&#xff1a;又称为滤波器、过滤器&#xff0c;可认为是某种模式、某种特征 1.1.2 卷积维度 一般情况下&#xf…...

河南普瑞维升企业案例:日事清SOP流程与目标模块实现客户自主简报功能落地

公司简介&#xff1a; 河南普瑞维升企业管理咨询有限公司成立于2017年&#xff0c;目前公司主营业务是为加油站提供全方面咨询管理服务&#xff0c;目前公司成功运营打造河南成品油&#xff0c;运营站点15座&#xff0c;会员数量已达几十万&#xff0c;在加油站周边辐射区域内…...

LeetCode面试热题150中19-22题学习笔记(用Java语言描述)

Day 04 19、最后一个单词的长度 需求&#xff1a;给你一个字符串 s&#xff0c;由若干单词组成&#xff0c;单词前后用一些空格字符隔开。返回字符串中 最后一个 单词的长度。 单词 是指仅由字母组成、不包含任何空格字符的最大子字符串。 代码表示 public class Q19_1 {p…...

车载刷写架构 --- 刷写流程中重复擦除同一地址的问题分析

我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 周末洗了一个澡,换了一身衣服,出了门却不知道去哪儿,不知道去找谁,漫无目的走着,大概这就是成年人最深的孤独吧! 旧人不知我近况,新人不知我过…...

一个测试GPU可用的测试实例

一个测试GPU可用的测试实例&#xff1a; import torch import torch.nn as nn import torch.optim as optim import time import gc import numpy as np from torch.cuda.amp import autocast, GradScalerclass LargeNN(nn.Module):def __init__(self, use_attentionTrue):sup…...

chili3d调试笔记2+添加web ui按钮

onclick 查找 打个断点看看 挺可疑的&#xff0c;打个断点看看 挺可疑的&#xff0c;打个断点看看 打到事件监听上了 加ui了 加入成功 新建弹窗-------------------------------------- 可以模仿这个文件&#xff0c;写弹窗 然后在这里注册一下&#xff0c;外部就能调用了 对了…...

Go-zero:JWT鉴权方式

1.简述 用于记录在go-zero的后端项目中如何添加jwt中间件鉴权 2.流程 配置api.yaml Auth:AccessSecret: "secret_key"AccessExpire: 604800config中添加Auth结构体 Auth struct {AccessSecret stringAccessExpire int64 }types定义jwt token的自定义数据结构&#…...

MySQL的MVCC机制详解

1. 什么是MVCC&#xff1f; MVCC&#xff08;Multi-Version Concurrency Control&#xff0c;多版本并发控制&#xff09;是数据库系统中用于实现并发控制的一种技术。它通过保存数据在某个时间点的快照来实现&#xff0c;使得在同一个数据行上可以同时存在多个版本&#xff0…...

Postman做自动化测试

Postman也可以实现接口自动化 1.在Scripts写断言&#xff0c;图中红框处。不会写可以偷懒使用蓝框处会自动填写 2.单个运行调试&#xff0c;结果显示在TestResults 3.多个接口都写好断言并调通后&#xff0c;在包揽这些接口的文件夹下运行&#xff0c;图示以两个接口为例&…...

Meltdown原理介绍:用户空间读取内核内存

摘要 计算机系统的安全性从根本上依赖内存隔离,如,内核地址范围被标记为不可访问并受到保护,以防用户非法访问。本文介绍了Meltdown。 利用现代处理器上乱序执行,来读取内核任意的内存位置,包括个人数据和密码。乱序执行是必不可少的用来提升性能的手段,并在现代处理器中…...

数据结构和算法(七)--树

一、树 树是我们计算机中非常重要的一种数据结构&#xff0c;同时使用树这种数据结构&#xff0c;可以描述现实生活中的很多事物&#xff0c;例如家谱、单位的组织架构、等等。 树是由n(n>1)个有限结点组成一个具有层次关系的集合。把它叫做"树"是因为它看起来像一…...

UDP猜数字游戏与TCP文件传输案例解析

目录 案例一&#xff1a;UDP协议实现的猜数字游戏 游戏概述 服务器端代码 客户端代码 (udp_client.py) 游戏特点 案例二&#xff1a;TCP协议实现的文件传输工具 工具概述 服务器端代码 客户端代码 工具特点 总结对比 案例一&#xff1a;UDP协议实现的猜数字游戏 游…...

WPF View 与ViewModel注入对象

View 和ViewModel中使用同一个类型的类&#xff0c;注入的对象在主机中通过在服务中添加 AddTransient 获取的不是同一个对象&#xff0c;在 View 绑定了在ViewModel 中是取不到的&#xff0c;应该在View 中注入ViewModel 对象&#xff0c;使用View中的ViewModel对象里面的参数…...

如何下载免费地图数据?

按照以下步骤下载免费地图数据。 1、安装GIS地图下载器 从GeoSaaS&#xff08;.COM&#xff09;官网下载“GIS地图下载器”软件&#xff1a;&#xff0c;安装完成后桌面上出现”GIS地图下载器“图标。 双击桌面图标打开”GIS地图下载器“ 2、下载地图数据 点击主界面底部的“…...

B端可视化方案,如何助力企业精准决策,抢占市场先机

在当今竞争激烈的商业环境中&#xff0c;企业需要快速、准确地做出决策以抢占市场先机。B端可视化方案通过将复杂的企业数据转化为直观的图表和仪表盘&#xff0c;帮助企业管理层和业务人员快速理解数据背后的业务逻辑&#xff0c;从而做出精准决策。本文将深入探讨B端可视化方…...

IAR打包生成的hex和.a文件的区别

IAR打包生成的hex和.a文件的区别 在使用IAR Embedded Workbench进行嵌入式开发时&#xff0c;项目生成的文件中常见的两种文件类型是HEX文件和.a文件。它们在项目开发和部署过程中扮演着不同的角色。 HEX文件 定义与用途 HEX文件是一种十六进制表示的二进制文件格式&#xf…...

黑马点评:Redis消息队列【学习笔记】

目录 当前业务存在的问题 认识消息队列 List PubSub (publish subscribe)​ Stream 单消费模式 消费者组模式 对比 异步秒杀优化 当前业务存在的问题 JVM内存限制&#xff1a;当前使用的是JDK提供的阻塞队列&#xff0c;使用的是JVM的内存&#xff0c;如果不加以限制&…...

thinkphp:部署完整项目到本地phpstudy

一、准备工作 首先准备一个thinkphp的项目文件&#xff1b;准备mysql数据库 二、小皮初步搭建 1、建立网站 在小皮界面&#xff0c;网站->创建网站->输入域名&#xff0c;选择PHP版本等 注&#xff1a;确保端口未被占用 2、将项目文件放入根目录 网站->管理->…...

关于链接库

在 C# 中&#xff0c;链接库主要分为两种类型&#xff1a;托管链接库和非托管链接库&#xff0c;以下为你详细介绍它们的特点和导入方式&#xff1a; 托管链接库 特点 托管链接库通常是用 .NET 兼容的语言&#xff08;如 C#、VB.NET 等&#xff09;编写的&#xff0c;运行在…...

小程序返回按钮,兼容所有机型的高度办法

现象 在使用返回按钮的时候在不同机型上返回按钮小图标位置总是不一样&#xff0c;一会高一会低。 原因 因为手机的状态栏一般是不一样的&#xff0c;导致设置固定高度的时候就随时在改变。 解决办法 直接获取胶囊按钮的top值和height值将返回按钮的top值设置为一样的&…...

Docker镜像迁移指南:从Windows构建到Ubuntu运行

Docker镜像迁移指南&#xff1a;从Windows构建到Ubuntu运行 本文档详细介绍如何在Windows系统中构建SVM分类服务的Docker镜像&#xff0c;并将其迁移到Ubuntu系统中运行。 项目概述 本项目是一个使用FastAPI构建的SVM图像分类服务&#xff0c;可以将上传的图像分类为五种不同…...

XR技术赋能艺术展演|我的宇宙推动东方美学体验化

本次广州展览现场引入我的宇宙XR体验模块&#xff0c;通过空间计算与动作捕捉技术&#xff0c;让观众在潮玩艺术氛围中体验虚拟互动&#xff0c;打造“看得懂也玩得动”的展演新场景。 作为科技与文化融合的推动者&#xff0c;我的宇宙正在以“体验科技”为媒介&#xff0c;为潮…...

半导体制造如何数字化转型

半导体制造的数字化转型正通过技术融合与流程重构&#xff0c;推动着这个精密产业的全面革新。全球芯片短缺与工艺复杂度指数级增长的双重压力下&#xff0c;头部企业已构建起四大转型支柱&#xff1a; 1. 数据中枢重构产线生态 台积电的「智慧工厂4.0」部署着30万物联网传感器…...