当前位置: 首页 > news >正文

基于deepseek的模型微调

使用 DeepSeek 模型(如 DeepSeek-VL、DeepSeek-Coder、DeepSeek-LLM)进行微调,可以分为几个关键步骤,下面以 DeepSeek-LLM 为例说明,适用于 Q&A、RAG、聊天机器人等方向的应用。

一、准备工作

1. 环境依赖

建议使用 transformers + accelerateLoRA 等轻量微调方案,推荐依赖如下:

pip install transformers datasets accelerate peft bitsandbytes

2. 加载 DeepSeek 模型

DeepSeek-LLM-7B/67B 模型可通过 HuggingFace 加载:

<

相关文章:

基于deepseek的模型微调

使用 DeepSeek 模型(如 DeepSeek-VL、DeepSeek-Coder、DeepSeek-LLM)进行微调,可以分为几个关键步骤,下面以 DeepSeek-LLM 为例说明,适用于 Q&A、RAG、聊天机器人等方向的应用。 一、准备工作 1. 环境依赖 建议使用 transformers + accelerate 或 LoRA 等轻量微调方…...

node.js 实战——(path模块 知识点学习)

path 模块 提供了操作路径的功能 说明path. resolve拼接规范的绝对路径path. sep获取操作系统的路径分隔符path. parse解析路径并返回对象path. basename获取路径的基础名称path. dirname获取路径的目录名path. extname获得路径的扩展名 resolve 拼接规范的绝对路径 const…...

【k8s】docker、k8s、虚拟机的区别以及使用场景

一、Docker &#xff08;一&#xff09;概念 Docker 是一个开源的应用容器引擎&#xff0c;允许开发者将应用及其依赖打包到一个可移植的容器中&#xff0c;然后发布到任何流行的 Linux 机器上&#xff0c;也可实现虚拟化。 &#xff08;二&#xff09;隔离性 Docker 的隔离…...

校园外卖服务系统的设计与实现(代码+数据库+LW)

摘 要 传统信息的管理大部分依赖于管理人员的手工登记与管理&#xff0c;然而&#xff0c;随着近些年信息技术的迅猛发展&#xff0c;让许多比较老套的信息管理模式进行了更新迭代&#xff0c;外卖信息因为其管理内容繁杂&#xff0c;管理数量繁多导致手工进行处理不能满足广…...

Windows上使用Python 3.10结合Appium-实现APP自动化

一、准备工作 所需条件&#xff1a; Windows 10/11 操作系统 Python 3.10.x&#xff08;建议3.10.9&#xff09; Java JDK 8 或以上&#xff08;建议JDK 8u301&#xff09; Node.js 14.x 或以上&#xff08;建议14.21.3&#xff09; Appium Server 1.22.x 或以上&#xff08;建…...

【计算机视觉】CV项目实战- SiamMask 单阶段分割跟踪器

SiamMask 单阶段分割跟踪器 一、项目概述与技术原理1.1 核心技术创新1.2 性能优势 二、实战环境搭建2.1 系统要求与依赖安装2.2 项目编译与配置 三、模型推理实战3.1 快速体验Demo3.2 常见运行时错误处理 四、模型训练指南4.1 数据准备流程4.2 训练执行与监控 五、高级应用与优…...

计算机视觉基础

1. 数字图像的基本概念 像素&#xff08;Pixel&#xff09;&#xff1a;图像的最小构成单元&#xff0c;每个像素存储亮度或颜色信息。 灰度图像&#xff1a;每个像素是 0&#xff08;黑&#xff09;~255&#xff08;白&#xff09; 的标量值&#xff08;8位无符号整数&#x…...

系统编程_进程间通信机制_消息队列与共享内存

消息队列概述 消息有类型&#xff1a;每条消息都有一个类型&#xff0c;就像每封信都有一个标签&#xff0c;方便分类和查找。消息有格式&#xff1a;消息的内容有固定的格式&#xff0c;就像每封信都有固定的信纸格式。随机查询&#xff1a;你可以按类型读取消息&#xff0c;…...

一种免费的离线ocr-汉字识别率100%

一般我们手机中常用的ocr库有&#xff0c;Tesseract&#xff0c;paddle ocr&#xff0c;EasyOCR&#xff0c; ocrLite等等&#xff0c;这些ocr库中百度的paddle ocr效果最好&#xff0c;但是再好的效果也会偶尔识别错几个汉字。当我们在做自动化脚本过程中&#xff0c;如果识别…...

Maven 工程中的pom.xml 文件(图文)

基本信息 单工程项目【pom.xml文件】中最基本的信息。 依赖引入 可以在Maven 中央仓库查找所需依赖&#xff1a;【直达&#xff1a;https://mvnrepository.com/】。 在【dependencies】标签中添加所需依赖。 <dependency><groupId>com.baomidou</groupId&g…...

图像预处理-模板匹配

就是用模板图在目标图像中不断的滑动比较&#xff0c;通过某种比较方法来判断是否匹配成功,找到模板图所在的位置。 - 不会有边缘填充。 - 类似于卷积&#xff0c;滑动比较&#xff0c;挨个比较象素。 - 返回结果res大小是&#xff1a;目标图大小-模板图大小1&#xff08;H-…...

操作系统学习笔记

2.4 死锁 在学习本节时&#xff0c;请读者思考以下问题&#xff1a; 1&#xff09;为什么会产生死锁&#xff1f;产生死锁有什么条件&#xff1f; 2&#xff09;有什么办法可以解决死锁问题&#xff1f; 学完本节&#xff0c;读者应了解死锁的由来、产…...

5.4.云原生与服务网格

目录 1. Kubernetes与微服务集成 1.1 容器化部署规范 • 多环境配置管理&#xff08;ConfigMap与Nacos联动&#xff09; • 健康检查探针配置&#xff08;Liveness/Readiness定制策略&#xff09; 1.2 弹性服务治理 • HPA自动扩缩容规则设计 • Sentinel指标驱动弹性伸缩 2…...

[特殊字符]‍[特殊字符]Linux驱动开发入门 | 并发与互斥机制详解

文章目录 &#x1f468;‍&#x1f4bb;Linux驱动开发入门 | 并发与互斥机制详解&#x1f4cc;为什么驱动中需要并发和互斥控制&#xff1f;&#x1f4a1;常见的并发控制机制&#x1f510;自旋锁和信号量通俗理解&#x1f300;自旋锁&#xff08;Spinlock&#xff09;——“厕所…...

时序数据库IoTDB自研的Timer模型介绍

一、引言 时序数据库在支持时序特性写入、存储、查询等功能的基础上&#xff0c;正逐步向深度分析领域迈进。自动化异常监测与智能化趋势预测已成为时序数据管理的核心需求。为了满足这些需求&#xff0c;时序数据库IoTDB团队积极探索&#xff0c;成功自研推出了面向时间序列的…...

RabbitMQ 详解(核心概念)

本文是博主在梳理 RabbitMQ 知识的过程中&#xff0c;将所遇到和可能会遇到的基础知识记录下来&#xff0c;用作梳理 RabbitMQ 的整体架构和功能的线索文章&#xff0c;通过查找对应的知识能够快速的了解对应的知识而解决相应的问题。 文章目录 一、RabbitMQ 是什么&#xff1f…...

【数据结构和算法】6. 哈希表

本文根据 数据结构和算法入门 视频记录 文章目录 1. 哈希表的概念1.1 哈希表的实现方式1.2 哈希函数&#xff08;Hash Function&#xff09;1.3 哈希表支持的操作 2. Java实现 在前几章的学习中&#xff0c;我们已经了解了数组和链表的基本特性&#xff0c;不管是数组还是链表…...

RHCE第三次作业 搭建dns的正向解析服务器

server为服务器 client为客户端 设置主配置文件 在server下&#xff1a; [rootServer ~]#vim /etc/named.conf #进入到配置页面&#xff0c;并修改 设置区域文件 [rootServer ~]# vim /etc/named.rfc1912.zones 设置域名解析文件 [rootServer named]# cd /var/named…...

【每天一个知识点】如何解决大模型幻觉(hallucination)问题?

解决大模型幻觉&#xff08;hallucination&#xff09;问题&#xff0c;需要从模型架构、训练方式、推理机制和后处理策略多方面协同优化。 &#x1f9e0; 1. 引入 RAG 框架&#xff08;Retrieval-Augmented Generation&#xff09; 思路&#xff1a; 模型生成前先检索知识库中…...

Python深拷贝与浅拷贝:避开对象复制的陷阱

目录 一、为什么需要区分深浅拷贝&#xff1f; 二、内存中的对象真相 三、浅拷贝的真相 四、深拷贝的奥秘 五、自定义对象的拷贝 六、性能对比实验 七、常见陷阱与解决方案 八、最佳实践指南 九、现代Python的拷贝优化 结语 一、为什么需要区分深浅拷贝&#xff1f; …...

批量处理多个 Word 文档:插入和修改页眉页脚,添加页码的方法

Word 页眉页脚的设置在日常工作中非常常见&#xff0c;尤其是需要统一格式的文档&#xff0c;如毕业论文、公司内部资料等。在这些文档中&#xff0c;页眉页脚通常包含时间、公司标志、文档标题、文件名或作者姓名等信息。有时&#xff0c;我们不仅需要简单的文字页眉页脚&…...

大语言模型(LLM)的Prompt Engineering:从入门到精通

大语言模型&#xff08;LLM&#xff09;的Prompt Engineering&#xff1a;从入门到精通 系统化学习人工智能网站&#xff08;收藏&#xff09;&#xff1a;https://www.captainbed.cn/flu 引言&#xff1a;Prompt Engineering——解锁AI生产力的金钥匙 当ChatGPT在2023年引爆…...

poi生成横向文档以及复杂表头

代码: //创建页面并且创建横向A4XWPFDocument doc new XWPFDocument();CTDocument1 document doc.getDocument();CTBody body document.getBody();if (!body.isSetSectPr()) {body.addNewSectPr();}CTSectPr section body.getSectPr();if (!section.isSetPgSz()) {section.…...

深入剖析TCP协议(内容二):从OSI与TCP/IP网络模型到三次握手、四次挥手、状态管理、性能优化及Linux内核源码实现的全面技术指南

文章目录 常见问题TCP和UDPISNUDPTCP数据可靠性TCP协议如何提高传输效率TCP如何处理拥塞 SocketTCP源码tcp_v4_connect()sys_accept()tcp_accept()三次握手客户端发送SYN段服务端发送SYN和ACK处理客户端回复确认ACK段服务端收到ACK段 常见问题 TCP和UDP TCP和UDP的区别&#…...

流程架构是什么?为什么要构建流程架构,以及如何构建流程结构?

本文从&#xff1a;流程架构是什么&#xff1f;为什么要构建流程架构&#xff1f;如何构建流程结构三个方面来介绍。 一、首先&#xff0c;我们来了解流程架构是什么&#xff1f; 流程架构是人体的骨架&#xff0c;是大楼的砌筑&#xff0c;是课本的目录&#xff0c;是流程管理…...

Visium HD多样本拼片拆分

Visium HD实验的时候一个捕获区域内可以包含多个样本拼片&#xff08;例如多个组织切片或不同样本的排列&#xff09;是常见的实验设计&#xff0c;多样本拼片能够提升实验效率&#xff0c;单张玻片处理多个样本&#xff0c;降低试剂和测序成本&#xff0c;后续分析的时候只需要…...

3DMAX零售商店生成插件RetailStore自定义贴图库方法详解

3DMAX零售商店生成插件——RetailStore&#xff0c;是一款兼具简洁性与复杂性的工具&#xff0c;专为通过样条线快速创建零售商店而设计。用户只需绘制一条街道廓线&#xff0c;轻点鼠标&#xff0c;即可生成一排随机的零售商店。该插件会在每个样条线段上自动生成一个店铺&…...

从性能到安全:大型网站系统架构演化的 13 个核心维度

大型网站系统架构的演化是一个复杂的过程&#xff0c;涉及到多个维度的技术内容&#xff0c;从关键维度进行详细分析&#xff1a; 1.性能维度 缓存技术&#xff1a;包括浏览器缓存、CDN&#xff08;内容分发网络&#xff09;缓存、服务器端缓存&#xff08;如 Memcached、Red…...

昆仑万维开源SkyReels-V2,近屿智能紧跟AI技术趋势

昆仑万维 SkyReels 团队正式发布并开源全球首个采用扩散强迫框架的无限时长电影生成模型 SkyReels-V2&#xff0c;其通过融合多模态大语言模型、多阶段预训练、强化学习与扩散强迫框架实现协同优化&#xff0c;推动视频生成技术进入新阶段。该模型聚焦解决现有技术在提示词遵循…...

Milvus(4):创建 Collections

1 创建 Collections 可以通过定义 Schema、索引参数、度量类型以及创建时是否加载来创建一个 Collection。 1.1 集合概述 Collection 是一个二维表&#xff0c;具有固定的列和变化的行。每列代表一个字段&#xff0c;每行代表一个实体。要实现这样的结构化数据管理&#xff0c…...

数据预处理:前缀和算法详解

数据预处理&#xff1a;前缀和算法详解 文章目录 数据预处理&#xff1a;前缀和算法详解1.算法原理2.算法作用3.C代码实现4.实战题目 1.算法原理 基本概念 前缀和&#xff08;Prefix Sum&#xff09;是一种常用的数据预处理技术&#xff0c;它可以快速求解区间和问题&#xf…...

盈达科技:登顶GEO优化全球制高点,以AICC定义AI时代内容智能优化新标杆

一、技术制高点——全球独创AICC系统架构&#xff0c;构建AI内容优化新范式 作为全球首个实现AI内容全链路优化的技术供应商&#xff0c;盈达科技凭借AICC智能协同中心&#xff08;自适应内容改造、智能数据投喂、认知权重博弈、风险动态响应四大引擎&#xff09;&#…...

【Linux】详细介绍进程的概念

目录 一、初识进程概念 真正的进程概念如下&#xff1a; 二、Linux中PCB的操作系统学科叫法&#xff1a;task_struct 1、简单认识task_ struct内容分类 2、问题&#xff1a;操作系统怎么知道当前程序执行到哪一行代码了&#xff1f; 三、linux关于进程的常用指令&#xff…...

mybatis框架补充

一&#xff0c;#{} 和${}区别 1.传数值 #{} 占位符&#xff0c;是经过预编译的&#xff0c;编译好SQL语句再取值&#xff0c;#方式能够防止sql注入 eg&#xff1a;#{}&#xff1a;delete from admin where id #{id} 结果&#xff1a; dalete from admin where id &#x…...

Alertmanager的安装和详细使用步骤总结

一、安装步骤 1. 二进制安装 下载与解压 从GitHub下载最新版本&#xff08;如v0.23.0&#xff09;&#xff1a;wget https://github.com/prometheus/alertmanager/releases/download/v0.23.0/alertmanager-0.23.0.linux-amd64.tar.gz tar -xzf alertmanager-0.23.0.linux-amd6…...

C++学习:六个月从基础到就业——C++学习之旅:STL迭代器系统

C学习&#xff1a;六个月从基础到就业——C学习之旅&#xff1a;STL迭代器系统 本文是我C学习之旅系列的第二十四篇技术文章&#xff0c;也是第二阶段"C进阶特性"的第二篇&#xff0c;主要介绍C STL迭代器系统。查看完整系列目录了解更多内容。 引言 在上一篇文章中…...

缓存与数据库一致性方案

一、缓存更新策略概述 在现代分布式系统中&#xff0c;缓存作为数据库的前置层&#xff0c;能显著提升系统性能。然而&#xff0c;缓存与数据库之间的数据一致性是一个经典难题。以下是三种常见的缓存更新策略及其优缺点分析。 二、方案对比分析 方案一&#xff1a;直接更新…...

国内ip地址怎么改?详细教程

在中国&#xff0c;更改IP地址需要遵守规则&#xff0c;并确保所有操作合规。在特定情况下&#xff0c;可能需要修改IP地址以满足不同需求或解决特定问题。以下是一些常见且合法的IP地址变更方法及注意事项&#xff1a; 一、理解IP地址 IP地址是设备在网络中的唯一标识&#x…...

通过Quartus II实现Nios II编程

目录 一、认识Nios II二、使用Quartus II 18.0Lite搭建Nios II硬件部分三、软件部分四、运行项目 一、认识Nios II Nios II软核处理器简介 Nios II是Altera公司推出的一款32位RISC嵌入式处理器&#xff0c;专门设计用于在FPGA上运行。作为软核处理器&#xff0c;Nios II可以通…...

拥抱基因体检,迎接精准健康管理新时代

2025年4月20日&#xff0c;由早筛网、细胞科技网联合中国食品药品企业质量安全促进会细胞医药分会、中国抗衰老促进会健康管理工作委员会、中国抗癌协会肿瘤分子医学专业委员会、广东省保健协会&#xff0c;伯温生物冠名支持的《基因体检赋能精准健康管理新时代》圆满召开。 伯…...

QT容器类控件及其属性

Group Box 使用QGroupBox实现一个带有标题的分组框&#xff0c;可以把其它的控件放到里面作为一组 例&#xff1a; 核心属性 属性 说明 title 分组框的标题 alignment 分组框内部内容的对齐方式 flat 是否”扁平模式” checkable 是否可选中 设为true&#xff0c;则…...

云原生--CNCF-3-核心工具介绍(容器和编排、服务网格和通信、监控和日志、运行时和资源管理,安全和存储、CI/CD等)

1、核心工具分类介绍 &#xff08;1&#xff09;、容器编排与管理 1、Docker 它是一款轻量级的容器化技术&#xff0c;可把应用及其依赖打包成独立的容器。借助Docker&#xff0c;开发者能够确保应用在不同环境中保持一致的运行状态。比如在开发环境中创建的容器&#xff0c…...

网络基础知识

文章目录 一、网络架构1. 网络架构图2. 各层级功能3. 机房网络常见问题及解决方案 二、交换技术1. 交换技术基础2. 交换技术分类3. 广播域相关概念4. ARP 协议5. 三层交换机6. VLAN&#xff08;虚拟局域网&#xff09; 三、路由技术1. 路由器端口类型及功能2. 路由器功能3. 路由…...

第3课:运算符与流程控制——JS的“决策者”

一切美好都值得你全力以赴。即使过程艰难&#xff0c;但只要坚持&#xff0c;必有回响。加油&#xff01; 欢迎来到「JavaScript 魔法学院」第 3 课&#xff01;今天我们将化身代码世界的“指挥官”&#xff0c;用运算符计算数据&#xff0c;用流程控制做出决策&#xff01;文…...

VUE3中使用echarts,配置都正确,不出现tooltip

在vue3中使用echarts&#xff0c;出现个别问题&#xff0c;需要注意echars对象的定义&#xff0c;不能使用reactive或者ref定义响应式变量&#xff0c;要使用shallowRef &#xff1b; shallowRef 是 Vue 3 提供的一个 API&#xff0c;它创建一个响应式引用(ref)&#xff0c;但…...

Python实现邮件发送

一、创造灵感 这几天在指导学生做毕业设计&#xff0c;学生做的是跌倒检测。然后我突然想到&#xff0c;如果这个系统只是单纯地从视频流中检测到人的跌倒动作&#xff0c;其实并没有任何的用途和意义。于是&#xff0c;我又想到&#xff0c;如果跌倒的检测结果&#xff0c;能…...

OSPF的优化

OSPF的优化 1、汇总 --- 减少骨干区域LSA的更新量 汇总 --- 区域汇总 域间路由汇总 --- 在ABR设备上&#xff0c;针对3类LSA进行汇总 [r1-ospf-1-area-0.0.0.2]abr-summary 192.168.0.0 255.255.252.0 注&#xff1a;在进行域间路由汇总时&#xff0c;必须是ABR设备自己通过拓…...

IP-guard离线卸载客户端及清除策略说明

1、控制台生成客户端工具 控制台选择“工具-客户端工具-客户端离线辅助工具”&#xff0c;可生成客户端离线卸载工具及 离线策略清除工具&#xff0c;打包生成exe后&#xff0c;可在离线的客户端上运行&#xff0c;实现离线情况下对客户端 进行卸载或者清除策略。 在控制台上“…...

腾讯秋招面试题:bug生命周期中有哪些状态?

在软件测试中,Bug生命周期是质量管控的核心脉络。不同企业的流程或有差异,但核心状态遵循行业通用规范。以下以腾讯TAPD缺陷管理模型为基础,结合互联网大厂主流实践,详解Bug生命周期的关键状态及流转逻辑。 一、基础状态图谱 图表 代码 下载 确认有效 非缺陷/需求不符…...

PyCharm 链接 Podman Desktop 的 podman-machine-default Linux 虚拟环境

#工作记录 PyCharm Community 连接到Podman Desktop 的 podman-machine-default Linux 虚拟环境详细步骤 1. 准备工作 确保我们已在 Windows 系统中正确安装并启动了 Podman Desktop。 我们将通过 Podman Desktop 提供的名为 podman-machine-default 的 Fedora Linux 41 WSL…...