本地部署DeepSeek后的调用与删除全攻略
在本地成功部署DeepSeek模型后,如何高效调用它发挥其强大功能,以及在不需要时妥善删除,是很多用户关注的重点。我也在后台接到了很多粉丝的留言,询问 DeepSeek 本地部署之后的一些调用和删除的问题,于是我在网上找了现在主流热门的三种本地部署方案,对照他们的部署方式对出了调用和删除的指令,接下来,我们将从不同的部署方式入手,详细介绍对应的调用和删除方法。
当然你如果不了解 DeepSeek,这几篇文章会让你快速领略 DeepSeek 的风采:
热榜好文:
DeepSeek各版本说明与优缺点分析
DeepSeek-R1不同版本的 1.5B、7B、8B、14B、32B、70B、671B 主要区别以及各个蒸馏版本的优缺点
实用操作:
【大模型】深度解读 DeepSeek - R1 提示词
【大模型】DeepSeek-R1 论文原文翻译 + 解读
如何让DeepSeek成为你的私人客服:DeepSeek接入微信一文全解析
好了话不多说,接下来进入我们今天的主题环节。
一、基于Hugging Face部署的DeepSeek模型调用与删除
(一)调用方法
-
安装依赖:确保已经安装
transformers
库,使用pip install transformers
命令完成安装。如果模型运行还依赖其他特定库,如torch
等,也需一并安装。 -
代码调用示例:
from transformers import AutoTokenizer, AutoModelForCausalLM# 加载模型和分词器,替换为实际本地模型路径
tokenizer = AutoTokenizer.from_pretrained("your_local_deepseek_model_path")
model = AutoModelForCausalLM.from_pretrained("your_local_deepseek_model_path")# 输入文本
input_text = "请描述一下未来城市的样子"# 对输入文本进行编码
input_ids = tokenizer.encode(input_text, return_tensors='pt')# 使用模型生成文本
output = model.generate(input_ids, max_length=200, num_beams=5, early_stopping=True)# 解码生成的文本
generated_text = tokenizer.decode(output[0], skip_special_tokens=True)
print(generated_text)
在上述代码中,先导入所需类,接着从本地路径加载模型和分词器,然后对输入文本编码,输入模型生成文本,最后解码并输出结果 。
(二)删除方法
-
删除模型文件:定位到本地部署的DeepSeek模型文件夹,直接手动删除整个文件夹。若使用的是Linux系统,可在终端中使用
rm -rf your_local_deepseek_model_path
命令删除;Windows系统则直接在文件资源管理器中找到对应文件夹删除。 -
清理缓存和依赖:运行
transformers
库提供的清理缓存命令transformers-cli clear -f
,清除可能残留的缓存文件。对于不再使用的相关依赖库,使用pip uninstall
命令进行卸载,如pip uninstall transformers
。
二、通过Ollama部署的DeepSeek模型调用与删除
(一)调用方法
-
安装Ollama:
-
Linux系统:在终端执行
curl -fsSL https://ollama.com/install.sh | sh
命令完成安装。 -
其他系统:可前往Ollama官网(https://ollama.com/),根据对应系统下载安装包进行安装。
-
-
拉取模型:在命令行中输入
ollama run deepseek - r1:1.5b
(以deepseek - r1:1.5b模型为例,可根据实际需求替换模型名称和版本),等待模型下载完成。
这里在1的位置可以更换 DeepSeek 的蒸馏模型,更换之后2的位置会出现 DeepSeek 安装指令,最后在3的位置点击复制,打开终端进行安装即可
- 运行模型:模型下载完成后,执行
ollama run deepseek - r1:1.5b
,在命令行中即可与模型进行交互,输入问题获取回答。
(二)删除方法
- 删除模型:在命令行中输入
ollama rm deepseek - r1:1.5b
,即可删除指定的DeepSeek模型。当然你如果还在模型的交互界面,可以先输入 Ctrl + D 来退出交互模式,ollama rm deepseek - r1:1.5b
这条语句是用来删除 deepseek - r1:1.5b 模型的,大家可以根据自己的模型来进行更改。
如果出现下面这条语句,就证明你已经成功删除了ollama rm deepseek - r1:1.5b
模型。
- 清理缓存:使用
ollama cache clean
命令,清理Ollama运行过程中产生的缓存文件,释放磁盘空间。
三、在Google Colab中部署的DeepSeek模型调用与删除
(一)调用方法
以下是在Hugging Face相关环境下关于DeepSeek模型的调用与删除方法:
调用方法
- 使用transformers库
- 安装依赖:确保已经安装了
transformers
库、torch
等相关依赖。如果没有,可使用pip install transformers torch
进行安装。 - 加载模型:在Python代码中,使用以下方式加载DeepSeek模型。假设要加载
deepseek-coder-1.3b-instruct-function-calling-v2
模型,示例代码如下:
- 安装依赖:确保已经安装了
from transformers import AutoTokenizer, AutoModelForCausalLMtokenizer = AutoTokenizer.from_pretrained("Trelis/deepseek-coder-1.3b-instruct-function-calling-v2")
model = AutoModelForCausalLM.from_pretrained("Trelis/deepseek-coder-1.3b-instruct-function-calling-v2")
- 生成文本:加载完模型和分词器后,就可以进行文本生成等操作,示例代码如下:
input_text = "写一个简单的Python函数"
input_ids = tokenizer.encode(input_text, return_tensors="pt")
output = model.generate(input_ids, max_length=100)
generated_text = tokenizer.decode(output[0], skip_special_tokens=True)
print(generated_text)
-
使用text-generation-inference工具
-
安装部署:按照
text-generation-inference
的官方文档进行安装和部署。可以通过pip install text-generation-inference
安装,然后根据提示进行配置。 -
启动服务:安装完成后,使用命令
text-generation-server --model-id Trelis/deepseek-coder-1.3b-instruct-function-calling-v2
启动服务,这里将Trelis/deepseek-coder-1.3b-instruct-function-calling-v2
替换为实际要使用的DeepSeek模型名称即可。 -
发送请求:服务启动后,可以通过HTTP请求来调用模型。示例代码如下:
-
import requestsurl = "http://localhost:8080/generate"
data = {"inputs": "请用Java写一个冒泡排序算法"}
response = requests.post(url, json=data)
print(response.json())
删除方法
- 通过Hugging Face Hub删除
-
登录账号:在Hugging Face官网登录自己的账号。
-
Hugging Face官网:https://huggingface.co/
-
找到模型:进入自己的模型仓库,找到要删除的DeepSeek模型对应的项目。
-
删除操作:点击模型项目页面中的相关删除按钮或选项,按照提示确认删除操作。
-
- 通过本地缓存删除
- 找到缓存路径:Hugging Face模型的缓存路径通常在
~/.cache/huggingface/hub
目录下。如果是Windows系统,一般在C:\Users\[用户名]\.cache\huggingface\hub
。 - 删除模型文件:进入对应的模型缓存目录,删除与要删除的DeepSeek模型相关的所有文件和文件夹。
- 找到缓存路径:Hugging Face模型的缓存路径通常在
无论采用哪种方式本地部署DeepSeek模型,在调用时都要确保环境配置正确,在删除时要谨慎操作,避免误删重要文件,确保系统资源的合理管理和使用 。
相关文章:
本地部署DeepSeek后的调用与删除全攻略
在本地成功部署DeepSeek模型后,如何高效调用它发挥其强大功能,以及在不需要时妥善删除,是很多用户关注的重点。我也在后台接到了很多粉丝的留言,询问 DeepSeek 本地部署之后的一些调用和删除的问题,于是我在网上找了现…...
Qt Designer菜鸟使用教程(实现一个本地英文翻译软件)
1 安装Qt Designer 安装这个包的时候会自带安装 Qt Designer, 安装目录为python的安装根目录的 Lib/site-packages/qt5_applications/Qt/bin 目录下。 pip install pyqt5-tools2 新建窗体 2.1 新建主窗体 创建之后如下图: 设置主窗口大小: 设置窗…...
C++ 洗牌函数std::shuffle的用法
目录 1.简介 2.工作原理 3.std::shuffle 与 std::random_shuffle 的区别 4.rand 和 srand 5.std::shuffle 的使用方法 6.随机数生成器和分布器 7.注意事项 1.简介 std::shuffle 是 C 标准库中用于对序列进行随机重排(洗牌)的一种算法。它可以将容…...
MySQL InnoDB引擎 MVCC
MVCC(Multi-Version Concurrency Control)即多版本并发控制,是 MySQL 的 InnoDB 存储引擎实现并发控制的一种重要技术。它在很多情况下避免了加锁操作,从而提高了数据库的并发性能。 一、原理 MVCC 的核心思想是通过保存数据在某…...
【Elasticsearch】simple_query_string
Elasticsearch 的simple_query_string查询是一种灵活且容错性较强的查询方式,它允许用户通过简单的语法构造查询字符串,以实现对文档的搜索。以下是关于simple_query_string查询的详细说明: 1.基本概念 simple_query_string查询是一种基于字…...
数据结构 04
4. 栈 4.2. 链式栈 4.2.1. 特性 逻辑结构:线性结构 存储结构:链式存储结构 操作:创建,入栈,出栈,清空,获取 4.2.2. 代码实现 头文件 LinkStack.h #ifndef __LINKSTACK_H__ #define __LINKST…...
Java并发中的上下文切换、死锁、资源限制
在Java并发编程中,上下文切换、死锁和资源限制是开发者经常需要面对的问题。这些问题不仅会影响程序的性能,还可能导致程序无法正常运行。本文将深入探讨这些问题的原理、影响以及如何在实际开发中避免或解决它们。 目录 1. 上下文切换(Con…...
DeepSeek教unity------MessagePack-01
MessagePack是C# 的极速 MessagePack 序列化器。它比 MsgPack-Cli 快 10 倍,并且性能超过其他 C# 序列化器。MessagePack for C# 还内置支持 LZ4 压缩——一种极其快速的压缩算法。性能在诸如游戏、分布式计算、微服务或数据缓存等应用中尤为重要。 这个库通过 NuGe…...
【大语言模型】最新ChatGPT、DeepSeek等大语言模型助力高效办公、论文与项目撰写、数据分析、机器学习与深度学习建模等科研应用
ChatGPT、DeepSeek等大语言模型助力科研应用 随着人工智能技术的快速发展,大语言模型如ChatGPT和DeepSeek在科研领域的应用正在为科研人员提供强大的支持。这些模型通过深度学习和大规模语料库训练,能够帮助科研人员高效地筛选文献、生成论文内容、进行数…...
泰勒公式推导以及常用展开式与近似计算
泰勒公式的基本思想是通过函数在某点的导数来逐渐构建一个多项式,该多项式能够近似函数在该点附近的值。我们通过一次次引入导数来改进近似,从而得到一个无限级数的展开。 准备工作:函数的定义和导数 假设我们有一个函数 f ( x ) f(x) f(x)…...
深入解析A2DP v1.4协议:蓝牙高质量音频传输的技术与实现
1. A2DP概述 A2DP(Advanced Audio Distribution Profile)是一种高质量音频流媒体协议,旨在实现高质量音频内容的分发,通常用于通过蓝牙设备传输音频数据,例如将音乐从便携式播放器传输到耳机或扬声器。与传统的蓝牙语…...
STM32引脚VBAT和RTC的关系
一、RTC简介 1、RTC (Real Time Clock):实时时钟。RTC是个独立的定时器。RTC模块拥有一个连续计数的计数器,在相应的软件配置下,可以提供时钟日历的功能。修改计数器的值可以重新设置当前时间和日期。RTC还包含用于管理低功耗模式的自动唤醒单…...
untiy 3d 混合动画
1.创建动画控制器 挂在到人物模型上 效果 20250213_170924...
django配置跨域
1、第一种 from django.views.decorators.csrf import csrf_exemptcsrf_exempt第二种 安装 pip install django-cors-headers在配置文件settings.py进入 INSTALLED_APPS [..."corsheaders", # 添加 ]MIDDLEWARE [corsheaders.middleware.CorsMiddleware, # 添加…...
【设计模式】【行为型模式】迭代器模式(Iterator)
👋hi,我不是一名外包公司的员工,也不会偷吃茶水间的零食,我的梦想是能写高端CRUD 🔥 2025本人正在沉淀中… 博客更新速度 👍 欢迎点赞、收藏、关注,跟上我的更新节奏 🎵 当你的天空突…...
前端面试题目---页面抖动的原因、如何避免、如何解决
前端页面抖动是一个常见且影响用户体验的问题,下面将从抖动发生的场景、解决办法以及预防措施三个方面进行详细阐述。 页面抖动发生的场景 1. 元素尺寸动态变化 图片加载:当页面中图片的宽高没有预先设定,在图片加载完成后,其实…...
DeepSeek 突然来袭,AI 大模型变革的危机与转机藏在哪?
随着人工智能技术的飞速发展,大模型领域不断涌现出具有创新性的成果。DeepSeek 的横空出世,为 AI 大模型领域带来了新的变革浪潮。本文将深入探讨 DeepSeek 出现后 AI 大模型面临的危机与转机。 冲冲冲!!! 目录 一、…...
将Sqlite3数据库挂在内存上处理
创作灵感:最近把小学生的口算题从2位数改到3位数,100以内四则运算练习(千纬数学)再次更新,选取难题-CSDN博客要不断刷题目,以前100以内的加减乘除也是这样刷出来的,代码如下: impor…...
#用于跟踪和反映数据源对象的变化--useMagical
import { cloneDeep } from lodash-es import { reactive, ref, watchEffect } from vue /*** 神奇函数* param source 数据源,* param initKey 固定需要返回的属性* description 收集数据源中修改的属性,并返回* version 1.0 仅支持对象* author sufei* return { source, resu…...
基于微信小程序的场地预约设计与实现
第3章 系统设计 3.1系统设计目标 本系统的实现可以帮助体育馆场地信息的管理。帮助管理员对注册用户管理以及用户预约管理。同时可以帮助用户进行场地预约。本系统可以实现用户足不出户预约到需要的场地,为用户提供场地信息了解的平台。 3.2系统功能结构图 本系统的…...
1446. 连续字符 简单
1446. 连续字符https://leetcode.cn/problems/consecutive-characters/ 给你一个字符串 s ,字符串的「能量」定义为:只包含一种字符的最长非空子字符串的长度。 请你返回字符串 s 的 能量。 示例 1: 输入:s "leetcode"…...
多张图片合成PDF
昨天接了一个家教,在网上搜集了一些图片格式的素材,但想要发给学生家长打印,都是图片格式可能不太方便,就想着合成pdf文件之后再发给家长。 试用了“samll*”一次,就需要充值vip了,所以就用python自己写了…...
【办公】钉钉修改默认存储位置,释放C盘空间
Step1: 右击钉钉图标选择设置 Step2: 通用里面找到文件保存位置,修改文件目录: 最新版本钉钉界面: 设置完成后按提示重启即可!...
VLLM历次会议(2024.7)
支持LLama3.1: 量化: vllm git下的子项目:llm-compressor CPU offloading 允许跑更大的模型;会变慢些;在CPU-GPU之间有NVLink的机器上,变慢的幅度小。 新增对Medusa(用1个Head并行推出好几个…...
进程等待与进程替换
目录 一、进程等待 1.1 为什么要等待子进程? 1.2 等待的两种方式 1.2.1 wait函数 1.2.2 waitpid函数 1.3 获取子进程的退出状态 1.4 示例代码 阻塞式等待(同步) 非阻塞等待(异步) 二、进程替换 2.1 什么是进…...
C# CultureInfo 地区影响字符串
问题 线上遇到有玩家资源加载异常,发现资源路径出现异常字符: 发现是土耳其语下字符串转小写不符合预期: "I".ToLower() -> ı 解决方案 String.ToLower 改成 String.ToLowerInvariant 全局修改禁用文化差异:ht…...
走进 Tcl 语言:历史、特性与应用
亲爱的小伙伴们😘,在求知的漫漫旅途中,若你对深度学习的奥秘、Java 与 Python 的奇妙世界,亦或是读研论文的撰写攻略有所探寻🧐,那不妨给我一个小小的关注吧🥰。我会精心筹备,在未来…...
CNN-LSSVM卷积神经网络最小二乘支持向量机多变量多步预测,光伏功率预测
代码地址:CNN-LSSVM卷积神经网络最小二乘支持向量机多变量多步预测,光伏功率预测 CNN-LSSVM卷积神经网络最小二乘支持向量机多变量多步预测,光伏功率预测 一、引言 1、研究背景和意义 光伏发电作为可再生能源的重要组成部分,近…...
使用MaxKB及deepseek搭建本地AI知识库
序 本文主要研究一下如何MaxKB及deepseek搭建本地AI知识库 步骤 拉取MaxKB镜像 docker pull cr2.fit2cloud.com/1panel/maxkb如果拉取不下来就用docker.1ms.run/1panel/maxkb 启动MaxKB docker run -d --namemaxkb --restartalways -p 8080:8080 \ -v ~/.maxkb:/var/lib/p…...
一文通俗理解为什么需要泛型以及泛型的使用
为什么需要泛型? public static void main(String[] args) {ArrayList list new ArrayList();// 由于集合没有做任何限定,任何类型都可以给其中存放list.add("abc");list.add("def");list.add(5);Iterator it list.iterator();wh…...
凸包算法—— cad c#二次开发
效果如下: 代码如下: using IfoxDemo; //[assembly: CommandClass(typeof(IFoxDemo.凸包class))]//只允许此类快捷键命令 namespace IFoxDemo {public class 凸包class{public static class 凸包助手{/// <summary>/// 计算点集的凸包并返回多段线…...
Eclipse JSP/Servlet 深入解析
Eclipse JSP/Servlet 深入解析 引言 随着互联网的快速发展,Java Web开发技术逐渐成为企业级应用开发的主流。在Java Web开发中,JSP(JavaServer Pages)和Servlet是两个核心组件,它们共同构成了Java Web应用程序的基础。本文将深入解析Eclipse平台下的JSP/Servlet技术,帮…...
grep如何排除多个目录?
在使用 grep 进行文本搜索时,有时候需要排除多个目录,避免在这些目录下进行搜索。下面介绍几种不同的实现方式。 目录 1.使用 -r 和 --exclude-dir 选项(GNU grep) 2.使用扩展正则表达式和 -P 选项(GNU grep&#x…...
linux ollama deepseek等大语言模型的model文件的存储目录
linux ollama deepseek等大语言模型的model文件的存储目录 一、用ollama serve启动的,模型数据存放在: /usr/share/ollama/.ollama/models二、如果在自启动文件中指定了工作目录,则在工作目录下的.ollama/models 1.自启动服务 /etc/system…...
React进阶之React核心源码解析(二)
React核心源码解析 diff单一节点比较diff多节点比较diff两轮遍历比较第一轮比较第二轮比较 Update 状态更新Concurrent Mode diff 一共两个阶段 render:内存中的更新,主要是通过递归的过程,来将react变化的部分,在内存中找到哪些…...
八、OSG学习笔记-
前一章节: 七、OSG学习笔记-碰撞检测-CSDN博客https://blog.csdn.net/weixin_36323170/article/details/145558132?spm1001.2014.3001.5501 一、了解OSG图元加载显示流程 本章节代码: OsgStudy/wids CuiQingCheng/OsgStudy - 码云 - 开源中国https:…...
Python实现随机森林(Random Forest)算法
随机森林(Random Forest)是一种集成学习方法,通过构建多个决策树并结合它们的预测结果来提高模型的准确性和稳定性。下面是一个使用Python实现随机森林算法的示例。我们将使用scikit-learn库,它提供了方便的接口来实现随机森林。 …...
平方数列与立方数列求和的数学推导
先上结论: 平方数列求和公式为: S 2 ( n ) n ( n 1 ) ( 2 n 1 ) 6 S_2(n) \frac{n(n1)(2n1)}{6} S2(n)6n(n1)(2n1) 立方数列求和公式为: S 3 ( n ) ( n ( n 1 ) 2 ) 2 S_3(n) \left( \frac{n(n1)}{2} \right)^2 S3(n)(2n(n1)…...
new和malloc的区别
new malloc流程 new new流程 调用operator new 分配内存:在free store 生成对象 free store 可能在 堆 / 自定义的地方 可以认为虚拟内存到物理内存的映射关系早已完成 若分配内存失败(内存空间不够),抛出std::bad_alloc 异常…...
JVM——垃圾回收算法
目录 垃圾回收算法 评价标准: 标记-清除算法: 复制算法: 标记-整理算法: 分代GC: arthas查看分代之后的内存情况: 垃圾回收算法 java是如何实现垃圾回收的呢?简单来说,垃圾回…...
算法日记16:SC68 联通块问题(并查集)
一、题目: 二、题解: 1、看到求联通块问题,我们可以考虑使用DFS/并查集(在这里我们仅介绍并查集) 2、什么是并查集? 2.1:初始化:对于每一个点,我们都对其进行初始化操作pre[i]i pre[i]表示i的…...
Unity-Mirror网络框架-从入门到精通之Pong示例
文章目录 前言示例介绍NetworkManagerPongBallPlayer总结前言 在现代游戏开发中,网络功能日益成为提升游戏体验的关键组成部分。本系列文章将为读者提供对Mirror网络框架的深入了解,涵盖从基础到高级的多个主题。Mirror是一个用于Unity的开源网络框架,专为多人游戏开发设计…...
c++ 多线程知识汇总
一、std::thread std::thread 是 C11 引入的标准库中的线程类,用于创建和管理线程 1. 带参数的构造函数 template <class F, class... Args> std::thread::thread(F&& f, Args&&... args);F&& f:线程要执行的函数&…...
探索 Text-to-SQL 技术:从自然语言到数据库查询的桥梁
亲爱的小伙伴们😘,在求知的漫漫旅途中,若你对深度学习的奥秘、Java 与 Python 的奇妙世界,亦或是读研论文的撰写攻略有所探寻🧐,那不妨给我一个小小的关注吧🥰。我会精心筹备,在未来…...
Java NIO ByteBuffer 详解
什么是 ByteBuffer ByteBuffer 是 Buffer 的一个具体实现,专门用于存储和操作字节数据。它提供了高效的、基于内存的 I/O 数据处理方式。 Buffer 类是构建 Java NIO 的基础,其中 ByteBuffer 类是 Buffer 子类中最受欢迎的。这是因为字节类型是最通用的…...
【机器学习】简单线性回归算法及代码实现
线性回归算法 一、摘要二、线性回归算法概述三、损失函数的定义和衡量标准四、简单线性回归的求解和应用五、机器学习算法一般求解思路 一、摘要 本文讲解了线性回归算法的基础知识和应用,强调线性回归主要用于解决回归问题。通过分析房产价格与房屋面积的关系&…...
【前端开发】query参数和params参数的区别
在Web开发中,query参数(URL查询参数)和params参数(路由参数)是两种不同的URL传参方式,它们的核心区别如下: 一、 位置不同 query参数params参数位置URL中?之后,用&连接多个参数…...
人工智能数学基础学习PPT
学习视频:人工智能 -数学基础 文章目录 1.简介1.函数2.极限3.无穷小与无穷大4.连续性与导数5.偏导数6.方向导数7.梯度 2.微积分1.微积分基本想法2.微积分的解释3.定积分4.定积分性质5.牛顿-莱布尼茨公式 3.泰勒公式与拉格朗日1.泰勒公式2.一点一世界3.阶数的作用4.…...
企业文件防泄密软件哪个好?
在企业文件防泄密软件领域,天锐绿盾和中科数安都是备受认可的品牌,它们各自具有独特的特点和优势。 以下是对这两款软件的详细比较: 天锐绿盾 功能特点 集成性强:集成了文件加密、数据泄露防护DLP、终端安全管理、行为审计等数据安…...
美丽 百褶裙提示词 + MD
MD 参考教程:Marvelous Designer零基础教学,MD布料制作-百褶裙建模制作,次世代教学_哔哩哔哩_bilibili 【MD新手教程】30分钟教会你制作百褶裙,Marvelous Designer超简单入门案例教程_哔哩哔哩_bilibili 【c4d技术解析】MD百褶裙…...