大模型实践:图文解锁Ollama在个人笔记本上部署llm
使用在线模型服务时,我们常常需要支付API调用费用,这对于个人开发者或小型组织来说可能是一笔不小的开支。那么,有没有方法可以在本地免费使用这些强大的模型呢?答案是肯定的——Ollama就是这样一个工具。
当然如果是比较大的组织或大模型推荐使用vLLM部署,强烈推荐您看(占坑,后续填上)
本文将介绍Ollama并且带您一步步在个人PC上部署一个自己的LLM。
笔者的电脑是windows,无GPU。
将带您部署(若您计算机性能比较高,只需要参考文中模型与配置关系,更改更大模型即可)
Gemma 2B版本:约1.7GB
什么是Ollama?
Ollama是一个开源的大语言模型管理平台,它允许用户在本地机器上部署、管理和使用各种开源语言模型。
Ollama最出色的优点如下:
-
将开源模型(如DeepSeek、Llama等)下载并部署到本地。从而让公司实现私有化+免费部署LLM。
-
性能强大:充分利用本地资源,既可以使用GPU也可以使用CPU。如果没有Ollama,我们需要自己配置GPU环境如cuda等等,与传统的模型部署相比,Ollama大大简化了GPU环境配置的复杂性,降低了使用门槛。
-
跨平台支持:Ollama 支持 macOs、Windows、Linux 以及 Docker多种操作系统环境下顺利部署和使用。无论你使用什么系统,都可以轻松部署和使用Ollama。
Ollama的下载与安装
在官网下载即可,本文以windows为例。
最好确保您的计算机C盘有10G+磁盘空间,因为后文下的大模型都会比较大。
以Windows为例,Ollama的安装过程非常简单,笔者安装中也没有遇到任何问题:
- 双击下载的EXE安装包
- 在弹出的安装界面中点击"Install"按钮
- 等待安装完成(通常只需几分钟)
本机部署问答模型
Ollama支持多种流行的开源大语言模型,您可以通过访问Ollama官网的Models页面浏览所有可用模型。
浏览Ollama模型库时,您会注意到每个模型都有不同的版本,如7B、13B、33B等。这里的"B"表示"Billion"(十亿),所以7B表示70亿参数,13B表示130亿参数,依此类推。
根据Ollama官方的建议,不同参数量的模型对系统资源(特别是内存)有以下最低要求:
模型参数量 | 最低内存需求 |
---|---|
7B | 8GB RAM |
13B | 16GB RAM |
33B | 32GB RAM |
70B | 128GB RAM |
需要特别注意的是,虽然一些特别大的模型(如400GB+)可以下载到本地,但您的设备可能没有足够的GPU或CPU资源来流畅运行它们。
对于普通个人电脑用户,建议选择10GB以下大小的模型以保证运行流畅。
语言类模型推荐
- Gemma - Google开发的开源模型,性能优秀,资源需求适中
- DeepSeek - 中国开发的强大语言模型,各方面表现均衡
- Qwen(千问) - 阿里巴巴开发的模型,中文能力出色
视觉类模型推荐
- LLaVA - 专为图像识别和理解训练的模型,能够分析和描述图片内容
- MiniCPM-V - 轻量级但功能强大的视觉模型,支持图像理解和生成
实操过程
安装完Ollama后,我们首先需要下载模型才能开始使用。本文我们以Google开发的Gemma 2b模型为例。在官网查询gemma模型,输入后可以看到以下界面。红色方框的是命令行下下载gemma的命令ollama run gemma:2b
。同时也可以看到这个模型大概会占用1.7GB磁盘
CMD中安装,下载完成后会直接启动该模型,我问了个给我讲个笑话:
常见命令
ollama list
列出所有已安装的模型
ollama pull [模型名称]
下载模型但不运行
ollama run [模型名称]
运行模型(首次会自动下载)
/clear
清除当前对话上下文,保持模型运行
Ctrl+D
退出当前模型
Ollama进阶:自定义模型创建与参数调优指南
在Ollama中,自定义模型是指基于已有的开源模型,通过调整其参数和行为特征来创建一个新模型。这个过程不涉及真正的模型训练或微调,而是通过配置文件来改变模型的输出特性和交互方式。
步骤一:创建Modelfile配置文件
首先,我们需要创建一个名为Modelfile
的文本文件,在这个文件中定义模型的基础信息和参数。这个文件的基本结构如下:
FROM [基础模型名称]
PARAMETER [参数名] [参数值]
SYSTEM [系统提示词]
例如,我们的Modelfile是这样的:
FROM gemma:2b
PARAMETER temperature 0.8
SYSTEM 你是一名叫做小智的助手,专长领域是文学和历史相关内容,喜欢使用生动有趣的方式与用户交谈。
这个配置包含三个主要部分:
FROM
:指定基础模型,这里我们选择了本机已装好的gemma:2b模型PARAMETER
:设置模型参数,这里将temperature(温度)设为0.9SYSTEM
:定义系统提示词,告诉模型它的角色和行为特点
步骤二:保存Modelfile文件
将创建好的Modelfile保存到本地磁盘,例如保存到C盘根目录。需要注意的是,这个文件不需要任何扩展名,就是纯文本的Modelfile
。
这里笔者是保存在C:\Users\86199\AppData\Local\Ollama
中的
步骤三:使用Ollama创建命令
使用以下命令创建自定义模型:
ollama create [自定义模型名称] -f [Modelfile路径]
例如:
ollama create mymodel -f C:\Users\86199\AppData\Local\Ollama\Modelfile
执行该命令后,Ollama会读取Modelfile中的配置,基于指定的基础模型创建一个新的自定义模型。成功后,会显示"success"提示。
若您想明确模型是否创建成功,使用ollama list
命令查看本地模型列表,确认自定义模型已成功创建。新创建的模型会以指定的名称出现在列表中。
步骤四:使用自定义模型
创建完成后,可以像使用其他模型一样运行自定义模型:
ollama run mymodel
相关文章:
大模型实践:图文解锁Ollama在个人笔记本上部署llm
使用在线模型服务时,我们常常需要支付API调用费用,这对于个人开发者或小型组织来说可能是一笔不小的开支。那么,有没有方法可以在本地免费使用这些强大的模型呢?答案是肯定的——Ollama就是这样一个工具。 当然如果是比较大的组织…...
如何提高情商?(优化版)
引言 提高情商(EQ)是一个需要长期练习和自我反思的过程,核心在于理解自己、管理情绪、共情他人并有效沟通。以下是一些具体且可操作的方法,结合理论和实际场景,帮助你逐步提升: 一、核心方法:…...
学习黑客Linux权限
在 Linux 的王国里,“权限”就是装备与技能加成:决定谁能拔剑(读 r)、挥剑(写 w)、进入房间(执行 x)。本文用“闯关升级”视角,把常见 rwx、八进制数字、SUID/SGID/Stick…...
信息系统监理师第二版教材模拟题第二组(含解析)
信息系统监理师模拟题第二组(30题) 监理理论与法规 根据《信息系统工程监理暂行规定》,监理单位应当独立于( ) A. 建设单位和承建单位 B. 政府监管部门 C. 行业组织 D. 最终用户答案:A 解析:监理单位应当保持独立性,不得与建设单位和承建单位有隶属关系或其他利害关系…...
C与指针——输入输出
错误定位 当一个库函数出错时,errno会被重置 perror(const char* s);\\输出s: errno 对应的错误信息 \\如果单独想要错误信息可以 char* e strerror(errno);\\系统错误码转换为对应的错误信息字符串输出缓冲区 一般输出缓冲区满的时候才刷新,也就是…...
RR(Repeatable Read)级别如何防止幻读
在 MySQL 数据库事务隔离级别中,RR(可重复读) 通过 MVCC(多版本并发控制) 和 锁机制 的组合策略来避免幻读问题。 一、MVCC机制:快照读与版本控制 快照读(Snapshot Read) 每个事务启…...
Python之学习笔记(六)
文章目录 1. 字典(Dictionary)2. 集合(Set)3. 字典 vs 集合4. 应用场景5. 注意事项 Python中的字典( dict)和集合( set)是两种高效且常用的数据结构,适用于不同的场景。…...
Easy云盘总结篇-文件上传02
说在前面:此项目是跟着B站一位大佬写的,不分享源码,支持项目付费 文件预览 主要分视频和其他文件预览,但实现逻辑相同,只是请求路径有区别。 这段逻辑: 拿视频预览举例: 视频开始时ÿ…...
window-docker的容器使用宿主机音频设备
文章目录 前言操作配置 前言 你有没有遇到过这种情况? 你兴冲冲地在Windows上用Docker搭了个语音识别项目,准备让容器高歌一曲,或者至少"Hey Docker"一下。结果——静音。 Docker Desktop一脸无辜:“亲,默…...
NaVILA: Legged Robot Vision-Language-ActionModel for Navigation
摘要 本文旨在解决基于视觉与语言导航(VLN)在四足机器人上的实现问题。该任务不仅为人类提供了一种灵活的指令方式,还使机器人能够在更具挑战性和杂乱的场景中导航。然而,将人类自然语言指令转换为低层次的腿部关节控制指令并非易…...
LeetCode 2071 你可以安排的最多任务数目 题解(附带自己的错误做题思路 过了25/49)
示例 输入:tasks [3,2,1], workers [0,3,3], pills 1, strength 1 输出:3 解释: 我们可以按照如下方案安排药丸: - 给 0 号工人药丸。 - 0 号工人完成任务 2(0 1 > 1) - 1 号工人完成任务 1&#…...
高翔《视觉SLAM十四讲》中第13讲,单目稠密重建中的RMODE数据集
高翔《视觉SLAM十四讲》中第13讲,单目稠密重建,中的RMODE数据集, 原作者苏黎世大学slam小组提供,但是网址已失效 下载方式: 1 https://vj6cqktnxq.feishu.cn/wiki/KBqtwD6XJio3Rmkm2FkckMY8nPg 2 参考地址:…...
PyTorch_张量形状操作
搭建模型时,数据都是基于张量形式的表示,网络层与层之间很多都是以不同的shape的方式进行表现和运算。 对张量形状的操作,以便能够更好处理网络各层之间的数据连接。 reshape 函数的用法 reshape 函数可以再保证张量数据不变的前提下改变数…...
【浅尝Java】变量与数据类型(含隐式类型转换、强制类型转换、整型与字符串互相转换等)
🍞自我激励:每天努力一点点,技术变化看得见 文章目录 字面常量数据类型变量变量概念语法格式整型变量字节型变量(byte)短整型变量(short)整型变量(int)长整型(…...
Ubuntu环境下使用uWSGI服务器【以flask应用部署为例】
0、前置内容说明 首先要知道WSGI是什么,关于WSGI服务器的介绍看这篇:WSGI(Web Server Gateway Interface)服务器 由于从Python 3.11开始限制了在系统级 Python 环境中使用 pip 安装第三方包,以避免与系统包管理器&am…...
GCC 使用指南
安装 GCC Ubuntu/Debian: sudo apt update && sudo apt install gcc gCentOS/RHEL: sudo yum install gcc gcc-cmacOS (通过 Homebrew): brew install gcc基本用法 编译 C 程序 gcc hello.c -o hello # 编译 hello.c,生成可执行文件 hello ./hello …...
虚函数 vs 纯虚函数 vs 静态函数(C++)
🧩 一图看懂:虚函数 vs 纯虚函数 特性虚函数(Virtual)纯虚函数(Pure Virtual)语法virtual void foo();virtual void foo() 0;是否必须实现✅ 必须在类中实现❌ 不在基类实现,派生类必须实现是…...
CF1000E We Need More Bosses
CF1000E We Need More Bosses 题目描述 题目大意: 给定一个 n n n 个点 m m m 条边的无向图,保证图连通。找到两个点 s , t s,t s,t,使得 s s s到 t t t必须经过的边最多(一条边无论走哪条路线都经过ta,这条边就是…...
Python:Seaborn 美化图表的技术指南
🎨 1、简述 Seaborn 是建立在 Matplotlib 基础上的高级可视化库,提供了更美观、更简洁的数据统计图表。本文将带你深入了解 Seaborn 的强大功能,并通过多个实践案例掌握使用技巧。 2、Seaborn 1️⃣ 什么是 Seaborn? Seaborn 是一个基于 matplotlib 构建的 Python 可视…...
go实现循环链表
需求 实现循环链表的节点生成、顺序遍历、指定删除。 实现 package mainimport ("fmt" )type zodiac_sign struct {number intdizhi stringanimal stringyear intnext *zodiac_sign }// 添加 // func add_node_by_order(previous_node zodiac_sign, current_…...
QT | 常用控件
前言 💓 个人主页:普通young man-CSDN博客 ⏩ 文章专栏:C_普通young man的博客-CSDN博客 ⏩ 本人giee: 普通小青年 (pu-tong-young-man) - Gitee.com 若有问题 评论区见📝 🎉欢迎大家点赞👍收藏⭐文章 —…...
EasyExcel使用总结
EasyExcel 文章目录 EasyExcel1、导入1.1、基本方式导入1.导入依赖2. 加载源文件基本语法 3. 读取数据行4. 读取结果 1.2、模型映射导入1.定义实体映射类2. 操作读取基本语法 3. 读取数据行4. 读取结果 1.3、导入类型转换器语法 1.4、导入监听器基本语法: 1.5、多行…...
【形式化验证】动态逻辑(DL)的定义解释与示例
动态逻辑(Dynamic Logic, DL)是一种用于描述和验证程序行为的逻辑系统。它结合了命题逻辑、谓词逻辑以及模态逻辑的特点,特别适用于表达程序执行前后的状态变化。以下将从语法、语义以及实际应用等方面详细介绍DL公式的相关内容。 1. 动态逻…...
OpenCv实战笔记(1)在win11搭建opencv4.11.1 + qt5.15.2 + vs2019_x64开发环境
一. 准备工作 Visual Studio 2019(安装时勾选 C 桌面开发 和 Windows 10 SDK) CMake 3.20(官网下载) Qt 5.15.2(下载 Qt Online Installer)安装时勾选 MSVC 2019 64-bit 组件。 opencv 4.11.1 源码下载 git…...
四年级数学知识边界总结思考-上册
目录 一、背景二、过程1.大数的认识**一、知识点梳理****二、知识点的由来****三、作用与意义****四、总结** 2. 公顷和平方千米**一、知识点梳理****二、知识点的由来****三、作用与意义** 3.角的度量**一、知识点梳理****二、知识点的由来****三、作用与意义** 4.平行四边形和…...
(undone) MIT6.S081 2023 学习笔记 (Day10: LAB9 fs file system)
url: https://pdos.csail.mit.edu/6.1810/2023/labs/fs.html 任务1:Large files (moderate) ----------------- 完成 本次作业中,你将扩大xv6文件的最大容量。当前xv6文件被限制为268个块(即268*BSIZE字节,xv6中BSIZE为1024&…...
SpringMVC详解
一:Maven 1.1 概述 (1)项目结构 所有IDE使用Maven创建的项目结构完全一样,maven项目可通用 (2)构建流程(编译、测试、打包、发布) (3)依赖管理 定义ÿ…...
【Python】一直没搞懂生成器是什么。。
生成器 上期我们讲解了迭代器:【Python】一直没搞懂迭代器是什么。。-CSDN博客 这期我们来讲讲它的好兄弟——生成器 生成器 (Generator)? 生成器是一种特殊的 迭代器 (Iterator)。 迭代器 是你可以逐个访问其元素的对象(比如在 for 循环中使用)。列表、元组、字典、字符…...
高等数学同步测试卷 同济7版 试卷部分 上 做题记录 第四章 不定积分同步测试卷 B卷
第四章 不定积分同步测试卷 B卷 一、单项选择题(本大题共5小题,每小题3分,总计15分) 1. 2. 3. 4. 5. 二、填空题(本大题共5小题,每小题3分,总计15分) 6. 7. 8. 9. 10. 三、求解下列各题(本大题共5小题,每小题6分,总计30分) 11. 12. …...
只用Prettier进行格式化项目
1.下载Prettier插件,禁用ESlint 2.在项目根目录新建.prettierrc文件 {"singleQuote": true,"jsxSingleQuote": true,"printWidth": 100,"trailingComma": "none","tabWidth": 2,"semi": f…...
ARM寻址方式
寻址方式指的是确定操作数位置的方式。 寻址方式: 立即数寻址 直接寻址(绝对寻址),ARM不支持这种寻址方式,但所有CISC处理器都支持 寄存器间接寻址 3种寻址方式总结如下: 助记符 RTL格式 描述 ADD r0,r1…...
2025年- H25-Lc133- 104. 二叉树的最大深度(树)---java版
1.题目描述 2.思路 返回左右子树中,最高高度的子树,高度从0开始计数。 3.代码实现 class TreeNode {int val;TreeNode left;TreeNode right;TreeNode() {}TreeNode(int val) { this.val val; }TreeNode(int val, TreeNode left, TreeNode right) {this.val val;…...
深入理解 Spring MVC:DispatcherServlet 与视图解析机制
import javax.servlet.ServletException; import javax.servlet.http.HttpServletRequest; import javax.servlet.http.HttpServletResponse; import java.io.IOException; import java.util.Locale; import java.util.Map;// 继承自 FrameworkServlet 的 DispatcherServlet 类…...
Python基本语法(lambda表达式)
lambda表达式 lambda的一般形式是在关键字lambda后面跟一个或多个参数,之后再紧跟一个 冒号,接下来是一个表达式。lambda是一个表达式,而不是一个语句,它能够出现 在Python语法不允许def出现的地方。作为表达式,lambd…...
嵌入式按键原理、中断过程与中断程序设计(键盘扫描程序)
按键去抖动 通常的按键所用开关为机械弹性开关,当机械触点断开、闭合时,电压信号波型如下图。由于机械触点的弹性作用,一个按键开关在闭合时不会马上稳定地接通,在断开时也不会一下子断开。因而在闭合及断开的瞬间均伴随有一连串的抖动。…...
C++负载均衡远程调用学习之实时监测与自动发布功能
目录 1.LarsDns-V0.3BackenThread后端实时监控线程流程 2.LarsDns-V0.3加载当前Route版本号方法实现 3.LarsDns-V0.3加载RouteChange修改表的信息 4.LarsDns-V0.3实现实时监控流程线程业务 5.LarsDnsV0.3编译bug修改和功能测试 6.Lars Web管理界面的集成 7.LarsDnsV0.3 D…...
VSCode常用插件推荐
文章目录 VSCode常用插件推荐1 Git相关插件2 代码格式3 AI工具4 语言插件通用工具参考 VSCode常用插件推荐 1 Git相关插件 2 代码格式 3 AI工具 4 语言插件 通用工具 参考 50 个 VSCode 必装插件推荐 https://mp.weixin.qq.com/s/b_OKvg3hdavtnv7pbWcKWg...
性能优化实践:内存优化技巧
性能优化实践:内存优化技巧 在Flutter应用开发中,内存优化是提升应用性能的关键环节之一。本文将从实战角度深入探讨Flutter内存优化的各种技巧,帮助你构建高性能的Flutter应用。 一、内存分析工具使用 1. DevTools内存分析器 启动DevTool…...
WPF中Behaviors
行为的好处 可以把复杂的界面逻辑抽象出去,让xaml的界面设计更简单,更清爽 1.安装包 Microsoft.Xaml.Behaviors.Wpf2.简单实现拖动效果 <Border Width"100"Height"100"Background"Red"><i:Interaction.Behav…...
FreeRTOS菜鸟入门(十)·消息队列
目录 1. 基本概念 2. 数据存储 3. 运作机制 4. 阻塞机制 4.1 出队阻塞 4.2 入队阻塞 5. 操作示意图 5.1 创建队列 5.2 向队列发送第一个消息 5.3 向队列发送第二个消息 5.4 从队列读取消息 6. 消息队列控制块 7. 消息队列常用函数 7.1 消息队列创建…...
Day3:设置页面全局渐变线性渐变背景色uniapp壁纸实战
效果: 页面全局渐变线性渐变背景色会让这个设计更加有质感 想给页面加背景的时候,就给最外部的布局容器添加一个pageBg这样一个类别 接下来,我们就可以在之前写的common的公共的style里的common-style.css里改变它就行了 线性渐变࿱…...
Ray开源程序 是用于扩展 AI 和 Python 应用程序的统一框架。Ray 由一个核心分布式运行时和一组用于简化 ML 计算的 AI 库组成
一、软件介绍 文末提供程序和源码下载 Ray开源程序 是用于扩展 AI 和 Python 应用程序的统一框架。Ray 由一个核心分布式运行时和一组用于简化 ML 计算的 AI 库组成 二、Ray AI 库的更多信息 数据:适用于 ML 的可扩展数据集训练:分布式训练Tune&…...
19、权限控制:分院帽系统——React 19 RBAC实现
一、分院帽的魔法本质 "RBAC是霍格沃茨城堡的智能分院帽,用角色编织的星轨矩阵阻隔黑魔法入侵!" 魔法部安全司官员挥舞魔杖,角色-权限的量子纠缠态在空中交织成防护结界。 ——基于《国际魔法联合会》第7号安全协议,RB…...
P1802 5 倍经验日
P1802 5 倍经验日 - 洛谷 题目背景 复制Markdown {展开 进入IDE模式 现在乐斗有活动了!每打一个人可以获得5倍经验!absi2011却无奈的看着那一些比他等级高的好友,想着能否把他们干掉。干掉能拿不少经验的。 题目描述 现在abs…...
赋予网页健壮的灵魂 —— TypeScript(下)
7 DOM 操作与类型定义:赋予网页真正的交互 回到最初的目标:让网页动起来。在 TypeScript 中,我们如何安全地操作 HTML 元素并响应用户的交互呢?TypeScript 提供了内置的类型定义来描述浏览器环境中的各种对象(如 docu…...
ARM Linux 设备树
Linux 设备驱动开发详解:基于最新的Linux 4.0内核, 机械工业出版社, 宋宝华, 2015 1. 设备树的起源 • 背景: ARM架构中大量板级代码冗余,硬编码在mach-xxx目录,设备树(Device Tree)引入结构化描述硬件。 • 目的: 减…...
35、C# 中的反射(Reflection)
反射是 C# 和 .NET 框架中的一个重要特性,它允许程序在运行时检查、访问和操作类型、对象、属性和方法等元数据信息。 反射的核心概念 运行时类型检查:反射允许你在程序运行时获取类型的详细信息,而不需要在编译时知道这些信息。动态操作&a…...
驱动中的 mmap() 函数和 file_operations 中的 mmap() 原型的区别
在 Linux 驱动开发中,mmap() 系统调用和 file_operations 结构中的 mmap() 方法虽然功能相关,但原型和用途有显著区别。以下是两者的详细对比: 1. 系统调用 mmap() 的原型 这是用户空间程序调用的系统调用接口,定义在 <sys/mma…...
Go语言八股文之Map详解
💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 非常期待和您一起在这个小…...
矿泉水瓶的绘制
1.制作中心矩形,大小为60,注意设置矩形的两条边相等 2.点击拉伸,高度为150mm 3.使用圆角命令,点击连接到开始面,同时选中4条边,进行圆角转化,圆角大小为10mm,点击多半径圆角…...