当前位置: 首页 > news >正文

StableDiffusionWebUI的AI绘图AI绘视频详细使用教程+报错排坑

概述

这里是官方的最原始的体积最小的StableDiffusionWebUI的下载及其使用教程,已经帮你们把坑都排完了,本教程适合开发者、程序员自己折腾,源码体积只有1.8M。

从0安装到绘图

1.环境

Python与Git环境:

安装Python3.10.0 => https://www.python.org/downloads/release/python-3100/

安装git => https://git-scm.com/book/zh/v2/%E8%B5%B7%E6%AD%A5-%E5%AE%89%E8%A3%85-Git

上面两个安装比较简单,用安装器安装即可

然后Python还需要额外的配置pip镜像,也比较简单,在 C:\Users\{用户名}\AppData\Roaming中手动创建个pip目录,然后在pip目录中创建个pip.ini文件,然后在pip.ini文件中写入:

[global]index-url = http://mirrors.aliyun.com/pypi/simple/[install]trusted-host=mirrors.aliyun.com

然后保存即可,镜像就配置好了

Nvidia与Cuda环境:

确保有nvidia驱动以及cuda环境 =>

查看是否有Nvidia驱动:一般Nvidia显卡的电脑买来就有Nvidia驱动,查看方式为CMD执行nvidia-smi,如果看到Driver Version有值,则表明你是有Nvidia环境的,且在Cuda Version出会表示你的显卡支持的最高版本的Cuda。

查看是否有Cuda环境:执行CMD命令 nvcc --version,若有显示cuda的版本信息则说明你已经有Cuda环境了。

Nvidia驱动安装:

首先使用CMD命令 dxdiag ,在显示中查看显卡的芯片类型,这里我是笔记本,显卡为RTX 3060,且还有个Laptop,Laptop表示我是笔记本的显卡,因此来带Nvidia官网下载驱动https://www.nvidia.cn/geforce/drivers/,我这里就选择GeForce RTX 30 Series(Notebooks)了,然后直接下载安装一个驱动即可,game ready和nvidia studio的都可以。

Cuda安装:

在Nvidia官网cuda往期版本中寻找显卡所支持的最大版本及其以下的,然后下载默认安装路径即可=>https://developer.nvidia.com/cuda-toolkit-archive,安装后在环境变量的Path添加例如如下即可

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\{版本号}\bin

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\{版本号}\libnvvp

验证方式:当然就是上面的查看方式啦

2.拉取Stable Diffusion源码并启动

以下的Stable Diffusion WebUI 我就简称 SDW了

这里得开代理,或者说需要VPN上外网

在一个空目录中进行鼠标右键,点击git bash here,执行git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git这里呢,大概率是你即使开了代理,还是clone失败,因此需要将clash for windows的代理端口修改为git中显示的端口拉取完代码后,还需要去hugginface.co下载SDW的一个基本模型,原因是源码中默认在加载这个模型,没这个东西你后面启动就会报错(大佬可自行修改源码,忽略这条解释),地址=>https://huggingface.co/Jiali/stable-diffusion-1.5/tree/main,下载v1-5-pruned-emaonly.safetensors,然后将其放在SDW目录下的models的Stable-diffusion目录中即可。然后理论上双击webui-user.bat即可自动完成所有配置并自动启动网页,但实际这里有不少的坑,下面来一个一个解决备份的官方源码:https://pan.quark.cn/s/c5c74ea4c22f

3.开始排坑

坑1:报错:RuntimeError: Couldn’t install open_clip

解决方式:

这里你可能以为普通的开启代理就行,但发现还是不行,这里需要Clash for windows 在开启系统代理+ipv6后,还需要开启TUN模式,主要是这个TUN模式,开启后,就可以下载了,这个坑就越过了,但是呢,又来坑了,见下坑2

坑2:一直卡在 installing requirements

解决方式:

建议使用VScode,打开SDW项目根目录下的modules目录下的launch_utils.py,然后使用ctrl+h来进行替换

将 github.com/ 替换为 mirror.ghproxy.com/ ,这里要注意,不要直接全部替换,因为源码中有一行是https://api.github.com/ 因此要一个一个替换,防止替换错了,除去这个api.github.com和注释,要替换的数量有8个

替换后保存,重新启动webui-user.bat,这个坑也就越过了,但是呢,又来坑了,见下坑3

坑3:报错 OSError: Can’t load tokenizer for ‘openai/clip-vit-large-patch14’

解决方式:

这里需要先去https://huggingface.co/openai/clip-vit-large-patch14/tree/main把openai/clip-vit-large-patch14下的所有文件下载下来,你没听错,就是要全部下载下来,当然也不多(一个一个点吧,这hugginface目前还没有能够像github那种一键下载所有内容为压缩包的下载方式)。

下载完成后,在SDW根目录手动创建一个openai目录,然后再在openai目录创建一个名为clip-vit-large-patch14的目录,将刚才下载的所有文件放入clip-vit-large-patch14目录即可,然后重启webui-user.bat,此时你的Stable Diffusion也就真正的启动了,但是呢,还有两个个小坑,见下坑4。

坑4:报错Expecting value: line 1 column 1,或者点击生成图片一直等待

我不知道是不是都是这样,只要我把代理开启了,启动SDW后就会报这个错,当然,这个本身是不影响的,但是在绘图的时候,也就是点击生成图片会一直处于等待状态

解决方式:

关闭代理,重新启动SDW即可。

以上所有该修复的修复,该加入的东西都加入后,再次双击 webui-user.bat 即可正常启动了。

4.第一次使用StableDiffusion

1.左上角选择主模型

2.Prompt框输入提示词,可以多个,用英文逗号分隔

3.点击Generate即可生成图片

其他的配置和具体使用边用边查边学就会了。这里你可能会表示对这个基础模型不是很满意,和网上看到的别人生成的不一样,看下面的5吧。

5.进阶使用-lora方式

因图片问题,原文=> StableDiffusionWebUI官方AI绘图AI绘视频原始源码+详细使用教程+排坑

相关文章:

StableDiffusionWebUI的AI绘图AI绘视频详细使用教程+报错排坑

概述 这里是官方的最原始的体积最小的StableDiffusionWebUI的下载及其使用教程,已经帮你们把坑都排完了,本教程适合开发者、程序员自己折腾,源码体积只有1.8M。 从0安装到绘图 1.环境 Python与Git环境: 安装Python3.10.0 >…...

Flutter 合并 ‘dot-shorthands‘ 语法糖,Dart 开始支持交叉编译

最近在 Dart 在 main 3.9 合并了一项名为 「dot-shorthands」 的语法糖提议,该提议主要是为了简化开发过程中的相关静态固定常量的写法,通过上下文类型推断简化枚举值和静态成员的访问: 简单来说,就是在之前你可能需要写 SomeEnum…...

貌似我的ollama加载的模型被下载了两份?终于搞懂原理了。

文章目录 背景ollama的模型默认会被放在哪儿呢?什么是homedir?ollama服务直接ollama serve如何修改保存模型文件的路径?背景 如果你想以最快的方式,部署本地的大模型,那么ollama无疑是最合适的选择之一。我其实linux用的不多。之前一直是在windows上部署的ollama。后来有…...

【HarmonyOS 5】鸿蒙用户头像编辑功能实践

【HarmonyOS 5】鸿蒙用户头像编辑功能实践 一、前言 1、应用背景 在鸿蒙化开发过程中,我们发现最基本常见的功能–用户头像的编辑,实现方式和Android与IOS有极大的不同。 在实际开发和调研的过程中,我们发现并总结了鸿蒙隐私处理与业内Android和IOS的差异性。发现隐私保…...

VTK|结合qt创建通用按钮控制显隐(边框、坐标轴、点线面)

文章目录 增加边框BoundingBox添加addBoundingBox添加BoundingBox控制按钮点击按钮之后的槽函数 添加坐标轴增加点线面显隐控制按钮添加控制点线面显隐的按钮到三维显示界面控制面显示槽函数控制线显示槽函数控制点显示槽函数 增加边框BoundingBox 增加边框BoundingBox并通过按…...

Python Cookbook-7.3 在 Pickling 的时候压缩

任务 你想以一种压缩的方式来 pickle 一般的 Python 对象。 解决方案 标准库模块 cPickle 和 gzip提供了所需的功能;你只需以适当的方式将它们粘合起来即可: import cPickle,gzip def save(filename,*objects):将对象存为压缩过的磁盘文件fil gzip.open(filename,wb)for o…...

合并两个有序链表 - 简单

************* C topic: 21. 合并两个有序链表 - 力扣(LeetCode) ************* Give the topic an inspection. Hi, guys, how is your holiday break? I went to 黄山 in the past few days. The mount Huang is really beautiful. 天都峰 is real…...

手写 Vue 源码 === Effect 机制解析

目录 核心概念 响应式效果的实现 依赖收集的具体流程 为什么使用全局变量? 嵌套 effect 的处理 总结 Vue3 的响应式系统核心在于跟踪依赖并在数据变化时触发更新。effect.ts文件实现了这一机制的核心部分,下面我们来梳理其中的关键思路。 核心概念…...

《AI大模型应知应会100篇》第49篇:大模型应用的成本控制策略

第49篇:大模型应用的成本控制策略 🧾 摘要 随着AI大模型的广泛应用,其高昂的部署与运行成本成为企业面临的一大挑战。本文将从技术架构、资源优化、业务模式等多个维度出发,系统性地讲解如何在保障服务质量的前提下,实…...

利用Ollama部署DeepSeek模型

利用Ollama部署DeepSeek模型 最近,DeepSeek作为一款高效的推理模型受到了广泛关注,但在使用网页版过程中,总是遇到服务器繁忙,因此尝试在本地部署DeepSeek来使用。 一、Ollama安装指南 Ollama是一个开源的AI大模型部署工具&…...

数字孪生储能充电站,实现智慧能源设施全景管控

图扑将储能充电站的电池组、充电桩、配电系统等设备进行数字孪生,通过实时接入充放电数据、设备状态及能耗信息,以三维可视化界面直观呈现储能动态、电力调度与运维场景,助力运营方优化资源配置、预判设备故障,推动储能充电设施高…...

MCP服务发展现状的有趣发现

MCP服务发展现状的有趣发现 当前,MCP(Model Context Protocol)在AI领域逐渐成为一个热门话题。其核心意义在于赋予大模型直接调用外部工具的能力,从而打破“数据孤岛”,实现真正的工具增强型AI。然而,在深…...

aws平台windows虚拟机扩容

收到aws平台windows虚拟机扩容磁盘的请求 登陆aws平台ec2找的对应的虚拟机 进入实例详情 然后点击存储 点击进入卷 然后远程登陆这台虚拟机 在运行对话框中,输入 diskmgmt.msc 并按 Enter。然后,磁盘管理实例程序随之打开 在 Disk Management 菜单上&am…...

QuecPython+Aws:快速连接亚马逊 IoT 平台

提供一个可接入亚马逊 Iot 平台的客户端,用于管理亚马逊 MQTT 连接和影子设备。 初始化客户端 Aws class Aws(client_id,server,port,keep_alive,ssl,ssl_params)参数: client_id (str) - 客户端唯一标识。server (str) - 亚马逊 Iot 平台服务器地址…...

从创业踩雷到依法解债:湖北理元理律师事务所的危机拆解逻辑

“本以为最坏结果是创业失败,没想到差点毁了家庭。”34岁的武汉宝妈李婷(化名)在咖啡厅里翻着厚厚的案件材料。因参与朋友奶茶店项目,她在网贷平台借款28万,却因合同漏洞陷入债务旋涡。本文将拆解专业机构处理此类案件…...

1、Kafka与消息队列核心原理详解

消息队列(Message Queue, MQ)作为现代分布式系统的基础组件,极大提升了系统的解耦、异步处理和削峰能力。本文以Kafka为例,系统梳理消息队列的核心原理、架构细节及实际应用。 Kafka 基础架构及术语关系图 术语简要说明 Produce…...

【Linux系统】线程安全

线程安全和重入问题 概念 线程安全:多个线程在访问共享资源时,能够正确地执行,不会相互干扰或破坏彼此的执行结果。一般而言,多个线程并发同一段只有局部变量的代码时,不会出现不同的结果。但是对全局变量或者静态变…...

什么是gitlab自动部署,怎么配置gitlab自动部署

在现代软件开发流程中,自动化部署是提高效率和确保软件质量的关键环节。GitLab作为一个强大的DevOps平台,提供了完整的自动部署工具,帮助开发团队实现代码从编写到生产的无缝转换。本文将详细解析GitLab的自动部署功能是什么,如何进行操作,以及这一功能的实用性评估,帮助…...

Android开发-工程结构

在进行Android应用开发时,了解并掌握项目的工程结构是非常重要的一步。一个典型的Android项目由多个模块组成,每个模块又包含不同的目录和文件,它们各自承担着特定的功能。本文将带你深入了解Android Studio生成的默认项目结构,并…...

典籍知识问答模块AI问答功能feedbackBug修改+添加对话名称修改功能

1.feedbackBug修改 由于原先定为enum类型,导致无法正常评价,一直报错Data truncated for column feedback at row 1,将其修改为varchar类型,而类型选择在代码中实现 QAService代码修改后如下: 2.添加对话名称修改功…...

极狐Gitlab 里程碑功能介绍

极狐GitLab 是 GitLab 在中国的发行版,关于中文参考文档和资料有: 极狐GitLab 中文文档极狐GitLab 中文论坛极狐GitLab 官网 里程碑 (BASIC ALL) 极狐GitLab 中的里程碑是一种跟踪议题和合并请求的方法,这些请求是为了在特定时间段内实现更…...

信奥赛CSP-J复赛集训(DP专题)(37):P4170 [CQOI2007] 涂色

信奥赛CSP-J复赛集训(DP专题)(37):P4170 [CQOI2007] 涂色 题目描述 假设你有一条长度为 5 5 5 的木板,初始时没有涂过任何颜色。你希望把它的 5 5 5 个单位长度分别涂上红、绿、蓝、绿、红色&#xff0c…...

代码随想录算法训练营第五十六天| 图论2—卡码网99. 岛屿数量(dfs bfs)

假期归来继续刷题,图论第二天,主要是进一步熟悉dfs 和 bfs 的运用。 99. 岛屿数量(dfs) 99. 岛屿数量 ACM模式还是需要练,不过现在输入输出的感觉已经比较熟悉了。首先是要按照输入搭建一个grid,然后有一…...

iOS开发架构——MVC、MVP和MVVM对比

文章目录 前言MVC(Model - View - Controller)MVP(Model - View - Presenter)MVVM(Model - View - ViewModel) 前言 在 iOS 开发中,MVC、MVVM、和 MVP 是常见的三种架构模式,它们主…...

雅思阅读--易错词汇60个

文章目录 5. pretty6. matterIt does not matter ...7. stage8. draw... draw attention ...5. pretty 23个大满贯单打冠军,传奇网球运动员 WIlliams 曾经说过: I’ve always been pretty confident in my abilities. 翻译:我一直对自己的能力很有信心。 分析:在本句中,“…...

精益数据分析(44/126):深度解析媒体网站商业模式的关键要点

精益数据分析(44/126):深度解析媒体网站商业模式的关键要点 在创业与数据分析的探索道路上,我们不断挖掘不同商业模式的核心要素,今天将深入剖析媒体网站商业模式。希望通过对《精益数据分析》相关内容的解读&#xf…...

【回眸】QAC使用指南——导出 Dashboard Report个性化定制Report

前言 按错误级别导出Dashboard的报告 导出Dashboard个性化定制报告 添加个性化设计 导出个性化报告(HTML/PDF/XML) 过滤级别错误 后记 前言 QAC除了导出常规的报告之外,还可以导出Dashboard的报告(XML格式或者PDF格式&…...

高铁座位指示灯系统技术深度解析:从物联网到智慧出行的实践路径

摘要 高铁座位指示灯系统作为铁路数字化转型的核心场景,通过物联网、实时数据同步等技术,实现了客票系统与列车座位状态的动态联动。本文结合权威技术文档与现场实践,从系统架构、数据交互、工程实现等维度展开深度解析,并探讨其…...

ReSearch:强化学习赋能大模型,推理与搜索的创新融合

ReSearch:强化学习赋能大模型,推理与搜索的创新融合 大语言模型(LLMs)的推理能力不断提升,却在与外部搜索结合处理复杂问题时遇阻。本文提出的ReSearch框架,借助强化学习让LLMs学会将搜索融入推理&#xf…...

python的selenium操控浏览器

咱们以操控谷歌浏览器为例子 各系统谷歌浏览器及其工具最新版本下载地址 Chrome for Testing availability 查看谷歌浏览器版本 设置->关于Chrome->查看当前谷歌浏览器版本 下载与谷歌浏览器版本对应的chromedriver 注意:与谷歌浏览器版本一模一样的不一定…...

1、PLC控制面板 - /自动化与控制组件/plc-control-panel

76个工业组件库示例汇总 PLC控制系统监控面板 这是一个用于PLC控制系统监控面板的自定义组件,提供了PLC编程与自动化控制逻辑设计的可视化监控界面。组件采用工业风格设计,包含实时数据展示、系统状态监控、控制功能以及报警和日志记录等功能。 功能特…...

LeetCode 热题 100 279. 完全平方数

LeetCode 热题 100 | 279. 完全平方数 大家好,今天我们来解决一道经典的动态规划问题——完全平方数。这道题在 LeetCode 上被标记为中等难度,要求找到和为给定整数 n 的完全平方数的最少数量。 问题描述 给定一个整数 n,返回和为 n 的完全…...

USB学习【2】通讯的基础-反向不归零编码

一.写在前面 所有的通讯协议,发送端和接收端必须按照同一节奏发送信号和接受信号才能保证通讯的正常进行,否则会出现错位。 这个节奏用我自己的话说:时间卡尺。 串口协议是通过约定好波特率来进行解析信号。IIC是专门有一个时钟线作为时间卡…...

Polygon Miden网络:具有客户端执行的边缘区块链

1. 引言 LambdaClass与Miden已合作超过18个月,这段合作关系始于帮助 Miden 开发客户端,为 Miden 网络提供交易执行和证明的支持。随着时间推移,双方的合作不断加深,工作也扩展到了协议和节点的开发上,涵盖了多个方面。…...

临床智能体AI与环境感知AI的融合:基于python的医疗自然语言处理深度分析

引言 医疗领域的数智化进程正以前所未有的速度推进,人工智能技术的应用尤为显著。随着大型语言模型(LLMs)的迅猛发展,医疗AI已从简单的辅助工具升级为复杂的智能体系统。临床智能体AI与环境感知AI的融合代表了医疗AI的最新发展方向,为重塑医疗运营自然语言处理提供了全新…...

Spring AI Alibaba-03- Spring AI + DeepSeek-R1 + ES/Milvus + RAG 智能对话应用开发全流程

Spring AI Alibaba-03- Spring AI DeepSeek-R1 ES/Milvus RAG 智能对话应用开发全流程 在[人工智能](AI)应用中,模型通常需要访问外部资源或执行特定操作,例如数据库查询、调用外部API或执行计算任务。Spring AI,作…...

20250506异形拼图块(圆形、三角、正方,椭圆/半圆)的中2班幼儿偏好性测试(HTML)

背景介绍 最近在写一份工具运用报告,关于剪纸难度的。所以设计了蝴蝶描边系列和异形凹凸角拼图。 【教学类-102-20】蝴蝶三色图作品2——卡纸蝴蝶“满格变形图”(滴颜料按压对称花纹、原图切边后变形放大到A4横版最大化)-CSDN博客文章浏览阅读609次,点赞8次,收藏3次。【…...

Edge浏览器PDF字体显示错误

Edge浏览器PDF字体显示错误 软件版本信息 Edge Version: 136.0.3240.50 Word Version: Microsoft Office 专业增强版2021问题描述 在Word中使用多级列表自动编号, 并使用Word软件自带的导出为PDF文件功能, 在Word中显示正常的数字, 在Edge中查看PDF将会出现渲染错误的现象,…...

git中android studio不想提交文件

修改.gitignore文件 *.iml .gradle /local.properties /.idea/caches /.idea/libraries /.idea/modules.xml /.idea/workspace.xml /.idea/navEditor.xml /.idea/assetWizardSettings.xml /.idea/* /app/* .DS_Store /build /captures .externalNativeBuild .cxx local.propert…...

==和equals的区别 hashCode和equals的联系

和equals的区别: 对于没有重写equals()方法的类,和equals的作用是相同的:比较两个实例对象的地址是否相同。而对于重写了equals方法的类,equals方法则比较的是两个实例对象的内容(例如String对象)。 hashC…...

国联股份卫多多与国术科技签署战略合作协议

4月30日,国术科技(北京)有限公司(以下简称“国术科技”)营销中心总经理 王志广、贾雷一行到访国联股份卫多多,同卫多多/纸多多副总裁、产发部总经理段任飞,卫多多机器人产业链总经理桂林展开深入…...

依图科技C++后端开发面试题及参考答案

请介绍你所了解的分布式系统 分布式系统是由多个独立的计算节点通过网络连接组成的系统,这些节点共同协作以完成特定的任务。分布式系统的设计目标在于提升系统的性能、可扩展性、可靠性和容错性。 从性能方面来看,分布式系统能够把任务分配到多个节点…...

【计算机网络】TCP/IP四层模型是什么?与OSI七层模型哪些区别?

TCP/IP四层模型从上到下依次为: 1.应用层 2.传输层 3.网络层 4.网络接口层 一、TCP/IP四层模型: 1.应用层: 提供用户可直接使用的网络服务。如网页、邮件。 关键协议: HTTP/HTTPS:网页浏览。DNS:域名解…...

基于计算机视觉的试卷答题区表格识别与提取技术

基于计算机视觉的试卷答题区表格识别与提取技术 摘要 本文介绍了一种基于计算机视觉技术的试卷答题区表格识别与提取算法。该算法能够自动从试卷图像中定位答题区表格,执行图像方向矫正,精确识别表格网格线,并提取每个答案单元格。本技术可…...

Java面试全栈解析:Spring Boot、Kafka与Redis实战揭秘

《Java面试全栈解析:Spring Boot、Kafka与Redis实战揭秘》 【面试现场】 面试官:(推了推眼镜)小张,你简历里提到用Spring Boot开发过微服务系统,能说说自动配置的实现原理吗? 程序员&#xff1…...

打成jar 包以后,运行时找不到文件路径?

报错信息: FileNotFoundException。。。。。。。 原因: 打成jar包后,路径src/*可能都找不到了。 使用命令,查看jar包内的结构及文件路径: tar -tf XX.jar 你会看到目录结构: META-INF/ META-INF/MANIFEST.MF main/ ma…...

C++复习2

set、map、multiset、multimap CSTL包含了序列式容器和关联式容器: 序列式容器里面存储的是元素本身,其底层为线性序列的数据结构。比如:vector,list,deque,forward_list(C11)等。 关联式容器里面存储的是…...

el-row el-col

参考layout布局 Element - The worlds most popular Vue UI frameworkElement,一套为开发者、设计师和产品经理准备的基于 Vue 2.0 的桌面端组件库https://element.eleme.cn/#/zh-CN/component/layout#row-attributes 一行可以看做24个 Element UI 中的 el-row 是…...

【旅游网站设计与实现】基于SpringBoot + Vue 的前后端分离项目 | 万字详细文档 + 源码 + 数据库 + PPT

一、项目简介 旅游网站管理系统以信息化为核心,结合用户体验和系统管理功能,为旅游爱好者和管理者提供全面的服务平台。通过系统,用户可以浏览线路、收藏心仪旅游产品、下单订购,管理员则可在后台完成旅游线路管理、用户管理、订…...

On the Biology of a Large Language Model——论文学习笔记——拒答和越狱

本文仍然是对Anthropic团队的模型解释工作 On the Biology of a Large Language Model 的学习笔记。 前几篇课见我的主页中相同标题的几篇文章 本篇主要关注的是该博客中的Refusal和 Life of a Jailbreak这两部分的内容。 一句话总结 在这两部分中,作者展示了以下…...