玩转代理 IP :实战爬虫案例
在现代互联网环境下,爬虫不仅是数据获取的利器,也成为应对网站反爬机制的技术博弈。而在这场博弈中,"代理 IP" 是核心武器之一。本文将以高匿名的代理ip为核心,结合 Python 实战、代理策略设计、高匿技巧与反封锁优化,全面拆解代理 IP 技术的实际应用路径,并通过完整案例实现一个稳定、高效、抗封锁的爬虫系统。
目录
一、代理 IP 的核心原理与角色定位
1. 什么是代理 IP?
2. 为什么爬虫需要代理?
3. 代理 IP 分类与特性
二、实战爬虫:百度图片搜索抓取
实战目标
获取代理ip
使用Python的requests库配置代理
集成代理到Scrapy框架
实战百度项目
特性说明
注意事项
三、六点实战技巧分享
1. 不要过分依赖公共代理
2. 加强代理池的“质量控制”
3. 多维度轮换策略搭配使用
4. 隐蔽身份:混淆浏览器行为
5. 用“慢”击败“快”
6. 抓日志,追封锁规律
一、代理 IP 的核心原理与角色定位
1. 什么是代理 IP?
代理 IP(Proxy IP)是一种网络中介服务器,充当客户端(例如爬虫程序)与目标网站之间的通信桥梁。通过代理服务器发出的请求,会将代理服务器的 IP 地址暴露给目标网站,而非客户端自身的 IP,从而实现:
-
隐藏真实身份:保护客户端不被网站追踪或封锁。
-
规避 IP 限制:突破访问频率限制、地域限制等反爬手段。
-
负载均衡与缓存优化:在某些高级场景中,也可用于分发请求与提升性能。
代理 IP 不仅在爬虫领域广泛使用,也常见于企业网络管理、内容过滤、用户行为分析等领域。
2. 为什么爬虫需要代理?
当我们开发一个高频率的爬虫系统时,往往会遭遇如下问题:
-
IP 封锁:访问频率过高或行为异常,目标网站会封禁访问者 IP。
-
账号联封机制:多个账号登录时共用一个 IP 容易被识别和连坐封禁。
-
地域内容限制:部分站点对不同国家或地区的访问返回不同页面或内容。
-
日志记录风险:目标网站可能追踪并记录访问者 IP,用于事后封锁或溯源。
在这些情境中,使用代理 IP 成为提升爬虫系统稳定性、匿名性和数据覆盖率的重要手段。
3. 代理 IP 分类与特性
为了更有效地运用代理 IP,我们需要理解它的主要类型及适用场景:
类型 | 特性与描述 | 典型应用 |
---|---|---|
透明代理 | 不隐藏客户端真实 IP,通常会在请求头中携带原始 IP | 简单中转、不推荐用于爬虫 |
匿名代理 | 隐藏原始 IP,但目标服务器仍可判断出请求来自代理 | 一般数据抓取任务 |
高匿代理 | 不仅隐藏真实 IP,还不透露“代理身份”,目标网站无法识别为代理 | 敏感信息抓取、防检测爬虫 |
数据中心代理 | IP 来源于云服务或 IDC,成本低、速度快,但容易被检测 | 并发量大、低安全要求的任务 |
住宅代理 | 来自家庭用户网络的 IP,具备真实用户特征,极难识别 | 模拟用户行为、突破高级反爬 |
动态代理 | 可自动更换 IP,或按周期轮换,防止短时间内触发频控 | 反封锁、任务调度、异步请求 |
不同类型的代理各有优缺点,通常推荐搭配使用:高并发时可用数据中心代理,高敏感任务使用高匿或住宅代理。
二、实战爬虫:百度图片搜索抓取
实战目标
-
抓取百度图片搜索关键词(如“风景”)的图片
-
使用代理 IP 发起请求(从 IPWO 获取)
-
下载并保存图片到本地
获取代理ip
正常三大运营商的代理IP很多都已经进到了黑名单,什么意思呢,当一个代理IP被多人频繁使用时,特别是当这些用户用它进行大量的请求、或者进行不当行为时,目标服务器可能会注意到这个IP的异常活动,并将其列入黑名单。当你再使用这个被多人使用过并且被污染的代理IP时,目标服务器会拒绝你的访问请求。这种情况特别常见于公共代理服务器和共享代理服务,因为它们的IP地址经常被大量用户重复使用。
所以今天使用一家海外代理IP平台:IPWO ,亲测他们的IP可用性高、速度快,完全可满足我们对可靠性、和地理位置等要求,现在新人注册送试用流量,正常爬虫测试个几万条数据够够的,需要注意因为使用的是海外IP,所以需要我们有海外网络环境,切记!
点击【获取代理】 -> 选择【API提取】 -> 设置【提取参数】 -> 点击【生成链接】并复制接
使用Python的requests库配置代理
requests是Python中最常用的HTTP客户端库之一,支持从简单的GET和POST请求到更复杂的HTTP协议操作。要在requests中配置代理,可以简单地传递一个代理字典到请求函数中。下面是一个基本示例:
import requests# 把获取的代理ip和端口放过来
proxies = {'http': 'http://43.159.53.192:19394','https': 'https://43.159.53.192:19394',
}url = 'http://example.com'
response = requests.get(url, proxies=proxies)
print(response.text)
集成代理到Scrapy框架
对于更复杂或大规模的爬虫项目,使用Scrapy框架可能是更好的选择。Scrapy是一个强大的爬虫框架,支持异步处理和中间件管理,非常适合构建复杂的爬取任务。在Scrapy中配置代理主要通过中间件来实现,以下是一个配置代理的中间件示例:
from scrapy import signals
import scrapyclass ProxyMiddleware(object):def process_request(self, request, spider):request.meta['proxy'] = "http://43.159.53.192:19394"return None
实战百度项目
抓取百度图片搜索结果中前几页的图片 URL,并保存图片到本地。
import requests
from bs4 import BeautifulSoup
from fake_useragent import UserAgent
import os
import time
import uuid# 从 IPWO 获取代理
def get_ip_from_ipwo():res = requests.get("http://ipwo.local/api/get") # 替换为你真实的 IPWO 地址ip_data = res.json()return f"http://{ip_data['ip']}:{ip_data['port']}"# 下载图片函数
def download_image(img_url, folder="images"):os.makedirs(folder, exist_ok=True)try:img_data = requests.get(img_url, timeout=10).contentfile_name = f"{uuid.uuid4().hex}.jpg"with open(os.path.join(folder, file_name), 'wb') as f:f.write(img_data)print(f"[√] 下载成功: {file_name}")except Exception as e:print(f"[x] 下载失败: {img_url} 原因: {e}")# 爬虫主逻辑
def crawl_baidu_images(keyword="风景", pages=2):base_url = "https://image.baidu.com/search/index"headers = {"User-Agent": UserAgent().random,}for page in range(pages):params = {"tn": "baiduimage","word": keyword,"pn": page * 30,}try:proxies = {"http": get_ip_from_ipwo(),"https": get_ip_from_ipwo(),}print(f"[*] 第 {page+1} 页,使用代理: {proxies['http']}")resp = requests.get(base_url, headers=headers, params=params, proxies=proxies, timeout=10)soup = BeautifulSoup(resp.text, "html.parser")scripts = soup.find_all("script")for s in scripts:if "objURL" in s.text:urls = list(set([line.split('\"')[3] for line in s.text.split('objURL')[1:] if '\"' in line]))for img_url in urls[:10]: # 限制每页最多下载10张download_image(img_url)breakexcept Exception as e:print(f"[!] 抓取第 {page+1} 页失败: {e}")time.sleep(2)if __name__ == "__main__":crawl_baidu_images("风景", pages=3)
特性说明
-
使用高匿代理(通过 IPWO 获取):每页请求前获取一个新代理。
-
反爬措施:随机 User-Agent,间隔请求,使用真实浏览器头部。
-
容错能力:错误图片下载会被跳过,不影响整体任务。
-
保存路径:图片默认保存到本地
images
目录。
注意事项
-
百度图片有部分数据通过 JavaScript 加载,本方案可提取 HTML 源码中部分图片地址,但不能获取所有结果。如需更高级提取,可使用 Selenium + CDP。
-
确保返回的代理可用(高匿 + 非封禁)。
-
建议设置代理质量检测机制,过滤掉频繁失败的代理。
三、六点实战技巧分享
1. 不要过分依赖公共代理
公共代理或廉价代理资源由于被过度使用,极容易被网站加入黑名单。一旦代理 IP 进入了黑名单池,即使设置了高级反爬策略,也会因为 IP 被封而全盘失效。
2. 加强代理池的“质量控制”
定期检查代理 IP 的匿名性、响应速度与封锁状态,建议使用如下策略:
-
每隔 5 分钟进行一次健康检查
-
对响应慢或 403 的 IP 自动下线
-
保留近 24 小时内的使用评分与封锁记录作为评分基础
3. 多维度轮换策略搭配使用
避免仅依赖单一轮换机制,推荐组合策略:
-
请求数轮换 + 目标站点轮换 + 错误反馈轮换
-
不同代理类型按权重混用,如:70% 数据中心代理 + 30% 住宅代理
4. 隐蔽身份:混淆浏览器行为
-
使用
fake_useragent
模拟真实浏览器 -
构造 Referer、Cookie、Origin 等字段,模拟正常用户访问路径
-
使用头部随机器或 Selenium CDP 协议隐藏 WebDriver 痕迹
5. 用“慢”击败“快”
在高防站点面前,“慢就是快”,降低速率、延长时间间隔、缩小请求间距,远胜于一味追求速度。
6. 抓日志,追封锁规律
通过日志记录封锁频率与时间段、UA 组合、目标路径等数据,可以构建封锁预测模型,提前切换策略。
本文围绕代理 IP 技术,深入剖析了其在爬虫实战中的核心作用与常见类型,结合 Python 实现高效、可扩展的反封锁爬虫架构。同时通过实战案例展示了百度图片抓取的完整流程,辅以多种实用技巧与策略建议,帮助读者在面对反爬机制时做到从容应对。
在真实项目中,稳定性、匿名性和反检测能力是爬虫成功的关键。建议读者在实际开发中结合自身业务场景,灵活设计代理使用逻辑,善用日志监控与智能调度系统,实现真正“低调高效”的数据采集系统。
如果对文中案例有任何疑问或想法,欢迎留言交流,一起打造更强大的数据获取能力!
相关文章:
玩转代理 IP :实战爬虫案例
在现代互联网环境下,爬虫不仅是数据获取的利器,也成为应对网站反爬机制的技术博弈。而在这场博弈中,"代理 IP" 是核心武器之一。本文将以高匿名的代理ip为核心,结合 Python 实战、代理策略设计、高匿技巧与反封锁优化&a…...
Deepseek解锁科研绘图新方式
在科研领域,一张清晰、准确且美观的图片往往能比冗长的文字更有效地传达研究成果。从展示实验数据的图表,到阐述理论模型的示意图,科研绘图贯穿于研究的各个环节。然而,传统的科研绘图工具往往操作复杂,学习成本高&…...
【unity游戏开发入门到精通——动画篇】Animator反向动力学(IK)
考虑到每个人基础可能不一样,且并不是所有人都有同时做2D、3D开发的需求,所以我把 【零基础入门unity游戏开发】 分为成了C#篇、unity通用篇、unity3D篇、unity2D篇。 【C#篇】:主要讲解C#的基础语法,包括变量、数据类型、运算符、…...
【JavaScript】十八、页面加载事件和页面滚动事件
文章目录 1、页面加载事件1.1 load1.2 DOMContentLoaded 2、页面滚动事件2.1 语法2.2 获取滚动位置 3、案例:页面滚动显示隐藏侧边栏 1、页面加载事件 script标签在html中的位置一般在</body>标签上方,这是因为代码从上往下执行,在htm…...
Solana链开发全景指南:从环境搭建到生态实践
——2025年高性能区块链开发技术栈深度解析 一、Solana核心优势与技术特性 1. 突破性技术架构 历史证明(PoH):通过时间戳序列化交易,实现并行处理能力,支持5万TPS的吞吐量 并行执行引擎(Sealevel…...
这是一个文章标题
# Markdown 全语法示例手册本文档将全面演示 Markdown 的语法元素,包含 **标题**、**列表**、**代码块**、**表格**、**数学公式** 等 18 种核心功能。所有示例均附带实际应用场景说明。---## 一、基础文本格式### 1.1 标题层级 markdown # H1 (使用 #) ## H2 (使用…...
预言机与数据聚合器:DeFi的数据桥梁与风险博弈
一、核心机制与价值定位 预言机(Oracle)与数据聚合器是DeFi生态的“数据基建层”,解决链上-链下数据互通与链上数据可读性两大问题: 数据输入层(预言机):将现实世界数据(价格、天气…...
通过百度OCR在线API识别带水印扫描图片文字
目录 0 环境准备 1 百度OCR API申请 1.1 登录百度智能云 1.2 创建应用 1.3 获取API key和secret key 2 创建项目python环境 2.1 conda创建python环境 2.2 在pycharm中创建项目 2.3 激活python环境 2.4 安装项目依赖包 3 程序逻辑实现 3.1 导入依赖包 3.2 定义百度k…...
ocr python库
ocr python库 上手Git、Gitee和Github!watt toolkit...
Node 处理 request 的过程中,都会更新哪些 metadata 和 property
什么是 Metadata? 用于描述帧状态、控制参数、处理结果等 是随 request 流动的结构,通常是 PerFrameMetaData,每一帧一份 属于 HAL3 metadata 树的组成部分 什么是 Property? 是 CamX 内部定义的一种帧级别的轻量信息块 不一…...
基于labview的多功能数据采集系统
基于labview的多功能数据采集系统(可定制功能) 包含基于NI温度采集卡。电流采集卡。电压采集卡的数据采集功能 数据存储 报表存储 数据处理与分析 生产者消费者架构 有需要可联系...
李沐《动手学深度学习》 | 线性神经网络-线性回归
文章目录 线性回归1.确定模型2.衡量预估质量-损失函数3.深度学习的基础优化算法随机梯度下降小批量随机梯度下降 从线性回归到深度网络 线性回归从0开始实现构造一个人造数据集创建数据集可视化数据集 读取数据-随机抽取样本模型定义模型参数初始化定义模型定义损失函数定义优化…...
LabVIEW 中 “Flatten To Json String” VI 应用及优势
在 LabVIEW 开发涉及机器人数据等场景时,常需将数据以特定 JSON 格式输出。“Flatten To Json String” VI 在此过程中能发挥重要作用,相比 LabVIEW 系统自带的 JSON 处理方式,它具备独特优势。以下将介绍其获取、使用方法及相较系统自带方式…...
关于 Spring Boot 后端项目使用 Maven 打包命令、JAR/WAR 对比、内嵌服务器与第三方服务器对比,以及热部署配置的详细说明
以下是关于 Spring Boot 后端项目使用 Maven 打包命令、JAR/WAR 对比、内嵌服务器与第三方服务器对比,以及热部署配置的详细说明: 一、Maven 打包命令详解 1. 基础命令 1.1 清理并打包 mvn clean packageclean:删除 target 目录中的旧构建文…...
用labview写crc8校验
crc8校验有好几种,我这里写的是不带任何后缀的crc8。 首先,我们百度一下crc8的计算方式 一般搜索出来下面还有c语言写的crc8可以做为参考。 下面便是根据百度的计算方式写的crc8,已校验过,无问题。 写完后,可以输入下…...
阿里云CDN与DCDN主动推送静态资源至边缘服务器的ASP.NET WEB实例
一、CDN,需要调用PushObjectCache接口进行URL预热,以下是操作步骤: 1. 准备工作 首先,安装阿里云SDK NuGet包: Install-Package Aliyun.NET.SDK.CDN -Version 3.0.0 Install-Package Aliyun.NET.SDK.Core -Version 3.0.0 2. 创建ASP.NET Web页面代码 CDNPreheat.aspx…...
LangChain-提示模板 (Prompt Templates)
提示模板是LangChain的核心组件,用于构建发送给语言模型的输入。本文档详细介绍了提示模板的类型、功能和最佳实践。 概述 提示工程是使用大型语言模型的关键技术。通过精心设计的提示,可以显著提高模型的输出质量和相关性。LangChain的提示模板系统提…...
多线程中的互斥与同步
多线程中的互斥与同步 1. 互斥与同步的区别 互斥:确保某一资源在同一时刻只能被一个线程访问。其主要目的是保证资源的唯一性和排他性,但无法控制访问的顺序。同步:在互斥的基础上,进一步通过其他机制保证访问资源的有序性。 2…...
ValueError: Cannot handle batch sizes > 1 if no padding token is defined`
ValueError: Cannot handle batch sizes > 1 if no padding token is defined` batch sizes > 1 进行掩码填充:pad_token,eos_token 在处理自然语言处理任务时,尤其是在使用批量数据进行训练或推理时,经常需要对输入文本进行填充(padding),以确保每个输入序列具…...
Gemma 3模型:Google 开源新星,大语言模型未来探索
🐇明明跟你说过:个人主页 🏅个人专栏:《深度探秘:AI界的007》 🏅 🔖行路有良友,便是天堂🔖 目录 一、引言 1、快速发展的AI世界:为何关注Gemma 3&#x…...
先占个日常,等会写。
引入一个重要的概念 “struct” (译为中文:结构体) 可用作设出比较复杂的一些变量类型 语法 :struct point name { int x; int y; int z;} point 和 name是任意命名的名字,含义是,声明一个变量类型为st…...
PyTorch Tensor维度变换实战:view/squeeze/expand/repeat全解析
本文从图像数据处理、模型输入适配等实际场景出发,系统讲解PyTorch中view、squeeze、expand和repeat四大维度变换方法。通过代码演示对比不同方法的适用性,助您掌握数据维度调整的核心技巧。 一、基础维度操作方法 1. view:内存连续的形状重…...
212、【图论】字符串接龙(Python)
题目描述 题目链接:110. 字符串接龙 代码实现 import collectionsn int(input()) beginStr, endStr input().split() strList [input() for _ in range(n)]deque collections.deque() # 使用队列遍历结点 deque.append([beginStr, 1]) # 存储当前字符串和遍…...
土堆教程笔记【PyTorch】
官网:torch — PyTorch 2.6 documentation Pycharm 解释器 一般搞深度学习都用虚拟环境的解释器,为了满足不同的项目所需要的不同的包的版本。 1. system interpreter表示本地的解释器 也就是你电脑系统里安装的解释器 2. Virtual Environment—Py…...
【今日三题】小乐乐改数字 (模拟) / 十字爆破 (预处理+模拟) / 比那名居的桃子 (滑窗 / 前缀和)
⭐️个人主页:小羊 ⭐️所属专栏:每日两三题 很荣幸您能阅读我的文章,诚请评论指点,欢迎欢迎 ~ 目录 小乐乐改数字 (模拟)十字爆破 (预处理模拟)比那名居的桃子 (滑窗 / 前缀和) 小乐乐改数字 (模拟) 小乐乐改数字…...
各类神经网络学习:(九)注意力机制(第1/4集),背景介绍,以及理解与引入
上一篇下一篇GRU(下集)注意力机制(第2/4集) Attention(注意力机制) 又叫做: attention pooling 简单来说,就是在训练的过程中,已知哪些东西更重要,哪些东西次重要。从而更…...
微软出品的AI Toolkit,在VS Code中使用DeepSeek
文章目录 简介调用DeepSeek 简介 AI Toolkit是微软出品的VS Code智能插件,整合了多种AI大模型,使之可以在VS Code中调用。 在插件栏搜索【AI Toolkit for Visual Studio Code】即可安装。安装完成后,左侧活动栏中会出现【AI Toolkit】的图标…...
随机森林与决策树
随机森林 vs 决策树: 随机森林(Random Forest)和决策树(Decision Tree)都是经典的机器学习算法,但它们在原理、性能和适用场景上有显著差异。以下是关键对比: 1. 决策树(Decision T…...
Selenium中`driver.get(htmlfile)`方法可能出现的超时问题
针对Selenium中driver.get(htmlfile)方法可能出现的超时问题,以下是几种改进方案及具体实现方法: 1. 设置页面加载超时时间 通过set_page_load_timeout()方法直接控制页面加载的最大等待时间。若超时,会抛出TimeoutException异常,…...
selenium快速入门
一、操作浏览器 from selenium import webdriver from selenium.webdriver.chrome.options import Options from selenium.webdriver.chrome.service import Service from selenium.webdriver.common.by import By# 设置选项 q1 Options() q1.add_argument("--no-sandbo…...
C++_智能指针
目录 一、智能指针的使用场景、基本概念 (1)因为抛异常而出现的资源泄漏的情况 二、RAII和智能指针的设计思路 三、c标准库智能指针以及使用 (1)几种智能指针的概念 auto_ptr unique_ptr shared_ptr weak_ptr 不是new出来…...
微服务简述
单体架构和微服务架构的区别? 最显著的区别看上去就是单体架构用的同一个数据库,微服务架构用的各自的数据库 单体架构: 所有功能模块(如用户管理、订单处理、支付等)都紧密耦合在一个代码库中。模块之间通过函数调用…...
研发效能实践:BDD(行为驱动开发)深度解毒手册:从「撕逼大会」到「人见人爱」的协作秘笈
引言:每个研发团队都该养一亩「黄瓜田」——论BDD如何终结「三体人」式需求沟通 🌌 「产品说登录要人脸识别,开发做成了指纹验证,测试按文档测出18个bug,最后发现原型图藏在三年前的邮件附件里…」家人们…...
【第40节】windows编程:仿造MFC版本QQ安全卫士
目录 前言 一、实现功能 二、附加功能 三、开发环境 四、数据库简单字段设计 五、代码架构 六、软件界面 七、功能架构 八、部分功能截图 九、相关实现细节概要 9.1 获取文件信息 9.2 清理电脑垃圾信息 9.2.1 回收站 9.2.2 清理指定数据下的文件 9.3 数据库与网…...
BOE(京东方)旗下控股子公司“京东方能源”成功挂牌新三板 以科技赋能零碳未来
2025年4月8日,BOE(京东方)旗下控股子公司京东方能源科技股份有限公司(以下简称“京东方能源”)正式通过全国中小企业股份转让系统审核,成功在新三板挂牌(证券简称:能源科技,证券代码:874526),成为BOE(京东方)自物联网转型以来首个独立孵化并成功挂牌的子公司。此次挂牌是BOE(京…...
【汽车产品开发项目管理——端到端的汽车产品诞生流程】
MPU:集成运算器、寄存器和控制器的中央处理器芯片 MCU:微控制单元,将中央处理器CPU、存储器ROM/RAM、计数器、IO接口及多种外设模块集成在单一芯片上的微型计算机系统。 汽车产品开发项目属性:临时性、独特性、渐进明细性、以目标…...
Visual Studio 2019 配置VTK9.3.1
文章目录 参考博客1、 VTK下载和编译2、vs2019配置vtk9.3.1参考博客 Visual Studio 2022 配置VTK9.3.0 1、 VTK下载和编译 见博客 CMake编译VTK 2、vs2019配置vtk9.3.1 新建一个项目 写入以下代码 #include <vtkActor.h> #include <vtkAssembly.h> #include…...
【含文档+PPT+源码】基于小程序的智能停车管理系统设计与开发
项目视频介绍: 毕业作品基于小程序的智能停车管理系统设计与开发 课程简介: 本课程演示的是一款基于小程序的智能停车管理系统设计与开发,主要针对计算机相关专业的正在做毕设的学生与需要项目实战练习的 Java 学习者。 1.包含:…...
科技自立+产业周期:透视人工智能的配置机遇
最近,全球市场因关税政策调整引发震荡,科技板块波动尤为明显。在此背景下,中国人工智能产业经历了一轮回调。 不过,《一点财经》注意到,4月9日上证科创板人工智能指数一度上涨3.7%。拉长周期看,Wind数据显…...
linux网络配置
今天我们来了解一下linux的网络配置,这个是我们进行网络传输的基础,保证网络资源的使用的手段.那么来看. 网络配置原理图: 查看网络ip和网关 windows:ipconfig linux:ifconfig ping测试主机之间网络联通性 ⭐️ip地址要在同一个网段下才…...
机器学习 | 强化学习方法分类汇总 | 概念向
文章目录 📚Model-Free RL vs Model-Based RL🐇核心定义🐇核心区别 📚Policy-Based RL vs Value-Based RL🐇核心定义🐇 核心区别 📚Monte-Carlo update vs Temporal-Difference update…...
git仓库迁移包括提交记录日志
网上找了很多资料都不好用,直到看到一个亲测有效后,整理如下: 1、进入仓库目录下,并且切换到要迁移的分支上 前提是你本地已有旧仓库的代码;如果没有的话,先拉取。 2、更改仓库地址 git remote set-url …...
Docker部署.NetCore8项目
在VS.net新建.netCore8项目,生成项目的发布文件,之后添加Dockerfile,内容如下: FROM mcr.microsoft.com/dotnet/aspnet:8.0 # 设置工作目录 WORKDIR /app # 挂载临时卷(类似于 VOLUME /tmp) VOLUME /tmp …...
xv6部分源码阅读-1
xv6部分源码阅读 前言 在lab2中,我们会为了完成attack这个实验,而花费大量的时间去阅读相关的系统调用源码,以此来分析出我们最终secret所在的页表的位置,而我写lab2中,重点并没有关注其中的逻辑关系,有很…...
CentOS中离线安装DockerCompos并用其部署Rabbitmq(使用离线导入导出docker镜像方式)
场景 DockerDockerCompose实现部署jenkins,并实现jenkinsfile打包SpringBootVue流水线项目过程详解、踩坑记录(附镜像资源、离线包资源下载): DockerDockerCompose实现部署jenkins,并实现jenkinsfile打包SpringBootVue流水线项目过程详解、踩坑记录(附镜像资源、离…...
基于 OpenHarmony 5.0 的星闪轻量型设备应用开发——Ch2 OpenHarmony LiteOS-M 内核应用开发
写在前面: 此篇是系列文章《基于 OpenHarmony5.0 的星闪轻量型设备应用开发》的第 2 章。本篇介绍了如何在 OpenHarmony 5.0 框架下,针对 WS63 进行 LiteOS-M 内核应用工程的开发。 为了方便读者学习,需要OpenHarmony 5.0 WS63 SDK 的小伙伴可…...
2025年4月9日-华为暑期实习-第二题-200分
📌 点击直达笔试专栏 👉《大厂笔试突围》 💻 春秋招笔试突围在线OJ 👉 笔试突围OJ 02. 智能导航系统 问题描述 K小姐生活在一个被称为"未来之城"的智能城市,这个城市拥有高效的无人驾驶运输网络。城市内的智能车辆可以在不同的交通枢纽之间穿行,每个枢…...
抖音视频下载工具
抖音视频下载工具 功能介绍 这是一个基于Python开发的抖音视频下载工具,可以方便地下载抖音平台上的视频内容。 主要特点 支持无水印视频下载自动提取视频标题作为文件名显示下载进度条支持自动重试机制支持调试模式 使用要求 Python 3.10Chrome浏览器必要的P…...
基于大模型预测儿童急性淋巴细胞白血病诱导达完全缓解患者综合治疗方案研究报告
目录 一、引言 1.1 研究背景与意义 1.2 研究目的 1.3 国内外研究现状 二、儿童急性淋巴细胞白血病及大模型相关理论基础 2.1 儿童急性淋巴细胞白血病概述 2.2 大模型技术原理及特点 三、大模型在术前评估中的应用 3.1 患者基本信息与病情数据收集 3.2 大模型对病情严…...
项目合同从专家到小白
文章目录 按项目范围划分项目总承包合同项目单项承包合同项目分包合同 按项目付款方式划分总价合同固定总价合同总价加激励费用合同(FPIF)总价加经济价格调整合同订购单 \ 单边合同 成本补偿合同工料合同(混合型) 基础概念目标成本…...