当前位置: 首页 > news >正文

如何用正则表达式爬取古诗文网中的数据(python爬虫)

一、了解正则表达式的基本内容:

什么是正则表达式

正则表达式(Regular Expression,简称 regex)是一种用于匹配字符串的模式。它通过特定的语法规则,可以高效地搜索、替换和提取文本中的特定内容。正则表达式广泛应用于文本处理、数据验证、日志分析等领域。

正则表达式在爬虫中的应用

在爬虫中,正则表达式主要用于从网页源码中提取所需信息。以下是其主要应用场景:

  1. 数据提取

    • 从HTML中提取特定标签的内容,如链接、标题、图片地址等。

    • 示例:提取所有链接:<a\s+(?:[^>]*?\s+)?href="([^"]*)"

  2. 数据清洗

    • 去除多余的空格、换行符或HTML标签。

    • 示例:去除HTML标签:<[^>]+>

  3. 数据验证

    • 验证提取的数据是否符合预期格式,如邮箱、日期等。

    • 示例:验证邮箱:^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$

  4. URL匹配

    • 匹配特定模式的URL,用于过滤或分类。

    • 示例:匹配图片URL:https?://[^\s]+?\.(jpg|png|gif)

正则表达式的核心知识点

  1. 基本语法

    • 字符匹配:普通字符匹配自身,如 a 匹配字符 "a"。

    • 元字符:具有特殊含义的字符,如 . 匹配任意字符,* 匹配前一个字符的零次或多次。

  2. 字符类

    • [abc] 匹配 "a"、"b" 或 "c"。

    • [^abc] 匹配除 "a"、"b"、"c" 之外的字符。

    • \d 匹配数字,\w 匹配字母、数字或下划线,\s 匹配空白字符。

  3. 量词

    • *:零次或多次。

    • +:一次或多次。

    • ?:零次或一次。

    • {n}:恰好 n 次。

    • {n,}:至少 n 次。

    • {n,m}:n 到 m 次。

  4. 分组和捕获

    • (abc) 匹配 "abc" 并捕获。

    • (?:abc) 匹配 "abc" 但不捕获。

  5. 锚点

    • ^ 匹配字符串开头。

    • $ 匹配字符串结尾。

    • \b 匹配单词边界。

  6. 贪婪与懒惰匹配

    • 默认是贪婪匹配,尽可能匹配更多字符。

    • 在量词后加 ? 可进行懒惰匹配,尽可能匹配更少字符。

    • 示例:a.*?b 匹配 "a" 和 "b" 之间的最短内容。

总结

正则表达式是爬虫中强大的工具,能够高效提取和清洗数据。掌握其基本语法和常用技巧,能显著提升爬虫的开发效率和数据处理能力。

同时代码中还涉及到了re库的使用:

re 是 Python 标准库中用于处理正则表达式的模块,提供了丰富的函数和方法来操作字符串。通过 re 库,你可以轻松实现字符串的匹配、查找、替换和分割等操作。

re 库是 Python 中处理正则表达式的强大工具,提供了多种函数和方法来操作字符串。掌握 re 库的使用,可以显著提升文本处理的效率和灵活性,尤其在爬虫开发中,re 库是不可或缺的工具。

re 库的核心功能

  1. 编译正则表达式
    • re.compile(pattern, flags=0):将正则表达式编译成一个正则对象,便于重复使用。

    • 示例:

      pattern = re.compile(r'\d+')

  2. 匹配字符串
    • re.match(pattern, string, flags=0):从字符串开头匹配正则表达式,返回匹配对象或 None

    • 示例:

      match = re.match(r'\d+', '123abc')
      if match:print(match.group())  # 输出: 123

  3. 搜索字符串
    • re.search(pattern, string, flags=0):在字符串中搜索第一个匹配项,返回匹配对象或 None

    • 示例:

      search = re.search(r'\d+', 'abc123def')
      if search:print(search.group())  # 输出: 123

  4. 查找所有匹配项
    • re.findall(pattern, string, flags=0):返回所有匹配项的列表。

    • 示例:

      findall = re.findall(r'\d+', 'a1b2c3')
      print(findall)  # 输出: ['1', '2', '3']

  5. 查找所有匹配项(返回迭代器)
    • re.finditer(pattern, string, flags=0):返回所有匹配项的迭代器,每个元素是一个匹配对象。

    • 示例:

      finditer = re.finditer(r'\d+', 'a1b2c3')
      for match in finditer:print(match.group())  # 输出: 1, 2, 3

  6. 替换字符串
    • re.sub(pattern, repl, string, count=0, flags=0):替换字符串中所有匹配项,返回替换后的字符串。

    • 示例:

      sub = re.sub(r'\d+', 'X', 'a1b2c3')
      print(sub)  # 输出: aXbXcX

  7. 分割字符串
    • re.split(pattern, string, maxsplit=0, flags=0):根据正则表达式分割字符串,返回列表。

    • 示例:

      split = re.split(r'\d+', 'a1b2c3')
      print(split)  # 输出: ['a', 'b', 'c', '']
      

re 库的常用方法详解

  1. 匹配对象的方法

    • group():返回匹配的字符串。

    • start():返回匹配的起始位置。

    • end():返回匹配的结束位置。

    • span():返回匹配的 (起始, 结束) 位置元组。

  2. 编译标志

    • re.IGNORECASE 或 re.I:忽略大小写。

    • re.MULTILINE 或 re.M:多行模式,^ 和 $ 匹配每行的开头和结尾。

    • re.DOTALL 或 re.S. 匹配包括换行符在内的所有字符。

    • re.VERBOSE 或 re.X:允许在正则表达式中添加注释和空白符。

二、具体的爬虫代码解释(以古诗文网为例)

古诗文网-古诗文经典传承

url=唐代诗文_古诗文网https://www.gushiwen.cn/shiwens/default.aspx?cstr=%e5%94%90%e4%bb%a3 (以唐代的诗文题目为例,可扩充)

右键检查 :

具体的代码解释 :

1. requests 库的使用

  • 功能requests 是一个用于发送 HTTP 请求的 Python 库,常用于爬虫中获取网页内容。

  • 知识点

    • requests.get(url, headers=headers):发送 GET 请求,获取网页内容。

    • resp.encoding = 'utf-8':设置响应的编码格式,确保正确解析中文内容。

    • resp.text:获取响应的文本内容(HTML 源码)。

    • headers:请求头,用于模拟浏览器访问,避免被网站反爬虫机制拦截。

      • User-Agent:标识客户端类型(如浏览器),示例中使用的是 Chrome 浏览器的标识。


2. 正则表达式(re 库)

  • 功能:用于从 HTML 文本中提取目标数据(如古诗标题)。

  • 知识点

    • re.findall(pattern, string, flags):从字符串中查找所有匹配正则表达式的部分,返回一个列表。

    • 正则表达式模式:

      • r'<div\sclass="cont">.*?<b>(.*?)</b>'

        • <div\sclass="cont">:匹配 <div class="cont"> 标签。

        • .*?:非贪婪匹配任意字符(尽可能少匹配)。

        • <b>(.*?)</b>:匹配 <b> 标签中的内容,(.*?) 是捕获组,提取标题内容。

    • re.DOTALL 标志:使 . 匹配包括换行符在内的所有字符。


3. Python 函数

  • 功能:将代码模块化,提高可读性和复用性。

  • 知识点

    • def parse_page(url):定义一个函数,用于解析网页内容。

    • def spider():定义一个函数,作为爬虫的入口。

    • if __name__ == '__main__'::确保脚本在直接运行时执行 spider() 函数,而在被导入时不执行。


4. URL 和请求头

  • 知识点

    • URL

      • https://www.gushiwen.cn/shiwens/default.aspx?cstr=%e5%94%90%e4%bb%a3:目标网页地址。

      • cstr=%e5%94%90%e4%bb%a3:URL 编码,表示查询参数(这里是“唐代”)。

    • 请求头

      • headers:用于模拟浏览器访问,避免被反爬虫机制拦截。

      • User-Agent:标识客户端类型,示例中使用的是 Chrome 浏览器的标识。


5. 编码问题

  • 知识点

    • resp.encoding = 'utf-8':设置响应的编码格式为 UTF-8,确保正确解析中文内容。

    • 如果未设置编码,可能会导致乱码问题。


6. 代码执行流程

  • 知识点

    1. 调用 spider() 函数。

    2. spider() 函数调用 parse_page(url),传入目标 URL。

    3. parse_page(url) 发送 HTTP 请求,获取网页内容。

    4. 使用正则表达式从 HTML 中提取古诗标题。

    5. 打印提取的标题列表。

具体代码展示:
import requests
import reurl = "https://www.gushiwen.cn/shiwens/default.aspx?cstr=%e5%94%90%e4%bb%a3"
header = {"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/134.0.0.0 Safari/537.36 Edg/134.0.0.0"
}def parse_page(url):resp = requests.get(url, headers=header)resp.encoding = 'utf-8'  # 确保编码正确html = resp.text# 调整正则表达式以匹配实际的HTML结构titles = re.findall(r'<div\sclass="cont">.*?<b>(.*?)</b>', html, re.DOTALL)print(titles)def spider():url = "https://www.gushiwen.cn/shiwens/default.aspx?cstr=%e5%94%90%e4%bb%a3"  # 古诗文网parse_page(url)if __name__ == '__main__':spider()
运行结果:

 

 三、改进建议:根据以上代码格式不光可以爬取古诗文题目也可以爬取内容作者等

所以后面的代码有改动: 

import requests
import re# 目标URL
url = "https://www.gushiwen.cn/shiwens/default.aspx?cstr=%e5%94%90%e4%bb%a3"# 请求头,模拟浏览器访问
header = {"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/134.0.0.0 Safari/537.36 Edg/134.0.0.0"
}def parse_page(url):# 发送HTTP请求,获取网页内容resp = requests.get(url, headers=header)resp.encoding = 'utf-8'  # 设置编码html = resp.text# 正则表达式提取古诗的标题、作者和内容poem_pattern = re.compile(r'<div class="cont">.*?<b>(.*?)</b>.*?'  # 标题r'<p class="source">.*?<a.*?>(.*?)</a>.*?<a.*?>(.*?)</a>.*?'  # 作者r'<div class="contson".*?>(.*?)</div>',  # 内容re.DOTALL)# 查找所有匹配的古诗poems = poem_pattern.findall(html)# 遍历提取结果for poem in poems:title = poem[0].strip()  # 标题author = f"{poem[1].strip()} {poem[2].strip()}"  # 作者content = re.sub(r'<.*?>', '', poem[3]).strip()  # 去除内容中的HTML标签# 打印结果print(f"标题: {title}")print(f"作者: {author}")print(f"内容: {content}")print("-" * 50)  # 分隔线def spider():# 目标URLurl = "https://www.gushiwen.cn/shiwens/default.aspx?cstr=%e5%94%90%e4%bb%a3"parse_page(url)if __name__ == '__main__':spider()

部分正则表达式的来源: 

poem_pattern = re.compile(r'<div class="cont">.*?<b>(.*?)</b>.*?'  # 标题r'<p class="source">.*?<a.*?>(.*?)</a>.*?<a.*?>(.*?)</a>.*?'  # 作者r'<div class="contson">.*?>(.*?)</div>',  # 内容re.DOTALL
)

 

运行结果:

相关文章:

如何用正则表达式爬取古诗文网中的数据(python爬虫)

一、了解正则表达式的基本内容&#xff1a; 什么是正则表达式 正则表达式&#xff08;Regular Expression&#xff0c;简称 regex&#xff09;是一种用于匹配字符串的模式。它通过特定的语法规则&#xff0c;可以高效地搜索、替换和提取文本中的特定内容。正则表达式广泛应用于…...

深度学习 Deep Learning 第1章 深度学习简介

第1章 深度学习简介 概述 本章介绍人工智能&#xff08;AI&#xff09;和深度学习领域&#xff0c;讨论其历史发展、关键概念和应用。解释深度学习如何从早期的AI和机器学习方法演变而来&#xff0c;以及如何有效解决之前方法无法应对的挑战。 关键概念 1. 人工智能的演变 …...

ByteByteGo学习笔记:通知系统设计

引言 在当今这个信息爆炸的时代&#xff0c;通知系统已经成为了现代应用程序中不可或缺的重要组成部分。无论是突发新闻的即时推送、产品更新的及时告知、促销活动的精准触达&#xff0c;还是用户交互的实时反馈&#xff0c;通知都扮演着至关重要的角色。一个高效、可靠、可扩…...

[设计模式]1_设计模式概览

摘要&#xff1a;设计模式原则、设计模式的划分与简要概括&#xff0c;怎么使用重构获得设计模式并改善代码的坏味道。 本篇作概览与检索用&#xff0c;后续结合源码进行具体模式深入学习。 目录 1、设计模式原理 核心原则&#xff08;语言无关&#xff09; 本质原理图 原…...

Python + Qt Designer构建多界面GUI应用程序:Python如何调用多个界面文件

引言 Qt Designer是一个用户友好的图形用户界面设计工具&#xff0c;它可以帮助开发人员通过拖放的方式快速创建界面。在实际开发中&#xff0c;往往需要设计多个界面文件&#xff0c;并在Python代码中进行统一管理和使用。本文将介绍如何在Python中使用Qt Designer设计好的多…...

AGI大模型(7):提示词应用

1 生成数据 LLM具有⽣成连贯⽂本的强⼤能⼒。使⽤有效的提示策略可以引导模型产⽣更好、更⼀致和更真实的响应。LLMs还可以特别有⽤地⽣成数据,这对于运⾏各种实验和评估⾮常有⽤。例如,我们可以使⽤它来为情感分类器⽣成快速样本,如下所示: 提示: ⽣成10个情感分析的范…...

【倒霉bug2025】找不到vc_runtimeMinimum_x64.msi

今天是倒霉的一天&#xff0c;当喉咙痛到无法出门玩耍的我打开steam准备开始玩《冰封世界》时&#xff0c;游戏启动直接报错 在选择安装之后弹出一个经典窗口 然后在C:\ProgramData\PackageCache中找msi到位置点击确定继续报错说msi版本不对 上网一搜&#xff0c;找不到vc_ru…...

什么是强哈希算法pbkdf2(Password-Based Key Derivation Function)

文章目录 什么是pbkdf2使用场景 在线工具 什么是pbkdf2 维基百科&#xff1a;https://zh.wikipedia.org/zh-cn/PBKDF2 PBKDF2&#xff08;Password-Based Key Derivation Function 2&#xff09;是一种基于密码的密钥派生函数。它的主要作用是从密码和盐&#xff08;salt&…...

Python 基础语法详解

一、变量和数据类型 变量 在 Python 中&#xff0c;变量无需声明类型&#xff0c;直接赋值即可。变量名区分大小写。 # 整数类型 age 25 print(age) # 输出&#xff1a;25# 浮点数类型 height 1.75 print(height) # 输出&#xff1a;1.75# 字符串类型 name "张三&…...

AI Agent 时代开幕-Manus AI与OpenAI Agent SDK掀起新风暴

【本周AI新闻: AI Agent 时代开幕-Manus AI与OpenAI Agent SDK掀起新风暴】 https://www.bilibili.com/video/BV1bkQyYCEvQ/?share_sourcecopy_web&vd_source32ed33e1165d68429b2e2eb4749f3f26 最近AI圈子里最火的话题非Manus莫属&#xff01;这款由中国武汉创业公司“蝴…...

为什么会出现redis数据库?redis是什么?

什么是 Redis? 为什么要用 Redis? 下面我将从 Redis 出现的背景、Redis 的解决方案个来回答。 1、Redis 出现的背景 互联网的应用越来越多&#xff0c;例如社交网络、电商、实时服务发展的十分迅速&#xff0c;这就导致了传统技术栈&#xff08;如关系型数据库&#xff09;…...

每日一题---dd爱框框(Java中输入数据过多)

dd爱框框 实例&#xff1a; 输入&#xff1a; 10 20 1 1 6 10 9 3 3 5 3 7 输出&#xff1a; 3 5 这道题要解决Java中输入的数过多时&#xff0c;时间不足的的问题。 应用这个输入模板即可解决&#xff1a; Java中输入大量数据 import java.util.*; import java.io.*;pu…...

Flink-学习路线

最近想学习一下Flink&#xff0c;公司的实时需求还是不少的&#xff0c;因此结合ai整理了一份学习路线&#xff0c;记录一下。 当然&#xff0c;公司也有Scala版本Flink框架&#xff0c;也学习了一下。这里只说Java版本 1. Java基础 目标: 掌握Java编程语言的基础知识。 内容…...

一次Milvus迁移的记录

前言 希望把Linux上生产环境中使用docker compose运行的milvus迁移到本地(mac os)的docker compose中 操作过程 找到了官方有两个相关的项目&#xff1a; https://github.com/zilliztech/milvus-backup https://github.com/zilliztech/vts 但是…我都没用&#xff0c;因为使…...

矩阵的转置

对于的矩阵&#xff0c;使用两个指针变量&#xff0c;可以方便实现(i,j)处元素与(j,i)处元素交换位置。令指针Arow&A[i][0]&#xff0c;则Arow[j]可实现对第i行j列元素的访问。令指针Bptr&A[0][i]&#xff0c;则*Bptr就可以访问(0,i)处元素&#xff0c;然后&#xff0c…...

使用 VLOOKUP 和条件格式在 Excel 中查找并标红匹配的串号

使用 VLOOKUP 和条件格式在 Excel 中查找并标红匹配的串号 你的步骤非常详细且清晰&#xff0c;能够帮助用户在 Excel 中通过 VLOOKUP 和条件格式来查找并标红匹配的串号。以下是对你提供的步骤的简要总结和补充说明&#xff1a; 1. 添加“是否匹配”列 在 a.xlsx 中新增一列…...

Python Matplotlib面试题精选及参考答案

目录 绘制函数 y=2x+5 在区间 [1,10] 的折线图,设置标题和坐标轴标签 在同一图中绘制 sin (x) 和 cos (x) 曲线,添加图例和网格线(x∈[0,2π]) 绘制分段函数:当 x<0 时 y=0,x≥0 时 y=x,设置不同线段颜色 绘制带数据点的折线图,使用红色虚线样式和圆形标记(数据…...

在线 SQL 转 SQLAlchemy:一键生成 Python 数据模型

一款高效的在线 SQL 转 SQLAlchemy 工具&#xff0c;支持自动解析 SQL 语句并生成 Python SQLAlchemy 模型代码&#xff0c;适用于数据库管理、后端开发和 ORM 结构映射。无需手写 SQLAlchemy 模型&#xff0c;一键转换 SQL 结构&#xff0c;提升开发效率&#xff0c;简化数据库…...

基于自定义线程池手写一个异步任务管理器

我们在后端执行某些耗时逻辑操作时往往会导致长时间的线程阻塞&#xff0c;在这种情况之下&#xff0c;我们往往会引一条异步线程去处理这些异步任务&#xff0c;如果每次都创建新的线程来处理这些任务&#xff0c;不仅会增加代码冗余&#xff0c;还可能造成线程管理混乱&#…...

基恩士PLC编程小技巧八:脚本过长如何实现换行及替换

基恩士PLC编程小技巧八&#xff1a;脚本过长如何实现换行&#xff1f; 一、问题点 我们在使用基恩士编程软件KV STUDIO 进行脚本编程时&#xff0c;经常遇到这样的问题&#xff1a;脚本的一行过长&#xff0c;程序不好阅读及维护。 IF MR1000 OR MR1001 OR MR1002 OR MR1003 OR…...

每日一题---数组中两个字符串的最小距离

数组中两个字符串的最小距离 给定一个字符串数组strs&#xff0c;再给定两个字符串str1和str2&#xff0c;返回在strs中str1和str2的最小距离&#xff0c;如果str1或str2为null&#xff0c;或不在strs中&#xff0c;返回-1。 链接&#xff1a;数组中两个字符串的最小距离__牛…...

【PTA题目解答】7-1利用STL比较数据大小并排序(15分)c++

1.题目&#xff1a; 2.算法原理 根据题目要求&#xff0c;模拟即可&#xff0c;set容器会帮我们把插入的数自动排序好 题目说输入非整型数据就停止&#xff0c;不用特意判断输入的数据是整型还是非整型&#xff0c;如果用户输入的是字符&#xff08;例如 a&#xff09;&#…...

如何用Deepseek制作流程图?

使用Deepseek制作流程图&#xff0c;本质上是让AI根据你的需求&#xff0c;生成相关流程图的代码&#xff0c;然后在流程图编辑器中渲染&#xff0c;类似于Python一样&#xff0c;ChatGPT可以生成代码&#xff0c;但仍需在IDE中执行。 你知道绘制流程图最高效的工具是什么吗&a…...

【09】单片机编程核心技巧:变量赋值,从定义到存储的底层逻辑

【09】单片机编程核心技巧&#xff1a;变量赋值&#xff0c;从定义到存储的底层逻辑 &#x1f31f; 核心概念 单片机变量的定义与赋值是程序设计的基础&#xff0c;其本质是通过 RAM&#xff08;随机存储器&#xff09; 和 ROM&#xff08;只读存储器&#xff09; 的协作实现…...

vscode python相对路径的问题

vscode python相对路径的问题 最近使用使用vscode连接wsl2写python时&#xff0c;经常遇到找不到包中的方法的问题&#xff0c;最终发现vscode在执行python代码时目录不是从当前python文件开始算起&#xff0c;而是从当前工作区的目录开始算起&#xff0c;比如说我打开的是/ho…...

C语言中的指针与函数

引言 在C语言编程中,指针是一个非常重要且强大的概念。它不仅帮助我们高效地管理内存,还能提升程序的灵活性和性能。而指针与函数的结合使用,是C语言中非常常见且极具挑战性的一个话题。正确理解和使用指针与函数的关系,不仅能帮助程序员提高代码质量,还能优化程序的执行…...

深度学习-服务器训练SparseDrive过程记录

1、cuda安装 1.1 卸载安装失败的cuda 参考&#xff1a;https://blog.csdn.net/weixin_40826634/article/details/127493809 注意&#xff1a;因为/usr/local/cuda-xx.x/bin/下没有卸载脚本&#xff0c;很可能是apt安装的&#xff0c;所以通过执行下面的命令删除&#xff1a; a…...

理解langchain langgraph 官方文档示例代码中的MemorySaver

以下是langchain v0.3官方示例代码 from langgraph.checkpoint.memory import MemorySaver from langgraph.graph import START, MessagesState, StateGraph# 可以理解为&#xff1a;定义一个流程&#xff0c;这个流程中用到的数据类型是Messages。 <---定义一个有向图&…...

JumpServer基础功能介绍演示

堡垒机可以让运维人员通过统一的平台对设备进行维护&#xff0c;集中的进行权限的管理&#xff0c;同时也会对每个操作进行记录&#xff0c;方便后期的溯源和审查&#xff0c;JumpServer是由飞致云推出的开源堡垒机&#xff0c;通过简单的安装配置即可投入使用&#xff0c;本文…...

Spring @Bean注解使用场景二

bean:最近在写一篇让Successfactors顾问都能搞明白的sso的逻辑的文章&#xff0c;所以一致在研究IAS的saml2.0的协议&#xff0c;希望用代码去解释SP、idp的一些概念&#xff0c;让顾问了解SSO与saml的关系&#xff0c;在github找代码的时候发现一些代码的调用关系很难理解&…...

创业者认知、思辨、成长指南

一、为什么要创业&#xff1f; 1、因为没有家产继承和家庭关系&#xff0c;不能躺平&#xff1b; 比如父母留下了大量的财富&#xff0c;靠钱生钱吃利息&#xff0c;收租&#xff0c;做做投资这些形式&#xff0c;就可以活得很好&#xff1b; 再比如父母或者血亲有资源&#…...

ECharts中Map(地图)样式配置、渐变色生成

前言 ECharts是我们常用的图表控件&#xff0c;功能特别强大&#xff0c;每次使用都要查API比较繁琐&#xff0c;这里就记录开发中常用的配置。 官网&#xff1a;https://echarts.apache.org/handbook/zh/get-started 配置项&#xff1a;https://echarts.apache.org/zh/opti…...

PostgreSQL存储管理体系结构学习笔记2

1.表和元组的组织方式 在PostgreSQL中&#xff0c;同一个表中的元组按照创建顺序依次插入到表文件中。元组之间不进行关联&#xff0c;这样的表文件称之为堆文件。PostgreSQL系统中包含了四种堆文件&#xff1a;普通堆&#xff0c;临时堆&#xff0c;序列&#xff0c;TOAST表。…...

【PTA题目解答】7-3 字符串的全排列(20分)next_permutation

1.题目 给定一个全由小写字母构成的字符串&#xff0c;求它的全排列&#xff0c;按照字典序从小到大输出。 输入格式: 一行&#xff0c;一个字符串&#xff0c;长度不大于8。 输出格式: 输出所有全排列&#xff0c;每行一种排列形式&#xff0c;字典序从小到大。 输入样例…...

SOME/IP:用Python实现协议订阅、Offer、订阅ACK与报文接收

文章目录 前言一、代码层次二、详细代码1. eth_scapy_sd.py2、eth_scapy_someip.py3、network_define.py4、packet_define.py5、unpack_define.py6、someip_controller.py 前言 1、需要pip安装scapy库 2、需要修改根据实际情况配置network_define.py 3、执行someip_controller…...

嵌入式八股ARM篇

前言 ARM篇主要介绍一下寄存器和中断机制,至于汇编这一块…还请大家感兴趣自行学习 1.寄存器 R0 - R3 R4 - R11 寄存器 R0 - R3一般用作函数传参 R4 - R11用来保存程序运算的中间结果或函数的局部变量 在函数调用过程中 注意在发生异常的时候 cortex-M0架构会自动将R0-R3压入…...

剑指 Offer II 087. 复原 IP

comments: true edit_url: https://github.com/doocs/leetcode/edit/main/lcof2/%E5%89%91%E6%8C%87%20Offer%20II%20087.%20%E5%A4%8D%E5%8E%9F%20IP/README.md 剑指 Offer II 087. 复原 IP 题目描述 给定一个只包含数字的字符串 s &#xff0c;用以表示一个 IP 地址&#xf…...

RCE-Labs超详细WP-Level10(无字母命令执行_二进制整数替换)

温馨提示 这关涉及的知识点较多, 写的很长, 中间留了很多错误引导(本人在实验时遇到的问题, 或许你们也会遇到), 在后文才逐步解释源码分析 跟前几关一样, 更改了 WAF 的过滤字段这个关卡, 只有0, 1, (单引号), $, <, \ , ( , )可以用解题分析(实验这些命令, 可以先在自己本…...

数据结构(泛型)

1,装箱 int i 10;Integer j Integer.valueOf(i);2.拆箱 Integer i 10;int j i.intValue(); 3.自动装箱 int i 10;Integer j i;int i 10;Integer j (Integer) i; 4,自动拆箱 Integer i 10;int j i;Integer i 10;int j (int) i; 有一段代码需要解析一下&#xff1a; …...

Android Dagger2 框架辅助工具模块深度剖析(六)

一、引言 在 Android 开发领域&#xff0c;依赖注入&#xff08;Dependency Injection&#xff0c;简称 DI&#xff09;作为一种至关重要的设计模式&#xff0c;能显著降低代码间的耦合度&#xff0c;提升代码的可测试性与可维护性。Dagger2 作为一款强大的依赖注入框架&#…...

LVGL第三方库的使用(中文库)

一、第三方库文档 3rd party libraries&#xff08;第三方库&#xff09; — LVGL 文档 FreeType 中文字库 SDL 模拟器使用freetype中文字库 1.开启字库 2.安装freetype 字库 sudo apt-get update sudo apt-get install libfreetype6-dev 3.修改makefile 添加字库 4.显示中…...

【愚公系列】《高效使用DeepSeek》009-PPT大纲自动生成

标题详情作者简介愚公搬代码头衔华为云特约编辑,华为云云享专家,华为开发者专家,华为产品云测专家,CSDN博客专家,CSDN商业化专家,阿里云专家博主,阿里云签约作者,腾讯云优秀博主,腾讯云内容共创官,掘金优秀博主,亚马逊技领云博主,51CTO博客专家等。近期荣誉2022年度…...

使用easyexcel实现单元格样式设置和下拉框设置

1.单元格样式设置 1.1实体类 public class DemoData {ExcelProperty("PK")private String name;ExcelProperty("年龄")private int age;// 必须提供无参构造方法public DemoData() {}public DemoData(String name, int age) {this.name name;this.age …...

ngx_conf_read_token

file_size ngx_file_size(&cf->conf_file->file.info); 此时 file_size2656 当然还是和上次一样 for ( ;; ) {if (b->pos > b->last) { 此时 b->pos 0x57759a8b77f4 b->last 0x57759a8b8230 b->start0x57759a8b77d0 条件不成立 ch *b->po…...

Certbot实现SSL免费证书自动续签(CentOS 7 + nginx/apache)

在 CentOS 上&#xff0c;你可以使用 Let’s Encrypt 提供的 Certbot 工具来申请和自动续约免费的 SSL 证书。 1. 安装 Certbot CentOS 7 安装 EPEL 和 Certbot yum install -y epel-release yum install -y certbot python3-certbot-nginx如果使用的是 Apache&#xff1a; …...

【使用 Java 调用命令行工具:完整指南】

在 Java 中调用命令行工具是一个常见的需求&#xff0c;尤其是在需要与外部程序交互或执行系统命令时。本文将详细介绍如何使用 Java 调用命令行工具&#xff0c;并提供一个完整的示例来演示如何下载视频。 1. 为什么需要调用命令行工具&#xff1f; 命令行工具通常提供了强大…...

pythonSTL---sys

sys 是 Python 标准库中的一个内置模块&#xff0c;它提供了许多与 Python 解释器和系统环境进行交互的功能。 sys方法 1. 导入 sys 模块 在使用 sys 库的功能之前&#xff0c;需要先导入它&#xff1a; import sys2. 命令行参数 (sys.argv) sys.argv 是一个包含命令行参数…...

数据分布偏移检测:保障模型在生产环境中的稳定性

数据分布偏移检测:保障模型在生产环境中的稳定性 引言 在机器学习系统从开发环境部署到生产环境的过程中,数据分布偏移问题是影响模型性能的主要挑战之一。当训练数据与生产环境中的数据分布不一致时,即使是经过精心调优的模型也可能表现出明显的性能下降。本文将深入探讨…...

redis删除与先判断再删除的区别

在Redis中&#xff0c;“先判断存在再删除”与“直接删除”的区别主要体现在‌操作效率、原子性保障、并发安全性‌三个方面&#xff0c;具体对比如下&#xff1a; ‌1. 操作效率‌ ‌直接删除‌&#xff1a;仅需执行DEL命令一次&#xff0c;无论键是否存在均直接操作&#xf…...

3.6、数字签名

目录 数字签名数字签名与验证过程 数字签名 数字签名是签名者使用自己的私钥对待签名数据的哈希值做密码运算得到的一个结果 第一签名者用自己的私钥来对我们待签数据的哈希值进行签名&#xff0c;直接对数据进行签名其实也是可以的&#xff0c;只是对数据签名&#xff0c;这…...