Hive之正则表达式
Hive版本:hive-3.1.2
目录
一、Hive的正则表达式概述
1.1 字符集合
1.2 边界集合
1.3 量词(重复次数)集合
1.4 转义操作符
1.5 运算符优先级
二、Hive 正则表达式案例
2.1 like
2.2 rlike
2.3 regexp
2.4 regexp_replace正则替换
2.5 regexp_extract正则提取
2.6、hive实现Oracle中的REGEXP_SUBSTR
三、完整代码示例
场景:清洗日志数据
四、注意事项
五、常用正则模式
六、工作中高频使用
1、数据清洗(脱敏、格式转换)
2、日志解析(提取关键信息)
3、URL参数解析(电商/广告分析)
4、电话号码格式校验(金融/电信)
七、Hive正则核心函数强化
1、REGEXP_EXTRACT 动态提取
2、REGEXP_REPLACE 复杂替换
3、RLIKE 多条件过滤
一、Hive的正则表达式概述
正则表达式是一种用于匹配和操作文本的强大工具,它是由一系列字符和特殊字符组成的模式,用于描述要匹配的文本模式。Hive 支持基于正则表达式的字符串处理,常用于数据清洗、模式匹配和文本提取 ,本篇文章主要对hive正则表达式的总结归纳。
Hive支持如下正则表达式:
- like
- rlike
- regexp
- regexp_extract
- regexp_replace
1.1 字符集合
字符 | 描述 |
[a-z] | 字符范围。匹配指定范围内的任意字符。例如,'[a-z]' 可以匹配 'a' 到 'z' 范围内的任意小写字母字符。 |
[A-Z] | '[A-Z]' 可以匹配 'A' 到 'Z' 范围内的任意大写字母字符。 |
[^a-z] | 匹配任何不在指定范围内的任意字符。例如,'[^a-z]' 可以匹配任何不在 'a' 到 'z' 范围内的任意字符。 |
\d | 匹配一个数字字符,等价于[0-9],匹配所有的数字 |
\D | 匹配一个非数字字符,等价于[^0-9] |
\w | 匹配字母、数字、下划线。等价于'[A-Za-z0-9_]' |
\W | 匹配非字母、数字、下划线。等价于 '[^A-Za-z0-9_]' |
\s | 匹配任何空白字符,包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v] |
\S | 匹配任何非空白字符。等价于 [^ \f\n\r\t\v] |
\f | 匹配一个换页符。 |
\n | 匹配一个换行符。等价于 \x0a 和 \cJ |
\r | 匹配一个回车符。等价于 \x0d 和 \cM |
1.2 边界集合
字符 | 描述 |
^ | 每一行的开头,单行模式下等价于字符串的开头 |
$ | 每一行的结尾,单行模式下等价于字符串的结尾 |
1.3 量词(重复次数)集合
字符 | 描述 |
* | 匹配前面的子表达式零次或多次。例如,zo* 能匹配 "z" 以及 "zoo"。* 等价于{0,} |
+ | 匹配前面的子表达式一次或多次。例如,'zo+' 能匹配 "zo" 以及 "zoo",但不能匹配 "z"。+ 等价于 {1,} |
? | 匹配前面的子表达式零次或一次。例如,"do(es)?" 可以匹配 "do" 或 "does" 。? 等价于 {0,1} |
{n} | n 是一个非负整数。匹配确定的 n 次。例如,'o{2}'能匹配 "food" 中的两个 o |
{n,} | n 是一个非负整数。至少匹配n 次。例如,'o{2,}' 能匹配 "foooood" 中的所有 o |
{n,m} | m 和n均为非负整数,其中n <= m。最少匹配 n 次且最多匹配 m 次。例如,"o{1,3}" 将匹配 "fooooood" 中的前三个 o |
1.4 转义操作符
字符 | 描述 |
\ | 将下一个字符标记为一个特殊字符、或一个原义字符等。例如,'n' 匹配字符 "n"。'\n' 匹配一个换行符 |
1.5 运算符优先级
正则表达式从左到右进行计算,并遵循优先级顺序。相同优先级的从左到右进行运算,不同优先级的运算先高后低。下表从最高到最低说明了各种正则表达式运算符的优先级顺序:
运算符 | 描述 | 示例 |
转义符\ | \ 是用于转义其他特殊字符的转义符号。它具有最高的优先级。 | \d 匹配数字,\. 匹配点号 |
圆括号() | 圆括号()用于创建子表达式,具有高于其他运算符的优先级。 | (abc)+ 匹配 "abc" 一次或多次 |
量词 *, +, ?, {n}, {n,}, {n,m} | 量词指定前面的元素可以重复的次数。 | a* 匹配零个或多个 "a" |
定位点^, $ | ^ 表示行的开头,$ 表示行的结尾 | |
管道符号| | | 表示"或"关系,用于在多个模式之间选择一个 | cat|dog 能够匹配到 "cat" 或 "dog" |
举例:\d{2,3}|[a-z]+(abc)* 的运算顺序
\d{2,3}
匹配两到三个数字|
表示或[a-z]+
匹配一个或多个小写字母(abc)*
匹配零个或多个 "abc"
二、Hive 正则表达式案例
2.1 like
- 语法1: A like B
- 语法2: like(A, B)
- 操作类型: strings
- 返回类型:boolean或null
- 描述:如果字符串A或者字符串B为null,则返回null;如果字符串A符合表达式B 的正则语法,则为true;否则为false。B中字符”_”表示任意单个字符,而字符”%”表示任意数量的字符。
-- 举例:select 'ahngnfg' like '%nfg' --> true (%nfg也可以理解为以'nfg'结尾的字符)select 'ahngnfg' like 'nfg%' --> false(nfg%也可以理解为以'nfg'开头的字符)select 'ahngnfg' like '%nfg%' --> true (%nfg% 也可以理解为包含'nfg'的字符)
2.2 rlike
- 语法1: A rlike B
- 语法2: rlike (A, B)
- 操作类型: strings
- 返回类型: boolean或null
- 描述: 如果字符串A或者字符串B为null,则返回null;如果字符串A符合JAVA正则表达式B的正则语法,则为true;否则为false。B中字符”_”表示任意单个字符,而字符”%”表示任意数量的字符。
java正则:
"." 任意单个字符
"*" 匹配前面的字符0次或多次
"+" 匹配前面的字符1次或多次
"?" 匹配前面的字符0次或1次
"\d" 匹配一个数字字符,等于[0-9],使用的时候写成'\\d'
"\D" 匹配一个非数字字符,等于[^0-9],使用的时候写成'\\D'
-- 举例:
select '2314' rlike '\\d+'; --> true
select 'numrqe' rlike '^num'; --> true
2.3 regexp
- 语法1: A regexp B
- 语法2: regexp (A, B)
- 操作类型: strings
- 返回类型: boolean或null
- 描述: 功能与rlike相同
with tmp1 as
(
select '12325abc' as rn
union all
select 'b91256ab56' as rn
union all
select 'bfs89abc21' as rn
)
select rnfrom tmp1where rn regexp '\\d{5}';
-- 匹配开头有3个及以上连续数字的字符
with tmp1 as
(
select '12325abc' as rn
union all
select '91fe56' as rn
union all
select 'bfs89abc21' as rn
)
select rnfrom tmp1where rn regexp '^\\d{3}';
-- 匹配开头只有3个连续数字的字符
with tmp1 as
(
select '12325abc' as rn
union all
select '912fe56' as rn
union all
select 'bfs89abc21' as rn
)
select rnfrom tmp1where rn regexp '^\\d{3}\\D';
2.4 regexp_replace正则替换
判断字符串是否匹配正则表达式模式(返回布尔值)
REGEXP_REPLACE(string, pattern, replacement)
replacement
:替换后的字符串,可使用 $n
引用捕获组
-- 举例:select regexp_replace('h234ney', '\\d+', 'fd'); --> hfdney-- 隐藏手机号中间4位
SELECT REGEXP_REPLACE('电话: 13812345678', '(\\d{3})\\d{4}(\\d{4})', '$1****$2');
-- 输出: 电话: 138****5678
2.5 regexp_extract正则提取
从字符串中提取符合正则表达式模式的子字符串。
REGEXP_EXTRACT(string, pattern, index)
-
string
:原始字符串 -
pattern
:正则表达式模式 -
index
:捕获组的索引(从 1 开始)
-- 提取手机号中的前3位(运营商号段)
SELECT REGEXP_EXTRACT('用户电话: 13812345678', '(\\d{3})\\d{8}', 1);
-- 输出: 138select regexp_extract('honeymoon', 'hon(.*?)(oon)', 0); --> honeymoon
select regexp_extract('honeymoon', 'hon(.*?)(oon)', 1); --> eym
select regexp_extract('honeymoon', 'hon(.*?)(oon)', 2); --> oon
2.6、hive实现Oracle中的REGEXP_SUBSTR
oracle:
SELECT REGEXP_SUBSTR('订单时间:2023-10-05 12:30', '\d{4}-\d{2}-\d{2}') FROM dual
首先需要清楚regexp_substr()的作用,先看官方解释REGEXP_SUBSTR通过允许您在字符串中搜索正则表达式模式来扩展功能的功能。它也与相似REGEXP_INSTR,但是它不返回子字符串的位置,而是返回子字符串本身。如果您需要匹配字符串的内容,而不是它在源字符串中的位置,则此功能很有用。该函数返回的字符串形式为VARCHAR2或,并且CLOB数据的字符集与相同source_char。
接下来对函数中的各个参数进行说明:
REGEXP_SUBSTR(source_char, pattern, position, occurrence, match_parameter)1、source_char:通常是用作正则处理的字符串2、pattern:[正则表达式](https://www.runoob.com/regexp/regexp-tutorial.html)3、position:正整数,指示source_char应该在哪里开始搜索的字符。默认值为1,表示从第一个字符开始搜索source_char。4、occurrence:获取第几个分割出来的组。默认值为1,表示Oracle搜索的第一个匹配项pattern。5、match_parameter:模式(‘i’不区分大小写进行检索;‘c’区分大小写进行检索。默认为’c’)针对的是正则表达式里字符大小写的匹配
再来看hive中regexp_extract()函数描述:
regexp_extract(str, regexp[, idx]) 参数解释:其中:
1、str是被解析的字符串2、regexp 是正则表达式2.1、idx是返回结果 取表达式的哪一部分 默认值为1。2.2、0表示把整个正则表达式对应的结果全部返回2.3、1表示返回正则表达式中第一个() 对应的结果 以此类推注意点:要注意的是idx的数字不能大于表达式中()的个数。否则报错。
通过对比oracle中的REGEXP_SUBSTR()函数不难看出,再对regexp_extract()的结果进行截取即可。
例如:
--oracle中的语句是:
select REGEXP_SUBSTR('cvdfer--gth--mn','[^--]+',1,2) from dual;--hive改写后:
select nvl(split('cvdfer--gth--mn','--')[1],'cvdfer--gth--mn');--提取第一个匹配的字符串
oracle中:select REGEXP_SUBSTR('cvdfer--gth--mn','[^--]+',1,1) from dual;
select regexp_extract('cvdfer--gth--mn','[^--]+',0);--oralce:
SELECT REGEXP_SUBSTR('订单时间:2023-10-05 12:30', '\d{4}-\d{2}-\d{2}') FROM dual--hive改写后:
SELECT split((split('订单时间:2023-10-05 12:30',':')[1]),' ')[0];
select regexp_extract('订单时间:2023-10-05 12:30','\\d{4}-\\d{2}-\\d{2}',0);
三、完整代码示例
场景:清洗日志数据
-- 创建示例表
CREATE TABLE server_logs (log_id INT,log_message STRING
);-- 插入数据
INSERT INTO server_logs VALUES
(1, 'Error: Disk full on /dev/sda1 (IP: 192.168.1.10)'),
(2, 'User login: alice@example.com from 10.0.0.5'),
(3, 'WARN: Memory usage 90% (host: server-01)');-- 提取所有IP地址
SELECT log_id,REGEXP_EXTRACT(log_message, '(\\d+\\.\\d+\\.\\d+\\.\\d+)', 1) AS ip_address
FROM server_logs
WHERE log_message RLIKE '\\d+\\.\\d+\\.\\d+\\.\\d+';-- 结果:
-- log_id | ip_address
-- 1 | 192.168.1.10
-- 2 | 10.0.0.5
四、注意事项
-
转义字符:Hive 使用 Java 正则语法,需对反斜杠
\
双重转义(如\\d
匹配数字)。 -
性能:复杂正则可能影响查询效率,建议预处理数据。
-
模式贪婪性:默认贪婪匹配,使用
?
启用非贪婪模式(如.*?
)。 -
捕获组:使用
()
定义捕获组,通过索引引用(如$1
)。
五、常用正则模式
场景 | 正则表达式 |
---|---|
邮箱 | [A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\\.[A-Za-z]{2,4} |
IPv4 地址 | \\d+\\.\\d+\\.\\d+\\.\\d+ |
URL | https?://[^\\s]+ |
日期(YYYY-MM-DD) | \\d{4}-\\d{2}-\\d{2} |
六、工作中高频使用
1、数据清洗(脱敏、格式转换)
需求:隐藏用户手机号中间4位,并提取邮箱用户名。
-- 示例数据:user_info表字段 user_contact = '13812345678,alice@example.com'
SELECT REGEXP_REPLACE(regexp_extract('13812345678,alice@example.com', '^\\d+', 0), '(\\d{3})\\d{4}(\\d{4})', '$1****$2') AS phone_mask, -- 脱敏手机号REGEXP_EXTRACT('13812345678,alice@example.com', '([A-Za-z0-9._%+-]+)@', 1) AS email_user -- 提取邮箱用户名-- 结果:
-- phone_mask | email_user
-- 138****5678 | alice
2、日志解析(提取关键信息)
需求:从服务器日志中提取IP、时间戳和错误级别。
-- 示例日志:'2023-10-05 14:30:22 [ERROR] Failed to connect from 192.168.1.105'
SELECT REGEXP_EXTRACT(log_line, '(\\d{4}-\\d{2}-\\d{2} \\d{2}:\\d{2}:\\d{2})', 1) AS log_time,REGEXP_EXTRACT(log_line, '\\[(WARN|ERROR|INFO)\\]', 1) AS log_level,REGEXP_EXTRACT(log_line, '(\\d+\\.\\d+\\.\\d+\\.\\d+)', 1) AS client_ip
FROM server_logs
WHERE log_line RLIKE '\\[(WARN|ERROR|INFO)\\]'; -- 过滤包含日志级别的行
3、URL参数解析(电商/广告分析)
需求:从URL中提取商品ID或广告渠道参数。
-- 示例URL:'https://shop.com/product?id=12345&source=wechat'
with user_clicks as (
select 'https://shop.com/product?id=12345&source=wechat' url
)
SELECT REGEXP_EXTRACT(url, 'id=(\\d+)', 1) AS product_id, -- 提取id参数REGEXP_EXTRACT(url, 'source=([a-zA-Z]+)', 1) AS ad_source -- 提取source参数
FROM user_clicks;
4、电话号码格式校验(金融/电信)
需求:校验手机号是否为合法中国11位号码。
-- 匹配规则:以13/14/15/17/18/19开头的11位数字
with customer_contacts as (
select '13812345678' phone_number
union all
select '123456' phone_number
)
SELECT phone_number,CASE WHEN phone_number RLIKE '^1[3-9]\\d{9}$' THEN 'Valid' ELSE 'Invalid' END AS check_result
FROM customer_contacts;
七、Hive正则核心函数强化
1、REGEXP_EXTRACT
动态提取
-- 提取JSON字符串中的指定字段(非标准JSON场景)
-- 示例数据:'{"order_id": "A1001", "amount": 299.5}'
with order_logs as (
select '{"order_id": "A1001", "amount": 299.5}' json_str
)
SELECT REGEXP_EXTRACT(json_str, '"order_id":\\s*"([^"]+)"', 1) AS order_id, -- 提取A1001REGEXP_EXTRACT(json_str, '"amount":\\s*(\\d+\\.?\\d*)', 1) AS amount -- 提取299.5
FROM order_logs;
2、REGEXP_REPLACE
复杂替换
-- 清理文本中的乱码(如替换非数字、字母、中文以外的字符)
with unstructured_data as (
select '用户#@!名:张三_2023' raw_text
)
SELECT REGEXP_REPLACE(raw_text, '[^\\u4e00-\\u9fa5a-zA-Z0-9]', '') AS cleaned_text
FROM unstructured_data;-- 输入:'用户#@!名:张三_2023' → 输出: '用户名张三2023'
3、RLIKE
多条件过滤
-- 筛选包含“支付成功”或“订单完成”的日志(金融风控)
SELECT *
FROM transaction_logs
WHERE log_message RLIKE '支付成功|订单完成';
参考文章
(06)Hive——正则表达式_hive正则表达式-CSDN博客
相关文章:
Hive之正则表达式
Hive版本:hive-3.1.2 目录 一、Hive的正则表达式概述 1.1 字符集合 1.2 边界集合 1.3 量词(重复次数)集合 1.4 转义操作符 1.5 运算符优先级 二、Hive 正则表达式案例 2.1 like 2.2 rlike 2.3 regexp 2.4 regexp_replace正…...
【软路由】ImmortalWrt 编译指南:从入门到精通
对于喜欢折腾路由器,追求极致性能和定制化的玩家来说,OpenWrt 无疑是一个理想的选择。而在众多 OpenWrt 衍生版本中,ImmortalWrt 以其更活跃的社区、更激进的特性更新和对新硬件的支持而备受关注。 本文将带你深入了解 ImmortalWrt࿰…...
蓝桥杯备考:从记忆化搜索到动态规划
首先我们先来复习一下我们之前学的用记忆化搜索优化的求斐波那契数列 #include <iostream> #include <cstring> using namespace std; const int N 35; int f[N]; int dfs(int n) {if(f[n]!-1) return f[n];if(n1||n0) return f[n]n;return f[n] dfs(n-1)dfs(n-2…...
React底层原理详解
React中Element&Fiber对象、WorkInProgress双缓存、Reconcile&Render&Commit、第一次挂载过程详解 在面试中介绍React底层原理时,需遵循逻辑清晰、层次分明、重点突出的原则,结合技术深度与实际应用场景。以下是结构化回答模板:…...
[含文档+PPT+源码等]精品基于Python实现的vue3+Django计算机课程资源平台
基于Python实现的Vue3Django计算机课程资源平台的背景,可以从以下几个方面进行阐述: 一、教育行业发展背景 1. 教育资源数字化趋势 随着信息技术的快速发展,教育资源的数字化已成为不可逆转的趋势。计算机课程资源作为教育领域的重要组成部…...
通过 PromptTemplate 生成干净的 SQL 查询语句并执行SQL查询语句
问题描述 在使用 LangChain 和 Llama 模型生成 SQL 查询时,遇到了 sqlite3.OperationalError 错误。错误信息如下: OperationalError: (sqlite3.OperationalError) near "sql SELECT Name FROM MediaType LIMIT 5; ": syntax error [SQL: …...
Mercury、LLaDA 扩散大语言模型
LLaDA 参考: https://github.com/ML-GSAI/LLaDA https://ml-gsai.github.io/LLaDA-demo/ 在线demo: https://huggingface.co/spaces/multimodalart/LLaDA Mercury 在线demo: https://chat.inceptionlabs.ai/ 速度很快生成...
常用的AI文本大语言模型汇总
AI文本【大语言模型】 1、文心一言https://yiyan.baidu.com/ 2、海螺问问https://hailuoai.com/ 3、通义千问https://tongyi.aliyun.com/qianwen/ 4、KimiChat https://kimi.moonshot.cn/ 5、ChatGPThttps://chatgpt.com/ 6、魔塔GPT https://www.modelscope.cn/studios/iic…...
Starrocks入门(二)
1、背景:考虑到Starrocks入门这篇文章,安装的是3.0.1版本的SR,参考:Starrocks入门-CSDN博客 但是官网的文档,没有对应3.0.x版本的资料,却有3.2或者3.3或者3.4或者3.1或者2.5版本的资料,不要用较…...
记录一次跨库连表的坑
一、背景 1. 业务背景 一个微服务项目,本次业务主要涉及两个板块,分别是 文章管理 和 系统管理。具有开发环境、测试环境、生产环境三个环境。其中,开发环境和测试环境用的是同一个服务器(nacos和MySQL都是用的同一个服务器中的…...
各种传参形式
一、QueryString 前端请求:http://localhost:8080/test/user/find?id26&namezhangsan 后端接收: 1.参数接收: RequestMapping("/find") public void find(String id,String name){... }2.对象接收: RequestMa…...
基于DeepSeek 的图生文最新算法 VLM-R1
目录 一、算法介绍 二 算法部署 三 模型下载 四 算法测试 五 可视化脚本 一、算法介绍 VLM-R1:稳定且可通用的 R1 风格大型视觉语言模型 自从 Deepseek-R1 推出以来,出现了许多专注于复制和改进它的作品。在这个项目中,我们提出了 VLM-R1,一种稳定且可通用的 R1 风格…...
⭐算法OJ⭐字符串与数组【动态规划 DP】(C++实现)最长公共子序列 LCS + 最短公共超序列 SCS
动态规划(Dynamic Programming, DP)在字符串数组相关的算法题中应用广泛,尤其是在解决子序列、子串、编辑距离、匹配等问题时。动态规划的核心思想是将问题分解为子问题,并通过存储子问题的解来避免重复计算,从而提高效…...
Ubuntu 下查看进程 PID 和终止进程方法
查看进程 PID 使用 ps 命令: ps aux | grep <process_name>例如,查看名为 python 的进程: ps aux | grep python使用 pgrep 命令: pgrep <process_name>例如,查看名为 python 的进程: pgrep python使用 top 命令: top…...
【无标题】Ubuntu22.04编译视觉十四讲slambook2 ch4时fmt库的报错
Ubuntu22.04编译视觉十四讲slambook2 ch4时fmt库的报错 cmake ..顺利,make后出现如下报错: in function std::make_unsigned<int>::type fmt::v8::detail::to_unsigned<int>(int): trajectoryError.cpp:(.text._ZN3fmt2v86detail11to_unsi…...
LangPrompt提示词
LangPrompt提示词 https://github.com/langgptai/LangGPT 学习LangGPT的仓库,帮我创建 一个专门生成LangGPT格式prompt的助手 根据LangGPT的格式规范设计的专业提示词生成助手框架。以下是分步骤的解决方案: 助手角色定义模板 # Role: LangGPT提示词架…...
Redis---缓存穿透,雪崩,击穿
文章目录 缓存穿透什么是缓存穿透?缓存穿透情况的处理流程是怎样的?缓存穿透的解决办法缓存无效 key布隆过滤器 缓存雪崩什么是缓存雪崩?缓存雪崩的解决办法 缓存击穿什么是缓存击穿?缓存击穿的解决办法 区别对比 在如今的开发中&…...
MySQL中的共享锁和排他锁
MySQL 中的锁可以从多个维度进行分类,其中从模式上可以分为共享锁(Shared Lock,S Lock)和 排他锁(Exclusive Lock,X Lock)。 共享锁(Shared Lock,S Lock) 共…...
Ubuntu 创建新用户及设置权限
1、新建用户 sudo adduser username 其中username是你要创建的用户的用户名,然后设置密码和相关信息就可以了 2、给新用户sudo权限 新创建的用户没有root权限,我们执行以下命令给用户sudo权限 sudo usermod -a -G adm username sudo usermod -a -G s…...
新建菜单项的创建之CmpGetValueListFromCache函数分析
第一部分: PCELL_DATA CmpGetValueListFromCache( IN PHHIVE Hive, IN PCACHED_CHILD_LIST ChildList, OUT BOOLEAN *IndexCached, OUT PHCELL_INDEX ValueListToRelease ) 0: kd> dv KeyControlBlock 0xe1…...
《论软件测试中缺陷管理及其应用》审题技巧 - 系统架构设计师
论软件测试中缺陷管理及其应用写作框架 一、考点概述 本论题“论软件测试中缺陷管理及其应用”主要考查的是软件测试领域中的缺陷管理相关知识与实践应用。论题涵盖了以下几个核心内容: 首先,需要理解软件缺陷的基本概念,即软件中存在的破坏正常运行能力的问题、错误或隐…...
530 Login fail. A secure connection is requiered(such as ssl)-java发送QQ邮箱(简单配置)
由于cs的csdN许多文章关于这方面的都是vip文章,而本文是免费的,希望广大网友觉得有帮助的可以多点赞和关注! QQ邮箱授权码到这里去开启 授权码是16位的字母,填入下面的mail.setting里面的pass里面 # 邮件服务器的SMTP地址 host…...
迷你世界脚本生物接口:Creature
生物接口:Creature 彼得兔 更新时间: 2024-05-22 17:51:22 继承自 Actor 具体函数名及描述如下: 序号 函数名 函数描述 1 getAttr(...) 生物属性获取 2 setAttr(...) 生物属性设置 3 isAdult(...) 判断该生物是否成年 4 setOxygenNeed(…...
Python请求微店商品详情数据API接口
微店提供了开放平台供开发者接入获取相关数据,以下为你介绍使用Python请求微店商品详情数据API接口的一般步骤: 2. 确定API接口地址与请求参数 在 Python 中,使用 requests 库可以很方便地发送 HTTP 请求并获取响应数据。假设你需要请求 Al…...
【每日八股】MySQL篇(三):索引(上)
目录 MySQL 为什么使用 B 树来做索引,它的优势是什么?特性和定义B 树和 B 树的对比拓展:既然 B 树相较于 B 树优势如此之大,为什么 nosql 的 MongoDB 底层仍采用 B 树而不是 B 树? 使用 B 树做索引的优势补充ÿ…...
python实战项目59:使用python获取腾讯招聘数据并保存到mysql数据库中
python实战项目59:使用python获取腾讯招聘数据并保存到mysql数据库中 一、爬虫流程分析1、分析数据接口,发送请求二、创建数据库链接三、完整代码一、爬虫流程分析 1、分析数据接口,发送请求 目标网址为 https://careers.tencent.com/search.html?keyword=python&que…...
VMware Ubuntu 共享目录
在VMware中挂载Ubuntu共享目录需要以下步骤,分为设置共享文件夹和在Ubuntu中挂载两部分: 一、VMware 设置共享文件夹 关闭Ubuntu虚拟机 在配置前,建议先关闭虚拟机(若已运行需关闭,部分VMware版本支持热添加࿰…...
详细介绍一下springboot自定义注解的使用方法
在Spring Boot中,自定义注解通常结合AOP(面向切面编程)实现特定功能,如日志记录、权限校验等。以下是详细的使用步骤和示例: 1. 添加依赖 确保项目中包含Spring AOP依赖(Spring Boot Starter AOPÿ…...
‘nvcc‘ 不是内部或外部命令,也不是可运行的程序 或批处理文件。
‘nvcc’ 不是内部或外部命令,也不是可运行的程序 或批处理文件。默认情况一般都会提示这个,这是因为你还没有安装cuda驱动程序。 一、查看本机支持的cuda版本 nvidia-smi可以看到我们这里显示的CUDA版本是11.6,在我们安装的CUDA驱动的时候,版本不能超过11.6。 二、下载CU…...
计算机毕业设计SpringBoot+Vue.js教学辅助平台(源码+文档+PPT+讲解)
温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 作者简介:Java领…...
大语言模型学习
大语言模型发展历程 当前国内外主流LLM模型 一、国外主流LLM LLaMA2 Meta推出的开源模型,参数规模涵盖70亿至700亿,支持代码生成和多领域任务适配57。衍生版本包括Code Llama(代码生成优化)和Llama Chat(对…...
几道考研数学题求解
函数性质问题 【题目】 已知函数 f ( x , y ) x 3 y 3 − ( x y ) 2 3 f(x, y) x^3 y^3 - (xy)^2 3 f(x,y)x3y3−(xy)23。设 T T T 为曲面 z f ( x , y ) z f(x, y) zf(x,y) 在点 ( 1 , 1 , 1 ) (1,1,1) (1,1,1) 处的切平面, D D D 为 T T T 与坐标…...
家用可燃气体探测器——家庭燃气安全的坚实防线
随着社会的发展和变迁,天然气为我们的生活带来了诸多便利,无论是烹饪美食,还是温暖取暖,都离不开它的支持。然而,燃气安全隐患如影随形,一旦发生泄漏,可能引发爆炸、火灾等严重事故,…...
c# 收发邮件
话不多说,请看代码:(后面附上项目整体代码,可详细查看。)。 算了,vip文章要评审,还是在这里给朋友们注释一下代码内容吧,方便大家参考使用。 收邮件: 核心代码&#x…...
springboot设置多环境配置文件
实际开发过程中会涉及多个环境,比如dev(开发环境),test(测试环境),prod(线上环境),不同环境下,端口号、数据库地址、redis地址等等会不尽相同,为了避免每次上线到不同环境都要修改配置文件可以在项目中配置…...
智能文档解析与语义分割:LlamaIndex 节点解析器模块全解
节点解析器模块 - LlamaIndex 文件内容的节点解析器 有几种基于文件的节点解析器,它们会根据解析的内容类型(JSON、Markdown 等)创建节点。 最简单的流程是将 FlatFileReader 与 SimpleFileNodeParser 结合使用,自动为每种内容类型选择最佳节点解析器。然后,可以将基于…...
Qt的坐标
一、介绍 控件的坐标是相对于父控件的,如果没有父控件,坐标就相当于桌面。 这是 Qt 坐标系: 二、坐标使用 坐标通过控件对象的 move 函数实现,move(int, int) 一个参数是 x,一个是 y,单位是像素。 代码…...
redis序列化设置
redis序列化设置 redis序列化设置序列化对象里有org.joda.time.DateTime1)、报错内容如下2)、解决方案:分别自定义时间的序列化和反序列化,以对象形式关联到redisTemplate redis序列化设置 redis序列化设置,通过自定义…...
Linux:进程概念
目录 1 冯诺依曼体系 2 操作系统(Operator System) 3 如何理解管理 3.1计算机管理硬件 3.2 管理逻辑图 3.3 怎样管理 4 什么是进程? 5 查看进程 5.1 ps ajx显示所有进程信息 5.2 /proc(内存文件系统) 5.2.1 ls /proc/PID 5.2.2 ls /proc/PID -al 5…...
web3.0简介
Web3.0(或简称 Web3)是近年来广泛讨论的一个新型互联网概念,其核心思想在于利用区块链及相关分布式技术,打造一个更加开放、去中心化、透明且以用户为主导的网络生态系统。这意味着在 Web3.0 时代,用户不再只是信息的消…...
前端控制器模式
前端控制器模式 引言 在软件设计模式中,前端控制器模式(Front Controller Pattern)是一种行为型设计模式。它提供了一种集中处理请求的机制,将请求分发到相应的处理者,从而简化了请求的处理流程。本文将详细介绍前端…...
【保姆级视频教程(二)】YOLOv12训练数据集构建:标签格式转换-划分-YAML 配置 避坑指南 | 小白也能轻松玩转目标检测!
【2025全站首发】YOLOv12训练数据集构建:标签格式转换-划分-YAML 配置 避坑指南 | 小白也能轻松玩转目标检测! 文章目录 1. 数据集准备1.1 标签格式转换1.2 数据集划分1.3 yaml配置文件创建 2. 训练验证 1. 数据集准备 示例数据集下载链接:P…...
SpringBoot接口自动化测试实战:从OpenAPI到压力测试全解析
引言:接口测试的必要性 在微服务架构盛行的今天,SpringBoot项目的接口质量直接影响着系统稳定性。本文将分享如何通过自动化工具链实现接口的功能验证与性能压测,使用OpenAPI规范打通测试全流程,让您的接口质量保障体系更加完备。…...
Spring学习笔记02——bean的概念和常见注解标注
什么是bean? Bean 就是 被 Spring 管理的对象,就像工厂流水线上生产的“标准产品”。这些对象不是你自己 new 出来的,而是由 Spring 容器(一个超级工厂)帮你创建、组装、管理。 由 Component、Service、Controller 等注解标记的…...
JAVA最新版本详细安装教程(附安装包)
目录 文章自述 一、JAVA下载 二、JAVA安装 1.首先在D盘创建【java/jdk-23】文件夹 2.把下载的压缩包移动到【jdk-23】文件夹内,右键点击【解压到当前文件夹】 3.如图解压会有【jdk-23.0.1】文件 4.右键桌面此电脑,点击【属性】 5.下滑滚动条&…...
Redis学习笔记系列(一)——Redis简介及安装
1. Redis介绍 Redis是完全开源的,遵守 BSD 协议,是一个高性能的 key-value 数据库。 Redis与其他key-value缓存产品有以下三个特点: Redis支持数据的持久化,可以将内存中的数据保存在磁盘中,重启的时候可以再次加载进行…...
【0005】Python变量详解
如果你觉得我的文章写的不错,请关注我哟,请点赞、评论,收藏此文章,谢谢! 本文内容体系结构如下: 任何一个语言编写的程序或者项目,都需要数据的支持,没有数据的项目不能称之为一个…...
实验:k8s+keepalived+nginx+iptables
1、创建两个nginx的pod,app都是nginx nginx1 nginx2 2、创建两个的pod的service 3、配置两台keepalived的调度器和nginx七层反向代理,VIP设置192.168.254.110 keepalived调度器master keepalived调度器backup 两台调度器都配置nginx七层反向代理&#…...
经典算法 统计数字问题(常数时间解决)
统计数字问题 一本书的页码从自然数1 开始顺序编码直到自然数n。书的页码按照通常的习惯编排,每个页码都不含多余的前导数字0。例如,第6 页用数字6 表示,而不是06 或006 等。数字计数问题要求对给定书的总页码n,计算出书的全部页…...
ViewPager2跟ViewPager的区别
1都是用来实现页面切换的,ViewPager2是ViewPager的增强版和升级版,ViewPager2是基于RecyclerView实现,可以支持横向和竖向页面切换,只需在布局文件添加一个android:orientation"vertical"即可,ViewPager只支…...