【Python Cookbook】字符串和文本(五):递归下降分析器
目录 | | 目录 | |
---|---|---|---|
字符串和文本(一) | 1.使用多个界定符分割字符串 2.字符串开头或结尾匹配 3.用 Shell 通配符匹配字符串 4.字符串匹配和搜索 5.字符串搜索和替换 | 字符串和文本(三) | 11.删除字符串中不需要的字符 12.审查清理文本字符串 13.字符串对齐 14.合并拼接字符串 15.字符串中插入变量 |
字符串和文本(二) | 6.字符串忽略大小写的搜索替换 7.最短匹配模式 8.多行匹配模式 9.将 Unicode 文本标准化 10.在正则式中使用 Unicode | 字符串和文本(四) 字符串和文本(五) | (四)16.以指定列宽格式化字符串 (四)17.在字符串中处理 html 和 xml (四)18.字符串令牌解析 (四)19.字节字符串上的字符串操作 (五)20.实现一个简单的递归下降分析器 |
字符串和文本(五)
- 20.实现一个简单的递归下降分析器
- 20.1 BNF(基础形式)
- 20.2 EBNF(扩展形式)
- 20.3 案例
- 20.4 关键 self 操作解析
- self.tokens 和 self.tok / self.nexttok
- self._advance():移动到下一个 token
- self._accept(toktype):尝试匹配并消费 token
- self._expect(toktype):强制匹配 token
- self.expr() / self.term() / self.factor():递归解析
- 状态流转示例
- 总结
20.实现一个简单的递归下降分析器
开始本文的学习前,我们需要首先了解一下什么是 BNF 和 EBNF。
🚀
BNF
(Backus-Naur Form
,巴科斯-诺尔范式)和EBNF
(Extended Backus-Naur Form
,扩展巴科斯-诺尔范式)是用于描述编程语言或其他形式语言语法的元语言(描述语言的语言)。它们是编译器设计、文档规范和协议定义中的基础工具。
20.1 BNF(基础形式)
BNF 最初由 John Backus 和 Peter Naur 在 1950-60 年代提出,用于描述 ALGOL 60 语言的语法。
核心组成:
- 非终结符(Non-terminal):用
< >
括起,表示需要进一步展开的语法单元。- 例如:
<expression>
、<statement>
- 例如:
- 终结符(Terminal):语言中的实际符号(如关键字、运算符等)。
- 例如:
"if"
、"+"
、"123"
- 例如:
- 产生式规则(Production rule):用
::=
表示定义。- 例如:
<digit> ::= "0" | "1" | ... | "9"
- 例如:
示例(简单算术表达式):
<expression> ::= <term> "+" <expression> | <term>
<term> ::= <factor> "*" <term> | <factor>
<factor> ::= "(" <expression> ")" | <number>
<number> ::= <digit> | <number> <digit>
<digit> ::= "0" | "1" | ... | "9"
20.2 EBNF(扩展形式)
EBNF 在 BNF 基础上添加了更简洁的表达方式,被现代语言规范(如 Python、SQL 标准)广泛使用。
扩展符号:
- 可选项:用
[ ]
表示。- 例如:
"if" <condition> "then" [ "else" <statement> ]
- 例如:
- 重复项:用
{ }
表示(0 次或多次)。- 例如:
<number> ::= <digit> { <digit> }
- 例如:
- 分组:用
( )
明确优先级。- 例如:
("+" | "-") <expression>
- 例如:
- 终结符通常不再加引号(依规范而定)。
示例(同上的算术表达式,用 EBNF):
expression = term { "+" term } ;
term = factor { "*" factor } ;
factor = "(" expression ")" | number ;
number = digit { digit } ;
digit = "0" | "1" | ... | "9" ;
关键区别
特性 | BNF | EBNF |
---|---|---|
重复 | 需递归定义(如 <number> ::= <digit> | <number> <digit> ) | 直接用 { } (如 number = digit { digit } ) |
可选 | 需额外规则 | 用 [ ] 表示 |
可读性 | 较低(规则更冗长) | 更高(接近正则表达式风格) |
20.3 案例
你想根据一组语法规则解析文本并执行命令,或者构造一个代表输入的抽象语法树。如果语法非常简单,你可以不去使用一些框架,而是自己写这个解析器。
在这个问题中,我们集中讨论根据特殊语法去解析文本的问题。为了这样做,你首先要以 BNF 或者 EBNF 形式指定一个标准语法。比如,一个简单数学表达式语法可能像下面这样:
expr ::= expr + term| expr - term| termterm ::= term * factor| term / factor| factorfactor ::= ( expr )| NUM
或者,以 EBNF 形式:
expr ::= term { (+|-) term }*term ::= factor { (*|/) factor }*factor ::= ( expr )| NUM
在 EBNF 中,被包含在 {...}*
中的规则是可选的。*
代表 0 次或多次重复(跟正则表达式中意义是一样的)。
现在,如果你对 BNF 的工作机制还不是很明白的话,就把它当做是一组左右符号可相互替换的规则。一般来讲,解析的原理就是你利用 BNF 完成多个替换和扩展以匹配输入文本和语法规则。为了演示,假设你正在解析形如 3 + 4 * 5
的表达式。这个表达式先要分解为一组令牌流,结果可能是像下列这样的令牌序列:
NUM + NUM * NUM
在此基础上, 解析动作会试着去通过替换操作匹配语法到输入令牌:
expr
expr ::= term { (+|-) term }*
expr ::= factor { (*|/) factor }* { (+|-) term }*
expr ::= NUM { (*|/) factor }* { (+|-) term }*
expr ::= NUM { (+|-) term }*
expr ::= NUM + term { (+|-) term }*
expr ::= NUM + factor { (*|/) factor }* { (+|-) term }*
expr ::= NUM + NUM { (*|/) factor}* { (+|-) term }*
expr ::= NUM + NUM * factor { (*|/) factor }* { (+|-) term }*
expr ::= NUM + NUM * NUM { (*|/) factor }* { (+|-) term }*
expr ::= NUM + NUM * NUM { (+|-) term }*
expr ::= NUM + NUM * NUM
下面所有的解析步骤可能需要花点时间弄明白,但是它们原理都是查找输入并试着去匹配语法规则。第一个输入令牌是 NUM,因此替换首先会匹配那个部分。一旦匹配成功,就会进入下一个令牌 +
,以此类推。当已经确定不能匹配下一个令牌的时候,右边的部分(比如 { (*/) factor }*
)就会被清理掉。在一个成功的解析中,整个右边部分会完全展开来匹配输入令牌流。
有了前面的知识背景,下面我们举一个简单示例来展示如何构建一个递归下降表达式求值程序:
#!/usr/bin/env python
# -*- encoding: utf-8 -*-
"""
Topic: 下降解析器
Desc :
"""
import re
import collections# Token specification
NUM = r'(?P<NUM>\d+)' # 匹配数字
PLUS = r'(?P<PLUS>\+)' # 匹配加号
MINUS = r'(?P<MINUS>-)' # 匹配减号
TIMES = r'(?P<TIMES>\*)' # 匹配乘号
DIVIDE = r'(?P<DIVIDE>/)' # 匹配除号
LPAREN = r'(?P<LPAREN>\()' # 匹配左括号
RPAREN = r'(?P<RPAREN>\))' # 匹配右括号
WS = r'(?P<WS>\s+)' # 匹配空白字符# 使用 (?P<NAME>...) 命名捕获组,方便后续识别 token 类型
master_pat = re.compile('|'.join([NUM, PLUS, MINUS, TIMES,DIVIDE, LPAREN, RPAREN, WS]))
# Tokenizer
Token = collections.namedtuple('Token', ['type', 'value'])# 将输入字符串 text 拆分为一系列 Token(包含类型和值)
def generate_tokens(text):scanner = master_pat.scanner(text)for m in iter(scanner.match, None):tok = Token(m.lastgroup, m.group())if tok.type != 'WS':yield tok# Parser
class ExpressionEvaluator:'''Implementation of a recursive descent parser. Each method implements a single grammar rule. Use the ._accept() method to test and accept the current lookahead token. Use the ._expect() method to exactly match and discard the next token on on the input(or raise a SyntaxError if it doesn't match).'''def parse(self, text):self.tokens = generate_tokens(text) # 生成 token 流self.tok = None # 记录当前已消费的 token(即最近处理过的 token)self.nexttok = None # 保存下一个待处理的 token(即“预读”的 token,用于语法分析中的“向前看”)self._advance() # 移动到下一个 tokenreturn self.expr() # 从最高优先级规则开始解析 # 移动到下一个 tokendef _advance(self):self.tok, self.nexttok = self.nexttok, next(self.tokens, None)# 如果下一个 token 匹配 toktype 则消费它def _accept(self, toktype):if self.nexttok and self.nexttok.type == toktype:self._advance()return Trueelse:return False# 必须匹配 toktype,否则报错(用于强制语法规则)def _expect(self, toktype):if not self._accept(toktype):raise SyntaxError('Expected ' + toktype)# 处理加减法# expression ::= term { ('+'|'-') term }*def expr(self):exprval = self.term() # 先解析更高优先级的 termwhile self._accept('PLUS') or self._accept('MINUS'):op = self.tok.typeright = self.term() # 解析右侧 termif op == 'PLUS':exprval += rightelif op == 'MINUS':exprval -= rightreturn exprval# 处理乘除法# term ::= factor { ('*'|'/') factor }*def term(self):termval = self.factor() # 先解析更高优先级的 factorwhile self._accept('TIMES') or self._accept('DIVIDE'):op = self.tok.typeright = self.factor() # 解析右侧 factorif op == 'TIMES':termval *= rightelif op == 'DIVIDE':termval /= rightreturn termval# 处理数字和括号# factor ::= NUM | ( expr )def factor(self):if self._accept('NUM'):return int(self.tok.value) # 返回数字值elif self._accept('LPAREN'):exprval = self.expr() # 递归解析括号内表达式self._expect('RPAREN') # 必须匹配右括号return exprvalelse:raise SyntaxError('Expected NUMBER or LPAREN')def descent_parser():e = ExpressionEvaluator()print(e.parse('2'))print(e.parse('2 + 3'))print(e.parse('2 + 3 * 4'))print(e.parse('2 + (3 + 4) * 5'))# print(e.parse('2 + (3 + * 4)'))# Traceback (most recent call last):# File "<stdin>", line 1, in <module># File "exprparse.py", line 40, in parse# return self.expr()# File "exprparse.py", line 67, in expr# right = self.term()# File "exprparse.py", line 77, in term# termval = self.factor()# File "exprparse.py", line 93, in factor# exprval = self.expr()# File "exprparse.py", line 67, in expr# right = self.term()# File "exprparse.py", line 77, in term# termval = self.factor()# File "exprparse.py", line 97, in factor# raise SyntaxError("Expected NUMBER or LPAREN")# SyntaxError: Expected NUMBER or LPARENif __name__ == '__main__':descent_parser()
以输入 "2 + (3 + 4) * 5"
为例:
- 词法分析生成 tokens:
[NUM(2), PLUS(+), LPAREN((), NUM(3), PLUS(+), NUM(4), RPAREN()), TIMES(*), NUM(5)]
- 语法分析过程:
expr()
调用term()
→factor()
→ 返回2
- 遇到
+
,解析右侧term()
:- 遇到
(
,进入新的expr()
计算3 + 4 = 7
- 遇到
*
,计算7 * 5 = 35
- 遇到
- 最终结果:
2 + 35 = 37
文本解析是一个很大的主题, 一般会占用学生学习编译课程时刚开始的三周时间。如果你在找寻关于语法,解析算法等相关的背景知识的话,你应该去看一下编译器书籍。很显然,关于这方面的内容太多,不可能在这里全部展开。
尽管如此,编写一个递归下降解析器的整体思路是比较简单的。开始的时候,你先获得所有的语法规则,然后将其转换为一个函数或者方法。因此如果你的语法类似这样:
expr ::= term { ('+'|'-') term }*term ::= factor { ('*'|'/') factor }*factor ::= '(' expr ')'| NUM
你应该首先将它们转换成一组像下面这样的方法:
class ExpressionEvaluator:...def expr(self):...def term(self):...def factor(self):...
每个方法要完成的任务很简单 - 它必须从左至右遍历语法规则的每一部分,处理每个令牌。从某种意义上讲,方法的目的就是要么处理完语法规则,要么产生一个语法错误。为了这样做,需采用下面的这些实现方法:
- 如果规则中的下个符号是另外一个语法规则的名字(比如
term
或factor
),就简单的调用同名的方法即可。这就是该算法中 下降 的由来 - 控制下降到另一个语法规则中去。有时候规则会调用已经执行的方法(比如,在factor ::= '('expr ')'
中对expr的调用)。这就是算法中 递归 的由来。 - 如果规则中下一个符号是个特殊符号(比如
()
,你得查找下一个令牌并确认是一个精确匹配)。如果不匹配,就产生一个语法错误。这一节中的_expect()
方法就是用来做这一步的。 - 如果规则中下一个符号为一些可能的选择项(比如
+
或-
),你必须对每一种可能情况检查下一个令牌,只有当它匹配一个的时候才能继续。这也是本节示例中_accept()
方法的目的。它相当于_expect()
方法的弱化版本,因为如果一个匹配找到了它会继续,但是如果没找到,它不会产生错误而是回滚(允许后续的检查继续进行)。 - 对于有重复部分的规则(比如在规则表达式
::= term { ('+'|'-') term }*
中),重复动作通过一个while
循环来实现。循环主体会收集或处理所有的重复元素直到没有其他元素可以找到。 - 一旦整个语法规则处理完成,每个方法会返回某种结果给调用者。这就是在解析过程中值是怎样累加的原理。比如,在表达式求值程序中,返回值代表表达式解析后的部分结果。最后所有值会在最顶层的语法规则方法中合并起来。
尽管向你演示的是一个简单的例子,递归下降解析器可以用来实现非常复杂的解析。比如,Python 语言本身就是通过一个递归下降解析器去解释的。如果你对此感兴趣,你可以通过查看 Python 源码文件 Grammar/Grammar 来研究下底层语法机制。看完你会发现,通过手动方式去实现一个解析器其实会有很多的局限和不足之处。
其中一个局限就是它们不能被用于包含任何左递归的语法规则中。比如,假如你需要翻译下面这样一个规则:
items ::= items ',' item| item
- 逻辑矛盾:直接按照该规则实现会导致无限递归。
- 正确理解:该规则的实际含义是 “一个或多个由逗号分隔的
item
”,应该用 循环 而非递归实现。
为了这样做,你可能会像下面这样使用 items()
方法:
def items(self):itemsval = self.items()if itemsval and self._accept(','):itemsval.append(self.item())else:itemsval = [ self.item() ]
唯一的问题是这个方法根本不能工作,事实上,它会产生一个无限递归错误。
- 原因:
items()
方法内部直接调用了self.items()
,导致无限递归,最终触发RecursionError
。 - 修复:应该先尝试解析第一个
item
,再判断是否有后续的',' item
。修正后的逻辑:def items(self):itemsval = [self.item()] # 先解析第一个 itemwhile self._accept(','): # 如果遇到逗号,继续解析后续 itemitemsval.append(self.item())return itemsval
- 避免递归:原始 BNF 是左递归的(
items
在产生式开头调用自身),而递归下降解析器无法处理左递归。
假设输入是 "A, B, C"
:
- 错误版本:会无限递归,直到崩溃。
- 修正版本:
- 第一次调用:解析
"A"
→itemsval = ["A"]
- 遇到
","
,解析"B"
→itemsval = ["A", "B"]
- 遇到
","
,解析"C"
→itemsval = ["A", "B", "C"]
- 返回最终结果
["A", "B", "C"]
- 第一次调用:解析
关于语法规则本身你可能也会碰到一些棘手的问题。比如,你可能想知道下面这个简单扼语法是否表述得当:
expr ::= factor { ('+'|'-'|'*'|'/') factor }*factor ::= '(' expression ')'| NUM
这个语法看上去没啥问题,但是它却不能察觉到标准四则运算中的运算符优先级。比如,表达式 "3 + 4 * 5"
会得到 35 而不是期望的 23。分开使用 expr
和 term
规则可以让它正确的工作。
对于复杂的语法,你最好是选择某个解析工具比如 PyParsing 或者是 PLY。下面是使用 PLY 来重写表达式求值程序的代码:
from ply.lex import lex
from ply.yacc import yacc# Token list
tokens = [ 'NUM', 'PLUS', 'MINUS', 'TIMES', 'DIVIDE', 'LPAREN', 'RPAREN' ]
# Ignored characters
t_ignore = ' \t\n'
# Token specifications (as regexs)
t_PLUS = r'\+'
t_MINUS = r'-'
t_TIMES = r'\*'
t_DIVIDE = r'/'
t_LPAREN = r'\('
t_RPAREN = r'\)'# Token processing functions
def t_NUM(t):r'\d+'t.value = int(t.value)return t# Error handler
def t_error(t):print('Bad character: {!r}'.format(t.value[0]))t.skip(1)# Build the lexer
lexer = lex()# Grammar rules and handler functions
def p_expr(p):'''expr : expr PLUS term| expr MINUS term'''if p[2] == '+':p[0] = p[1] + p[3]elif p[2] == '-':p[0] = p[1] - p[3]def p_expr_term(p):'''expr : term'''p[0] = p[1]def p_term(p):'''term : term TIMES factor| term DIVIDE factor'''if p[2] == '*':p[0] = p[1] * p[3]elif p[2] == '/':p[0] = p[1] / p[3]def p_term_factor(p):'''term : factor'''p[0] = p[1]def p_factor(p):'''factor : NUM'''p[0] = p[1]def p_factor_group(p):'''factor : LPAREN expr RPAREN'''p[0] = p[2]def p_error(p):print('Syntax error')parser = yacc()
这个程序中,所有代码都位于一个比较高的层次。你只需要为令牌写正则表达式和规则匹配时的高阶处理函数即可。而实际的运行解析器,接受令牌等等底层动作已经被库函数实现了。
下面是一个怎样使用得到的解析对象的例子:
>>> parser.parse('2')
2
>>> parser.parse('2+3')
5
>>> parser.parse('2+(3+4)*5')
37
>>>
如果你想在你的编程过程中来点挑战和刺激,编写解析器和编译器是个不错的选择。再次,一本编译器的书籍会包含很多底层的理论知识。不过很多好的资源也可以在网上找到。Python 自己的 ast
模块也值得去看一下。
20.4 关键 self 操作解析
在 Python 类中,self
是一个指向 当前对象实例 的引用,用于访问实例的属性和方法。在上述代码中,self
的用法涉及 词法分析器(Lexer)和语法解析器(Parser)的状态管理。下面我会逐步拆解这些 self
操作的作用:
self.tokens 和 self.tok / self.nexttok
def parse(self, text):self.tokens = generate_tokens(text) # 存储 token 生成器self.tok = None # 当前消费的 tokenself.nexttok = None # 下一个待处理的 tokenself._advance() # 初始化:预加载第一个 token
self.tokens
: 保存从generate_tokens()
返回的 token 生成器(一个可迭代对象),用于逐个读取 token。self.tok
: 记录 当前已消费的 token(即最近处理过的 token)。self.nexttok
: 保存 下一个待处理的 token(即 “预读” 的 token,用于语法分析中的 “向前看”)。
self._advance():移动到下一个 token
def _advance(self):self.tok, self.nexttok = self.nexttok, next(self.tokens, None)
- 作用:
- 将
self.nexttok
的值赋给self.tok
(表示当前 token 已消费)。 - 通过
next(self.tokens, None)
读取生成器的 下一个 token,存入self.nexttok
。 - 如果 token 流结束,
next()
返回None
。
- 将
- 示例:假设 tokens 为
[NUM(2), PLUS(+), NUM(3)]
:- 第一次调用
_advance()
后:self.tok = None
,self.nexttok = NUM(2)
- 第二次调用后:
self.tok = NUM(2)
,self.nexttok = PLUS(+)
- 第三次调用后:
self.tok = PLUS(+)
,self.nexttok = NUM(3)
- 第一次调用
self._accept(toktype):尝试匹配并消费 token
def _accept(self, toktype):if self.nexttok and self.nexttok.type == toktype:self._advance() # 消费匹配的 tokenreturn Truereturn False
- 作用:
- 检查下一个 token (
self.nexttok
) 是否与toktype
匹配(如'PLUS'
)。 - 如果匹配,调用
_advance()
消费该 token,并返回True
。 - 否则返回
False
。
- 检查下一个 token (
- 示例:当前
self.nexttok = PLUS(+)
,调用_accept('PLUS')
会返回True
,并更新self.tok
和self.nexttok
。
self._expect(toktype):强制匹配 token
def _expect(self, toktype):if not self._accept(toktype):raise SyntaxError('Expected ' + toktype)
- 作用:
- 必须匹配
toktype
,否则抛出语法错误。 - 用于处理语法中的强制性规则(如右括号
)
必须闭合)。
- 必须匹配
- 示例:在
factor()
中解析括号表达式时:if self._accept('LPAREN'):exprval = self.expr() # 解析括号内的表达式self._expect('RPAREN') # 必须遇到右括号
self.expr() / self.term() / self.factor():递归解析
这些方法通过 self
访问和更新 token 状态,实现表达式的递归下降解析:
def expr(self):exprval = self.term() # 解析高优先级的 termwhile self._accept('PLUS') or self._accept('MINUS'):op = self.tok.type # 当前操作符(通过 self.tok 获取)right = self.term() # 解析右侧 termexprval += right if op == 'PLUS' else -rightreturn exprval
self.tok
:在_accept()
后存储 最近消费的 token(如操作符+
)。self.term()
:递归调用解析更高优先级的子表达式。
状态流转示例
以解析 "2 + 3"
为例:
-
初始化:
self.tokens
= 生成器生成[NUM(2), PLUS(+), NUM(3)]
self.tok = None
,self.nexttok = None
- 调用
_advance()
→self.tok = None
,self.nexttok = NUM(2)
-
解析
expr()
:- 调用
term()
→ 调用factor()
→_accept('NUM')
为True
:- 消费
NUM(2)
,返回2
- 现在
self.tok = NUM(2)
,self.nexttok = PLUS(+)
- 消费
- 遇到
while
循环,_accept('PLUS')
为True
:- 消费
PLUS(+)
,self.tok = PLUS(+)
,self.nexttok = NUM(3)
- 解析右侧
term()
→ 返回3
- 消费
- 计算
2 + 3
,返回5
- 调用
总结
self.tok
/self.nexttok
:跟踪 token 流的状态,实现 “预读” 和 “消费”。self._advance()
:推进 token 流,更新当前和下一个 token。self._accept()
/self._expect()
:控制语法规则的匹配和错误处理。- 递归方法:通过
self
共享状态,实现表达式的优先级和嵌套解析。
这种设计是 递归下降解析器 的典型实现,self
用于在方法间传递和维护解析状态。
相关文章:
【Python Cookbook】字符串和文本(五):递归下降分析器
目录 案例 目录 案例 字符串和文本(一)1.使用多个界定符分割字符串2.字符串开头或结尾匹配3.用 Shell 通配符匹配字符串4.字符串匹配和搜索5.字符串搜索和替换字符串和文本(三)11.删除字符串中不需要的字符12.审查清理文本字符串1…...
专为 零基础初学者 设计的最简前端学习路线,聚焦核心内容,避免过度扩展,帮你快速入门并建立信心!
第一阶段:HTML CSS(2-3周) 目标:能写出静态网页,理解盒子模型和布局。 HTML基础 常用标签:<div>, <p>, <img>, <a>, <ul>, <form> 语义化标签:<head…...
大模型-爬虫prompt
爬虫怎么写prompt 以下基于deepseek r1 总结: 以下是为大模型设计的结构化Prompt模板,用于生成专业级网络爬虫Python脚本。此Prompt包含技术约束、反检测策略和数据处理要求,可根据具体需求调整参数: 爬虫脚本生成Prompt模板1 …...
PyTorch深度实践:基于累积最大值的注意力机制设计与性能优化
引言:注意力机制的创新与挑战 在自然语言处理和序列建模中,注意力机制(Attention)是提升模型性能的关键技术。传统基于 softmax 的注意力机制虽然成熟,但在计算效率和长序列建模中存在局限。本文将介绍一种创新的注意…...
编程bug001:off by one (差一错误)
为什么看似简单的编码错误可能造成大灾难? Off-by-One Error(简称OBOE),即由于边界条件处理不当,导致循环、计数或索引时多算一次或少算一次的错误。这是非常常见的编程bug类型,尤其在处理数组、字符串或范…...
JavaScript 中常见的鼠标事件及应用
JavaScript 中常见的鼠标事件及应用 在 JavaScript 中,鼠标事件是用户与网页进行交互的重要方式,通过监听这些事件,开发者可以实现各种交互效果,如点击、悬停、拖动等。 在 JavaScript 中,鼠标事件类型多样࿰…...
使用Expo框架开发APP——详细教程
在移动应用开发日益普及的今天,跨平台开发工具越来越受到开发者青睐。Expo 是基于 React Native 的一整套工具和服务,它能够大幅降低原生开发的门槛,让开发者只需关注业务逻辑和界面实现,而不用纠结于复杂的原生配置。本文将从零开…...
深入探究 Hive 中的 MAP 类型:特点、创建与应用
摘要 在大数据处理领域,Hive 作为一个基于 Hadoop 的数据仓库基础设施,提供了方便的数据存储和分析功能。Hive 中的 MAP 类型是一种强大的数据类型,它允许用户以键值对的形式存储和操作数据。本文将深入探讨 Hive 中 MAP 类型的特点,详细介绍如何创建含有 MAP 类型字段的表…...
前端开发工厂模式的优缺点是什么?
一、什么是工厂模式? 工厂模式属于创建型设计模式,核心思想是将对象的实例化过程封装到特定方法或类中,让客户端不需要直接通过new关键字创建对象。 举个例子:就像奶茶店不需要顾客自己调配饮品,而是通过"点单-…...
框架PasteForm实际开发案例,换个口味显示数据,支持echarts,只需要标记几个特性即可在管理端显示(2)
PasteForm框架的主要思想就是对Dto进行标记特性,然后管理端的页面就会以不一样的UI呈现 使用PasteForm框架开发,让你免去开发管理端的烦恼,你只需要专注于业务端和用户端! 在管理端中,如果说表格是基本的显示方式,那么图表chart就是一个锦上添花的体现! 如果一个项目拥…...
QEMU学习之路(5)— 从0到1构建Linux系统镜像
QEMU学习之路(5)— 从0到1构建Linux系统镜像 一、前言 参考:从内核到可启动镜像:0到1构建你的极简Linux系统 二、linux源码获取 安装编译依赖 sudo apt install -y build-essential libncurses-dev flex bison libssl-dev li…...
AI Agent设计模式一:Chain
概念 :线性任务流设计 ✅ 优点:逻辑清晰易调试,适合线性处理流程❌ 缺点:缺乏动态分支能力 from typing import TypedDictfrom langgraph.graph import StateGraph, END# 定义后续用到的一些变量 class CustomState(TypedDict):p…...
实操(进程状态,R/S/D/T/t/X/Z)Linux
1 R 状态并不直接代表进程在运行,而是该进程在运行队列中进行排队,由操作系统在内存维护的队列 #include <stdio.h> #include <unistd.h>int main() {while(1){printf("我在运行吗\n");sleep(1);}return 0; }查看状态(…...
T-SQL语言的自动化运维
T-SQL语言的自动化运维 引言 在现代IT环境中,自动化运维成为了提高效率、降低成本、提升稳定性的重要手段。数据库作为系统的重要组成部分,运维工作往往需要耗费大量的人力物力。T-SQL(Transact-SQL)作为Microsoft SQL Server的…...
Day06 分割编译与中断处理
文章目录 1. 例程harib03c(c源文件分割并整理makefile文件)2. 例程harib03c(用于描述段的信息)3. 例程harib03d(初始化PIC)4. 例程harib03e(中断处理程序) 1. 例程harib03cÿ…...
数字化三维实训室:无穿戴动作捕捉技术如何赋能体育与舞蹈
在高校体育与舞蹈教学中,精准的动作训练至关重要。传统训练方式依赖教练的肉眼观察与手动记录,存在效率低下、误差较大的情况。尤其在快速连续动作或复杂肢体形态的捕捉中,人工判读易受主观经验限制,难以实现标准化评估。面对传统…...
6. RabbitMQ 死信队列的详细操作编写
6. RabbitMQ 死信队列的详细操作编写 文章目录 6. RabbitMQ 死信队列的详细操作编写1. 死信的概念2. 消息 TTL 过期(触发死信队列)3. 队列超过队列的最大长度(触发死信队列)4. 消息被拒(触发死信队列)5. 最后: 1. 死信的概念 先从概念上解释上搞清楚这个定义&#…...
AI浪潮下,新手短视频制作的破局之道
AI浪潮下,新手短视频制作的破局之道 引言:短视频新时代,AI 带来的机遇与挑战 在当下这个信息飞速流转的时代,短视频已然成为了人们生活中不可或缺的一部分。无论是在通勤路上、午休间隙,还是茶余饭后,打开…...
合肥SMT贴片制造工艺全解析
内容概要 作为电子制造领域的核心工艺,SMT(表面贴装技术)在合肥地区电子产业链中占据重要地位。本解析以合肥本地化生产场景为基础,系统梳理从焊膏印刷到成品检测的全流程工艺框架。具体而言,制造流程涵盖四大核心阶段…...
ctfshow VIP题目限免 协议头信息泄露
根据提示是协议头信息泄露,那就我们抓个包,抓包才能看到请求体响应体里的协议头啊,抓包之后在响应包里发现了 flag...
【国产工具链发展,生态链分析,TSMaster VS Zcanpro的技术对比】
黎明篇:国产汽车测试工具链的崛起、差距与未来 副标题: 从跟随到超越,中国技术如何重塑全球研发体系 一、国产工具链的崛起逻辑 政策驱动:信创战略与供应链安全需求 国家“十四五”规划明确提出支持关键领域技术自主化࿰…...
Linux线程同步与互斥:【线程互斥】【线程同步】【线程池】
目录 一.线程互斥 1.1相关概念 1.2互斥量 为什么会出现负数?? 互斥量的接口 问题: 1.3互斥量实现原理探究 1.4互斥量封装 二.线程同步 2.1条件变量 2.2同步概念与竞态条件 2.3接口 2.4生产者消费者模型 优点 2.5基于BlockingQueue的…...
网络安全基础知识总结
什么是网络安全 采取必要措施,来防范对网络的攻击,侵入,干扰,破坏和非法使用,以及防范一些意外事故,使得网络处于稳定可靠运行的状态,保障网络数据的完整性、保密性、可用性的能力(CIA)。 举例…...
请求被中止: 未能创建 SSL/TLS 安全通道。
需要安装vs2019社区办,下载VisualStudioSetup.exe后,报无法从"https://aka,ms/vs/16/release/channel"下载通道清单错误,接着打开%temp%目录下的最新日志,发现日志里报: [27d4:000f][2025-04-04T21:15:43] …...
FPGA学习(四)——状态机重写LED流水灯并仿真
FPGA学习(四)——状态机重写LED流水灯并仿真 目录 FPGA学习(四)——状态机重写LED流水灯并仿真一、状态机编程思想1、状态机要素2、状态迁移图3、状态机写法 二、LED流水灯仿真实现1、代码实现2、modesim仿真 三、实现效果1、仿真…...
spark 集群
hadoop客户端环境准备 找到资料包路径下的Windows依赖文件夹,拷贝hadoop-3.1.0到非中文路径(比如d:\hadoop-3.1.0) ① 打开环境变量 ② 在下方系统变量中新建HADOOP_HOME环境变量,值就是保存hadoop的目录。 效果如下: ③ 配置P…...
leetcode117 填充每个节点的下一个右侧节点指针2
LeetCode 116 和 117 都是关于填充二叉树节点的 next 指针的问题,但它们的区别在于 树的类型 不同,117与 116 题类似,但给定的树是 普通二叉树(不一定完全填充),即某些节点可能缺少左或右子节点。 树的结构…...
Java全栈面试宝典:线程安全机制与Spring Boot核心原理深度解析
目录 一、Java线程安全核心原理 🔥 问题1:线程安全的三要素与解决方案 线程安全风险模型 线程安全三要素 synchronized解决方案 🔥 问题2:synchronized底层实现全解析 对象内存布局 Mark Word结构(64位系统&…...
CCF GESP C++编程 三级认证真题 2025年3月
C 三级 2025 年 03 月 题号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 答案 D B A A B A C A C D D D B D C 1 单选题 第 1 题 Base64 编码将每3字节的输入数据编码为 4 字节的输出数据。如果输入数据长度不是 3 的倍数,会用 号填充。在Base64编码中,如果…...
人工智能爬虫导致维基共享资源带宽需求激增 50%
2025 年 4 月 1 日,维基媒体基金会在博文中表示,自 2024 年 1 月以来,维基共享资源下载多媒体的带宽消耗激增 50%,这一变化趋势主要由用于 AI 训练数据集的网络爬虫导致。以下是具体分析1: 爬虫流量特征与数据存储模式…...
方案精读:华为数据治理之旅【全文阅读】
本文介绍了华为的数据管理工作,包括数据治理、数据质量建设、数据管理工作两阶段历程、数据管理组织和数据管理工作思考。华为以业务数字化为前提,以数据入湖为基础,重点建设数据中台,提高数据质量和管理能力,以支撑公司数字化转型。 重点内容: 1. 数据治理:华为进行数…...
Tradingview 策略分享 - SSL 混合和 CE 交易策略
交易策略|https://v.wkbrowser.com/s/e9DIvLGvYRo/|复制浏览器打开 各位交易员大家好 在本文中,我将分享一个简单的日内交易策略。我将 SSL 混合指标与 CE EXIT 相结合,以创建一个高效且有利可图的设置。此策略简单而强大&#x…...
华为OD机试真题——投篮大赛(2025A卷:100分)Java/python/JavaScript/C++/C语言/GO六种最佳实现
2025Q1 A卷 100分 题型 本文涵盖详细解题思路、代码注释、讲解、复杂的分析以及测试用例; 并提供Java、python、JavaScript、C、C语言、GO六种语言的最佳实现方式! 华为OD机试A卷真题《投篮大赛》: 题目名称:投篮大赛 知识点&am…...
rcore day2
目前常见的操作系统内核都是基于 C 语言的,为何要推荐 Rust 语言? C 语言的指针灵活且易于使用,但不保证安全性,且缺x少有效的并发支持。这导致内存和并发漏洞成为当前基于 C 语言的主流操作系统的噩梦。Rust 语言具有与 C 一样的…...
【MATLAB定位例程】TDOA(到达时间差)的chan-tylor,三维环境,附完整代码
该代码实现了基于三维空间的动态目标TDOA定位,结合了Chan算法(解析解)与Taylor级数展开法(迭代优化)的双重优势。 文章目录 运行结果MATLAB代码代码讲解代码功能概述核心算法原理代码结构解析可视化与结果分析运行结果 定位示意图: 三轴状态曲线: 三轴误差曲线: MA…...
LLM面试题六
NLP方向CRF算法面试题 什么是CRF?CRF的主要思想是什么? 设X与Y是随机变量,P(Y | X)是给定条件X的条件下Y的条件概率分布,若随机变量Y构成一个由无向图G(V,E)表示的马尔科夫随机场。则称条件概率分布P(X | Y)为条件随机场。CRF的主要思想统计…...
FPGA(四)——状态机
FPGA(四)——状态机 文章目录 FPGA(四)——状态机一、状态机编程思想二、LED流水灯仿真实验三、实现效果四、CPLD和FPGA芯片主要技术区别五、hdlbitsFPGA——组合逻辑学习1、创建一个D触发器2、简单状态转换3、4位移位寄存器4、计数器1-125、边缘捕获寄存器 一、状态机编程思想…...
AI 浪潮下企业身份管理:特点凸显,安全挑战升级
“在 AI 时代的浪潮中,企业身份管理是安全之锚,精准把握权限边界,方能抵御身份安全的暗流。” 在人工智能迅猛发展的当下,企业身份管理呈现出诸多新特点,同时也面临着前所未有的身份安全挑战。要理解这些,我…...
OBS 录屏软件 for Mac 视频录制
OBS 录屏软件 for Mac 视频录制 文章目录 OBS 录屏软件 for Mac 视频录制一、介绍二、效果三、下载 一、介绍 Open Broadcaster Software for mac版,OBS 有多种功能并广泛使用在视频采集,直播等领域。而且该软件功能全面,专业强大࿰…...
从文本到多模态:如何将RAG扩展为支持图像+文本检索的增强生成系统?
目录 从文本到多模态:如何将RAG扩展为支持图像文本检索的增强生成系统? 一、为什么需要扩展到多模态? 二、多模态 RAG 系统的基本架构 三、关键技术点详解 (一)多模态嵌入(Embedding)技术 …...
AI助力高效PPT制作:从内容生成到设计优化
随着人工智能技术的不断发展,AI在各个领域的应用日益普及,尤其是在文档和演示文稿的创建过程中。PowerPoint(PPT)作为最常用的演示工具之一,借助AI的技术手段,可以极大地提高制作效率并提升最终呈现效果。在…...
调用kimi api
官网支持python,curl和node.js 因为服务器刚好有php环境,所以先用curl调个普通的语音沟通api <?php // 定义 API Key 和请求地址 define(MOONSHOT_API_KEY, sk-PXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXgk1); define(MOONSHOT_API_URL, https://…...
自定义注解导入自定义Bean
在Spring框架中,通过自定义注解实现容器启动时自动导入Bean,通常需要结合 Import 注解、ImportBeanDefinitionRegistrar 接口 或 Configuration 配置类。以下是具体实现步骤和示例: 1. 定义自定义注解 创建一个注解,用于标记需要…...
kettle插件-postgresql插件
今天是清明节,放假第一天也不得清闲。上午整理公司的交付文档,中午陪孩子户外骑行踏青,下午趁着休息的时间给老铁们讲下如何使用postgressql cdc插件来实时捕获数据。 注:CDC (Change Data Capture) 是一种技术,用于实…...
【CMake】《CMake构建实战:项目开发卷》笔记-Chapter7-构建目标和属性
第7章 构建目标和属性 本章重点关注CMake的构建目标和属性,它们是用来组织项目构建流程的核心概念。毫不夸张地说,如果学习CMake的目标就是组织简单的C和C小项目的构建流程,那么阅读掌握本章内容就足够了。 本章与第1章的“旅行笔记”遥相…...
单元测试之mockito
简介 mockito是一款模拟测试框架,用于Java开发中的单元测试。通过mockito,可以创建和配置一个对象,通过它来替换对象的外部依赖。 作用:模拟一个类的外部依赖,保证单元测试的独立性。例如,在类A中会调用类…...
定长池的实现
目录 一、定长池的框架 二、如何脱离malloc的内存池,直接从堆拿空间? 三、如何设计内存块的指针? 四、代码框架及实现 五、性能测试 一、定长池的框架 在学习高并发内存池之前,我们先来实现一个定长池࿰…...
C++多线程函数介绍
1.C11前没有线程库问题 对于多线程操作,Linux选择使用POSIX标准,而windows没有选择POSIX标准,自己设计了一套API和系统调用,叫Win32 API,就跟Linux存在标准差异,在Linux的代码移植到Windows就可能运行不了…...
图解AUTOSAR_SWS_LINTransceiverDriver
AUTOSAR LIN收发器驱动(LinTransceiverDriver)详解 AUTOSAR通信栈物理层组件详细解析 目录 AUTOSAR LIN收发器驱动(LinTransceiverDriver)详解 目录1. 概述 1.1. LIN收发器驱动的作用1.2. 在AUTOSAR架构中的位置2. 架构设计 2.1. 模块结构2.2. 组件关系2.3. 接口定义3. 状态管理…...
vue-element-admin 组件没有展示在中间部分
解决办法: router index.ts 中新增 要展示的组件的 import type { App } from "vue"; import { createRouter, createWebHashHistory, type RouteRecordRaw } from "vue-router";export const Layout () > import("/layout/index.…...