当前位置: 首页 > news >正文

文本中地理位置提取方法—正则和NLP模型

这里写目录标题

    • 一、提取地址列后12个字
    • 二、正则表达式删除不需要的文本
    • 三、保留关键字并删除之后的字
    • 四、相似度计算,查重
    • 五、去重

大量的文本中识别数据,要充分考虑效率和准确率。本文的方案是通过正则和NLP门址模型联合识别的方案。
首先利用现有粗略地址将包含有地址和事由的长文本缩短到短文本,在用正则匹配出地址,然后通过匹配出地址的长度和其他规则发现没有正确识别的地址。对于这部分地址通过MGeo模型高精度实现文本中地址识别地址,然后对识别后的地址做各行间的相似度计算,对于相似的字符串,把出现次数少的替换成出现次数多的。
通过MGeo模型高精度实现文本中地址识别

一、提取地址列后12个字

数据有个粗略地址和详细描述两列,通过提取地址列后12个字,一方面可以去除地址内容之前的数据,减少正则匹配,另一方面为Mgeo nlp模型处理做了截断提高精度和效率。

import pandas as pd# 文件路径
path = r"D:\data\rs\结果v6.xlsx"
path1 = r"D:\data\rs\结果v620.xlsx"# 要提取的字符数
N = 20# 读取数据并处理空值
df = pd.read_excel(path)
df['工单内容'] = df['工单内容'].fillna('').astype(str)# 定义提取函数
def extract_content(row, n):try:address = row['案发地址']content = row['工单内容']if not isinstance(address, str) or not isinstance(content, str):return ''start = content.find(address)if start == -1:return ''start += len(address)return content[start:start+n]except Exception as e:print(f"Error processing row {row.name}: {e}")return ''# 使用 lambda 把参数 n 传进去
df['提取内容'] = df.apply(lambda x: extract_content(x, N), axis=1)# 保存结果
df.to_excel(path1, index=False)

二、正则表达式删除不需要的文本

删除 匹配目标词 + 后续内容
1、数字 及之后的去掉(目的是去掉xx楼)
2、”*“ 及之后的去掉(目的是去掉xx楼)
3、把A-Z字母及之后的去掉(目的是去掉xx小区A区)
4、“村的住户”、“的村民”字符串及之后去掉(后面肯定不是地址)
5、“(无门牌号”及之后的去掉
6、“,”及后面的去掉
7、“的住户”和“住户”和“的业主”及之后面去掉
8、“回迁楼”、"民房"及后面的去掉
9、"最"及后面的去掉(应为后面是最东边之类的)
10、”号楼“及后面的去掉
11、删除 “(”及其后的内容
12、 删除 “的”及其后的内容
13、 删除 “附近”及其后的内容
14、删除 三期 关键字及之后的 其中三 可以替换为任意的汉字数字(注意:由于这条规则是要匹配 期 前面的一个变量,非常容易错,使用贪婪匹配会将前面联系的汉字都匹配进去,使用非贪婪只能匹配到 期 一个字)

 text = re.sub(r'([一二三四五六七八九十十一十二十三十四十五十六十七十八十九二十])期', '小区', text)

15 . 删除 “村民、居民、人”及其后的内容

三、保留关键字并删除之后的字

保留关键字”小区“并删除之后的内容

四、正则逻辑优化

  1. 优先保留“小区”并删除之后的,(防止被后续规则误删)

  2. 处理特定结构(村的村民、住户,回迁楼等)

  3. 处理期数(三期),将 三期替换为小区(不能删除之后的,因为口语中可能将小区用xx期表示)

  4. 符号处理(*,逗号,括号)

  5. 处理电话、安装、供暖等关键词

  6. 处理住户、业主、村民、民房等

  7. 处理最、的、附近等

  8. 处理数字、字母

调整原则:
减少误删除,先处理最确定的原则,缩小文本长度,减少后面规则匹配上的概率,避免误删除

  1. 优先保留小区信息 (防止被后续规则误删)

具体模式优先:越具体的匹配规则越先执行

格式清理前置:符号类清理早于文字内容清理

保留操作最后:关键保留操作放在处理链末端

通用模式置后:宽泛的.*模式放在处理链后部

#
import pandas as pd
import re# 文件路径
path = r"D:\data\rs\结果v620.xlsx"
output_path = r"D:\data\rs\结果v620_地址清洗_v3.xlsx"# 读取数据
df = pd.read_excel(path)# 复制原始列用于处理
df['提取地址'] = df['提取内容'].astype(str).copy()def clean_address(text):text = str(text)# 0.清理期数描述(三期、四期等),这个容易错,因为是向前匹配容易把之前联系的小区名匹配进去并替换掉text = re.sub(r'([一二三四五六七八九十十一十二十三十四十五十六十七十八十九二十])期', '小区', text)# 0 。保留小区  (防止被后续规则误删)text = re.sub(r'小区.*', '小区', text)# 1. 特定结构清理(村、回迁楼等)text = re.sub(r'的村民.*', '', text)text = re.sub(r'(无门牌号.*', '', text)text = re.sub(r'回迁楼.*', '', text)# 3. 特殊符号清理(*,逗号,括号)text = re.sub(r'\*.*', '', text)text = re.sub(r',.*', '', text)text = re.sub(r'(.*', '', text)# 4. 业务相关关键词清理(安装、供暖、电话等)text = re.sub(r'安装.*', '', text)text = re.sub(r'供暖.*', '', text)  text = re.sub(r'做.*', '', text)text = re.sub(r'电话.*', '', text)text = re.sub(r'租.*', '', text)text = re.sub(r'名称.*', '', text)  # 5. 清理住户/业主/居民描述text = re.sub(r'(的住户|住户|的业主).*', '', text)text = re.sub(r'村民.*', '', text)text = re.sub(r'居民.*', '', text)text = re.sub(r'人.*', '', text)text = re.sub(r'附近.*', '', text)text = re.sub(r'民房.*', '', text)# 6. 通用描述清理(最、的)text = re.sub(r'最.*', '', text)text = re.sub(r'的.*', '', text)  # 注意这个模式较宽泛,放在后面# 7. 基础元素清理(数字、字母)text = re.sub(r'\d+.*', '', text)text = re.sub(r'[A-Za-z].*', '', text)return text.strip()# 应用清理函数
df['提取地址'] = df['提取地址'].apply(clean_address)# 保存结果
df.to_excel(output_path, index=False)print("地址清洗完成,已保存至:", output_path)

优化补充:

1、对村村 替换为村 将 小区小区(xx小区三期替换来的) 替换为 小区

四、相似度计算,查重

不适用编辑距离,太慢。利用行政区分组减少对比空间,然后用近似算法降低计算量。
通过MinHash+LSH技术高效检测地址相似性。首先清洗地址文本并提取字符级N-Gram特征,每个地址转换为MinHash签名。按行政区划建立局部敏感哈希(LSH)索引,将相似度超过阈值的地址映射到相同哈希桶。通过多进程并行处理各行政区,对每个地址查询LSH获得候选集,排除自身后生成相似地址组。最终输出结构化的"行政区-原地址-相似地址列表"结果,实现大规模地址数据的快速相似聚类。

#
import pandas as pd
import re
from datasketch import MinHash, MinHashLSH
import multiprocessing as mp# --------------------------------------
# 配置参数
# --------------------------------------
INPUT_PATH = r"D:\data\rs\合并结果12.xlsx"
ADDR_COLUMN = '具体地址'    # 要处理的详细地址列
REGION_COLUMN = '案发地址'  # 行政区划列
OUTPUT_PATH = r"D:\data\rs\d.xlsx"
N_GRAM = 3                # N-Gram长度
THRESHOLD = 0.7           # 相似度阈值
NUM_PERM = 128            # MinHash精度参数# --------------------------------------
# 预处理函数
# --------------------------------------
def preprocess(text):"""地址标准化"""text = re.sub(r'[^\w\u4e00-\u9fff]', '', text)  # 去除非中文字符return text.strip()def generate_ngrams(text, n=3):"""生成字符级N-Gram"""return [text[i:i+n] for i in range(len(text)-n+1)]# --------------------------------------
# 核心处理函数(每个行政区独立处理)
# --------------------------------------
def process_region(region_data):"""处理单个行政区的地址相似性"""region_name, addresses = region_datalsh = MinHashLSH(threshold=THRESHOLD, num_perm=NUM_PERM)address_dict = {}minhash_dict = {}  # 存储MinHash对象results = []# 构建当前行政区的LSH索引for idx, addr in enumerate(addresses):processed = preprocess(addr)ngrams = generate_ngrams(processed, N_GRAM)mh = MinHash(num_perm=NUM_PERM)for gram in ngrams:mh.update(gram.encode('utf-8'))lsh.insert(idx, mh)address_dict[idx] = addrminhash_dict[idx] = mh  # 保存MinHash对象# 查询相似对(使用正确的MinHash对象)for idx in address_dict:mh = minhash_dict[idx]candidates = lsh.query(mh)candidates = [c for c in candidates if c != idx]if candidates:original = address_dict[idx]similars = list(set(address_dict[c] for c in candidates))results.append((region_name, original, ', '.join(similars)))return results# --------------------------------------
# 主流程
# --------------------------------------
if __name__ == '__main__':# 读取数据并按行政区划分组df = pd.read_excel(INPUT_PATH)df[ADDR_COLUMN] = df[ADDR_COLUMN].astype(str)grouped = df.groupby(REGION_COLUMN)[ADDR_COLUMN].unique()# 多进程并行处理每个行政区with mp.Pool(mp.cpu_count()) as pool:all_results = pool.map(process_region, grouped.items())# 整合结果final_data = []for region_results in all_results:final_data.extend(region_results)# 保存结果result_df = pd.DataFrame(final_data, columns=['行政区', '原地址', '相似地址列表'])result_df.to_excel(OUTPUT_PATH, index=False)print(f"处理完成!发现相似组: {len(final_data):,}")

五、去重

要求生成一张新表,
d表是上一部生产的相似地址清单表。合并结果12表是地址源表。

1、读取"D:\data\rs\后处理\合并结果12.xlsx" ,统计具体地址列每个内容重复的个数
2、读取"D:\data\rs\后处理\d.xlsx" 里面有原地址和相似地址列表
3、对"D:\data\rs\后处理\d.xlsx" 每一行,读取”相似地址列表“列形成成一个列表,对列表中的每个元素 与"D:\data\rs\后处理\d.xlsx" 原地址列的内容进行比较,比较的原则为 “D:\data\rs\后处理\合并结果12.xlsx"的这两个元素的重复个数
4、在"D:\data\rs\后处理\合并结果12.xlsx"中将重复个数少的替换成多的。
5、遍历"D:\data\rs\后处理\d.xlsx” 每一行,并在"D:\data\rs\后处理\合并结果12.xlsx"完成替换后形成新表

数据量大使用polars库来进行

import polars as pldef process_data():# 读取原始数据并统计频次original_df = pl.read_excel(r"D:\data\rs\后处理\合并结果12.xlsx")count_df = original_df.group_by("具体地址").agg(pl.len().alias("出现次数"))# 读取相似地址表similar_df = pl.read_excel(r"D:\data\rs\后处理\d.xlsx").with_columns(pl.col("相似地址列表").str.split(", "))# 创建地址频次字典count_dict = dict(zip(count_df["具体地址"], count_df["出现次数"]))# 生成替换规则replacement_rules = {}for row in similar_df.iter_rows(named=True):# 获取当前组所有地址group_addresses = [row["原地址"]] + row["相似地址列表"]# 排除不存在的地址valid_addresses = [addr for addr in group_addresses if addr in count_dict]if not valid_addresses:continue# 找出频次最高的地址max_count = max(count_dict[addr] for addr in valid_addresses)candidates = [addr for addr in valid_addresses if count_dict[addr] == max_count]target = candidates[0]  # 频次相同取第一个# 生成替换规则for addr in group_addresses:if addr == target or addr not in count_dict:continue# 保留最大频次规则current_rule = replacement_rules.get(addr, addr)current_count = count_dict.get(current_rule, 0)if count_dict[target] > current_count:replacement_rules[addr] = target# 应用替换规则new_df = original_df.with_columns(pl.col("具体地址").replace(replacement_rules, default=pl.col("具体地址")))# 保存结果new_df.write_excel(r"D:\data\rs\后处理\合并结果_标准化.xlsx")print("处理完成,生成标准化地址表")if __name__ == "__main__":process_data()

相关文章:

文本中地理位置提取方法—正则和NLP模型

这里写目录标题 一、提取地址列后12个字二、正则表达式删除不需要的文本三、保留关键字并删除之后的字四、相似度计算,查重五、去重 大量的文本中识别数据,要充分考虑效率和准确率。本文的方案是通过正则和NLP门址模型联合识别的方案。 首先利用现有粗略…...

AI大模型-RAG到底能做些什么?

RAG常见的应用场景,有以下几个方面: 1.智能客服系统:比如电商领域,对客户提出的常见问题,进行自动回复。减少人力成本。 2.人力资源管理:一个新的员工,入职一家大型公司,公司中有各…...

【算法基础】冒泡排序算法 - JAVA

一、算法基础 1.1 什么是冒泡排序 冒泡排序是一种简单直观的比较排序算法。它重复地走访待排序的数列,依次比较相邻两个元素,如果顺序错误就交换它们,直到没有元素需要交换为止。 1.2 基本思想 比较相邻元素:从头开始&#xf…...

Nginx搭建test服务器

创建test域名 进入阿里云添加解析 创建域名:test.xxxxx.com 服务器复制项目代码 新建目录,Git拉取项目代码,安装上插件包 修改配置文件,启动测试服务 修改配置文件“服务器接口” 开启服务pm2 start app.js --name "t…...

依赖倒置原则

当然可以!这次我们来详细讲解 依赖倒置原则(DIP: Dependency Inversion Principle),它是 SOLID 五大设计原则中的压轴,也是最关键的“架构型原则”。 我将从: 什么是依赖倒置原则(定义&#x…...

PostgreSQL 的 VACUUM 与 VACUUM FULL 详解

PostgreSQL 的 VACUUM 与 VACUUM FULL 详解 一、基本概念对比 特性VACUUMVACUUM FULL定义常规维护操作,清理死元组激进重组操作,完全重写表数据锁级别不阻塞读写(共享锁)排他锁(阻塞所有操作)空间回收只标记空间为可用,不返还OS空间返还操作…...

SQL面试题——留存分析之使用bitmap 计算留存

使用bitmap 计算留存 之前我们说过,留存分析其实在企业数据分析中,是很基础但是也很重要的,留存分析可以反映产品的发展是否健康,是否可持续发展,之前我们介绍过,可以看看之前的文章 SQL面试题——留存分析 因为使用工具的限制,所以我们实现方式也会有所不同,之前我们…...

P2415集合求和 题解

P2415 集合求和 题解 公式推导: 设集合有 n 个元素,记为 a 1 , a 2 , … , a n a_1, a_2, \dots, a_n a1​,a2​,…,an​。 每个子集要么包含某个元素,要么不包含。 我们固定某个元素 a k a_k ak​,再从剩下的 n − 1 n -…...

【2025年五一数学建模竞赛】C题 完整论文 模型建立与求解

目录 2025年五一数学建模竞赛 C题完整论文:建模与求解 Matlab代码一、问题重述二、模型假设与符号说明2.1 模型基本假设2.2 符号说明 问题一:预测博主新增关注数问题二:预测用户的新关注行为问题三:预测用户在线状态及互动博主问题…...

wpf 输入框 在输入时去除水印

wpf ScrollViewer 在输入数据时去除水印 在WPF(Windows Presentation Foundation)中,ScrollViewer控件通常用于显示滚动内容。如果你想在ScrollViewer中使用数据输入(例如文本输入),并且希望在输入时去除水…...

数字智慧方案5857丨智慧机场解决方案与应用(53页PPT)(文末有下载方式)

资料解读:智慧机场解决方案与应用 详细资料请看本解读文章的最后内容。 随着科技的飞速发展,智慧机场的建设已成为现代机场发展的重要方向。智慧机场不仅提升了旅客的出行体验,还极大地提高了机场的运营效率。本文将详细解读沃土数字平台在…...

C语言-指针(二)

一级指针 一级指针指的是存储了变量地址的指针 一级指针的变量类型是 类型 * 一级指针的类型与变量的类型有些不同 例:int * p 前面的int * 是该地址的类型 int a 0; int * p a; 这里的指针 p 就是一级指针 二级指针 指针变量也是变量因此也会有地…...

React 组件prop添加类型

给函数的props做注解 import { useState } from reacttype Props { className:string,title?:string } // 自定义一个Button组件 function Button(props:Props){// 解构出classname\const {className} propsreturn <button className{className}>点击我</button&g…...

Spring Boot中集成Guava Cache或者Caffeine

一、在Spring Boot(1.x版本)中集成Guava Cache 注意&#xff1a; Spring Boot 2.x用户&#xff1a;优先使用Caffeine&#xff0c;性能更优且维护活跃。 1. 添加依赖 在pom.xml中添加Guava依赖&#xff1a; <dependency><groupId>com.google.guava</groupId&…...

全感官交互革命:当 AI 大模型学会 “看、听、说、创”

引言&#xff1a;从 “文字对话” 到 “全感官体验”&#xff0c;AI 正在重塑人类认知边界 当 AI 不再局限于文本对话&#xff0c;而是能 “看懂” 图像、“听懂” 语音、“生成” 视频&#xff0c;并将这些模态无缝融合时&#xff0c;一场关于人机交互的革命已然开启。DeepSe…...

Linux 库文件详解

Linux 库文件详解 一、库文件概述 库文件是预先编译好的方法的集合&#xff0c;它为程序员提供了一种方便的方式来复用代码。在 Linux 系统中&#xff0c;主要有两种类型的库文件&#xff1a;静态库和共享库。 静态库&#xff08;.a 文件&#xff09; 使用静态库&#xff0…...

蒙特卡罗方法(Monte Carlo Method)​​:基于随机采样的数值计算与模拟技术

​​核心思想​​ 蒙特卡罗方法通过​​随机采样​​和​​统计模拟​​解决数学、物理、工程等领域的复杂问题&#xff0c;其核心是利用​​大数定律​​——当样本量足够大时&#xff0c;样本均值会收敛于期望值。 ​​关键特点​​&#xff1a; ​​无维度诅咒​​&#x…...

HTTPS协议:更安全的HTTP

目录 1. 前言 2. HTTP 与 HTTPS&#xff1a;安全的分水岭 2.1 HTTP 的安全隐患 2.2 HTTPS 的安全提升 3. HTTPS 的核心概念 3.1 加密三剑客&#xff1a;对称加密、非对称加密与哈希算法 3.2 SSL/TLS 握手过程&#xff1a;建立安全通道的关键步骤 3.3 数字证书&#xff…...

Flutter BottomNavigationBar 详解

目录 一、引言 二、BottomNavigationBar 的基本用法 三、主要属性 1. 基本配置 2. 导航项配置 3. 导航类型选择 四、高级功能实现 1. 结合 PageView 实现滑动切换 2. 添加徽章提示 3. 自定义凸起按钮&#xff08;FAB融合&#xff09; 4. 渐变背景实现 五、自定义 B…...

吴恩达深度学习作业 RNN模型——字母级语言模型

一. 简单复习一下RNN RNN RNN适用于处理序列数据&#xff0c;令是序列的第i个元素&#xff0c;那么就是一个长度为的序列&#xff0c;NLP中最常见的元素是单词&#xff0c;对应的序列是句子。 RNN使用同一个神经网络处理序列中的每一个元素。同时&#xff0c;为了表示序列的…...

数字时代,如何为个人信息与隐私筑牢安全防线?

首席数据官高鹏律师团队编著 在当今数字化时代&#xff0c;个人信息和隐私保护至关重要。我们在享受数字生活带来的便利时&#xff0c;也面临着个人信息泄露、隐私被侵犯的风险。下面将从先进技术和法律途径两个方面&#xff0c;探讨如何严格保护个人信息和隐私。 一、先进技…...

javascript交换值最好三种

代码 1. 位运算(性能高&#xff0c;但只能用于整数) var a15; var b32; console.log(a) //15 console.log(b) //32 a a ^ b; b a ^ b; a a ^ b; console.log(a) //32 console.log(b) //152. 数组结构(性能高&#xff0c;但要ES6) var a15; var b32; console.log(…...

C++-Lambda表达式

目录 1.什么是 Lambda&#xff1f; 2.例子&#xff1a;打印每个元素&#xff08;和 for_each 一起用&#xff09; 3.捕获外部变量&#xff08;Capture&#xff09; 3.1. 捕获值&#xff08;拷贝&#xff09;&#xff1a;[] 3.2. 捕获引用&#xff1a;[&] 3.3. 指定捕…...

逻辑回归的多分类实战:以鸢尾花数据集为例

文章目录 引言&#xff1a;从二分类到多分类一、多分类问题无处不在二、One-vs-All策略揭秘1. 核心思想2. 数学表达 三、鸢尾花分类完整实现1. 环境准备2. 数据加载与探索3. 数据预处理4. 模型训练与评估5. 决策边界可视化 四、关键参数解析五、总结 引言&#xff1a;从二分类到…...

[面试]SoC验证工程师面试常见问题(一)

SoC验证工程师面试常见问题(一) 摘要:在面试 SoC 验证工程师职位时,面试官通常会重点考察候选人对 SystemVerilog 和 UVM (Universal Verification Methodology) 的掌握程度,因为这两者是现代 IC 验证的核心技能。以下是可能会被问到的常见问题,涵盖 SystemVerilo…...

传统银行服务和 区块链支付无缝融合的一种解决方案

Dragonfly Capital 的合伙人 Alex Pack 曾表示:“DeFi 的目标是重构全球银行体系,并打造开放且无须许可的经营环境。”在 DeFi 的金融世界中,加密资产架构在区块链上,通过各个协议实现资产之间的高效转移和价值的实时流通,如 Metamask 钱包的自托管,Uniswap 的资产交易,…...

大语言模型能力评定探讨

有标准答案的评估&#xff08;选择题&#xff09; 评估语言模型能力的基本思路是准备输入和标准答案&#xff0c;比较不同模型对相同输入的输出 由于AI答题有各种各样答案&#xff0c;因此现在是利用选择题考察。 有一个知名的选择题的基准叫做Massive Multitask Language Und…...

解构区块链身份认证:从ID到零知识证明的实战指南

引言 在数字经济高速发展的今天&#xff0c;数字身份已成为个人与数字世界交互的核心凭证。传统中心化身份系统存在数据孤岛、隐私泄露、单点故障等痛点&#xff0c;而区块链技术凭借​​去中心化、不可篡改、可追溯​​的特性&#xff0c;为数字身份验证提供了革命性解决方案…...

IntelliJ IDEA 使用教程

文章目录 一、创建项目二、创建模块三、创建包四、创建类五、编写代码六、运行代码注意 一、创建项目 二、创建模块 【File】->【New】->【Module…】 三、创建包 【helloword】->【右击 src】->【New】->【Package】 四、创建类 【helloword】->【s…...

HBM的哪些事

命令操作 这也许是DDR往HBM演进的一些奇淫技巧。 本篇内容属于杂谈&#xff0c;关于HBM的奇淫技巧&#xff0c;随后出专题介绍。...

C++ std::initializer_list 详解

std::initializer_list 是 C11 引入的一个轻量级模板类&#xff0c;用于支持花括号初始化列表&#xff08;{1, 2, 3}&#xff09;的语义。它允许函数或构造函数接受任意长度的同类型初始化列表&#xff0c;是实现统一初始化&#xff08;{} 语法&#xff09;的核心组件。 1. 基本…...

网络原理 - 13(HTTP/HTTPS - 4 - HTTPS)

目录 HTTPS 是什么 不得不的策略 - 应对“运营商劫持” “加密” 是什么 分类 对称加密 非对称加密 HTTPS 工作原理 1&#xff09;引入对称加密 2&#xff09; 引入非对称加密 中间人攻击 引入证书 证书的验证过程 完&#xff01; HTTPS 是什么 HTTPS 也是一个应…...

当MCP撞进云宇宙:多芯片封装如何重构云计算的“芯“未来?

当MCP撞进云宇宙:多芯片封装如何重构云计算的"芯"未来? 2024年3月,AMD发布了震撼业界的MI300A/B芯片——这颗为AI计算而生的"超级芯片",首次在单封装内集成了13个计算芯片(包括3D V-Cache缓存、CDNA3 GPU和Zen4 CPU),用多芯片封装(Multi-Chip Pac…...

Kotlin Flow流

一 Kotlin Flow 中的 stateIn 和 shareIn 一、简单比喻理解 想象一个水龙头&#xff08;数据源&#xff09;和几个水杯&#xff08;数据接收者&#xff09;&#xff1a; 普通 Flow&#xff08;冷流&#xff09;&#xff1a;每个水杯来接水时&#xff0c;都要重新打开水龙头从…...

虚拟局域网(VLAN)实验(Cisco Packet Tracer)-路由器、交换机的基本配置

好的&#xff0c;我们来根据你提供的文档&#xff0c;一步步地在 Cisco Packet Tracer 中完成这个跨交换机划分 VLAN 的实验。 实验目标: 配置两台交换机 SW1 和 SW2&#xff0c;划分 VLAN 10 和 VLAN 20&#xff0c;配置 Trunk 链路&#xff0c;并测试同 VLAN 和跨 VLAN 的连…...

【论文速递】2025年09周 (Robotics/Embodied AI/LLM)

目录 LLM-Microscope&#xff1a;揭示标点符号在Transformers的上下文中的隐藏作用英文摘要中文摘要 SurveyX&#xff1a;通过大型语言模型实现学术调查自动化英文摘要中文摘要 数学推理的自我奖励校正英文摘要中文摘要 VideoGrain&#xff1a;调整时空关注以进行多元透明视频编…...

自主机器人模拟系统

一、系统概述 本代码实现了一个基于Pygame的2D自主机器人模拟系统&#xff0c;具备以下核心功能&#xff1a; 双模式控制&#xff1a;支持手动控制&#xff08;WASD键&#xff09;和自动导航模式&#xff08;鼠标左键设定目标&#xff09; 智能路径规划&#xff1a;采用改进型…...

DeepSeek构建非农预测模型:量化关税滞后效应与非线性经济冲击传导

AI分析&#xff1a;非农数据前瞻与关税影响的滞后性 根据AI模型对多维度经济指标的交叉验证&#xff0c;4月非农就业报告或呈现“增速放缓但未失速”的特征。当前市场共识预期为新增就业13.3万人&#xff08;前值22.8万&#xff09;&#xff0c;失业率维持4.2%&#xff0c;时薪…...

前端面经-VUE3篇--vue3基础知识(一)插值表达式、ref、reactive

一、计算属性(computed) 计算属性&#xff08;Computed Properties&#xff09;是 Vue 中一种特殊的响应式数据&#xff0c;它能基于已有的响应式数据动态计算出新的数据。 计算属性有以下特性&#xff1a; 自动缓存&#xff1a;只有当它依赖的响应式数据发生变化时&#xff…...

云原生后端架构的优势与最佳实践

📝个人主页🌹:慌ZHANG-CSDN博客 🌹🌹期待您的关注 🌹🌹 在过去的几年里,随着云计算和容器化技术的迅猛发展,云原生架构逐渐成为现代企业和开发团队构建和运维应用系统的首选方式。云原生架构通过高度的自动化、弹性伸缩、微服务化等特点,使得企业能够在不断变化…...

力扣838.推多米诺随笔

“生活就像海洋&#xff0c;只有意志坚强的人&#xff0c;才能到达彼岸。”—— 马克思 题目 n 张多米诺骨牌排成一行&#xff0c;将每张多米诺骨牌垂直竖立。在开始时&#xff0c;同时把一些多米诺骨牌向左或向右推。 每过一秒&#xff0c;倒向左边的多米诺骨牌会推动其左侧…...

aab转apk

一、 android34升级&#xff1a; 1、升级到安卓34&#xff08;蓝牙、图片&#xff09; 再蓝牙广播的地方加入Context.RECEIVER_EXPORTED 2、废弃了 BluetoothAdapter#enable() 和 BluetoothAdapter#disable()&#xff0c;需要修改 // 以前的蓝牙操作BluetoothManager bluetoo…...

LeetCode 560. 和为 K 的子数组 | 前缀和与哈希表的巧妙应用

文章目录 方法思路&#xff1a;前缀和 哈希表核心思想关键步骤 代码实现复杂度分析示例解析总结 题目描述 给定一个整数数组 nums 和一个整数 k&#xff0c;请统计并返回该数组中和为 k 的子数组的数量。 子数组是数组中连续的非空元素序列。 示例 输入&#xff1a;nums …...

【Hive入门】Hive性能调优:小文件问题与动态分区合并策略详解

目录 引言 1 Hive小文件问题概述 1.1 什么是小文件问题 1.2 小文件产生的原因 2 Hive小文件合并机制 2.1 hive.merge.smallfiles参数详解 2.2 小文件合并流程 2.3 合并策略选择 3 动态分区与小文件问题 3.1 动态分区原理 3.2 动态分区合并策略 3.3 动态分区合并流程…...

基于Springboot+Vue3.0的前后端分离的个人旅游足迹可视化平台

文章目录 0、前言1、前端开发1.1 登录注册页面1.2 首页1.3 足迹管理1.3.1 足迹列表1.3.2 添加足迹1.4 个人中心1.4.1 足迹成就1.4.2 个人信息1.4.3 我的计划2、后端开发2.1 用户接口开发2.2 足迹点接口2.3 旅游计划接口3、完整代码资料下载0、前言 项目亮点: 前端用户权限动态…...

安妮推广导航系统开心版多款主题网址推广赚钱软件推广变现一键统计免授权源码Annie

一、源码描述 这是一套推广导航源码&#xff08;Annie&#xff09;&#xff0c;基于Funadmin框架&#xff08;ThinkPHP8Layui &#xff09;&#xff0c;内置多款主题&#xff0c;可以用于网址推广&#xff0c;或者用于软件推广&#xff0c;PC端软件手机端软件&#xff0c;后台…...

单片机-STM32部分:1、STM32介绍

飞书文档https://x509p6c8to.feishu.cn/wiki/CmpZwTgHhiQSHZkvzjdc6c4Yn1g STM32单片机不是一款芯片&#xff0c;而是一个系列的芯片&#xff1f; STM32系列单片机是ST&#xff08;意法半导体&#xff09;公司开发的一套32位微控制器基于Arm Cortex()-M处理器&#xff0c;它包…...

PHP-session

PHP中&#xff0c;session&#xff08;会话&#xff09;是一种在服务器上存储用户数据的方法&#xff0c;这些数据可以在多个页面请求或访问之间保持。Session提供了一种方式来跟踪用户状态&#xff0c;比如登录信息、购物车内容等。当用户首次访问网站时&#xff0c;服务器会创…...

php artisan resetPass 执行密码重置失败的原因?php artisan resetPass是什么 如何使用?-优雅草卓伊凡

php artisan resetPass 执行密码重置失败的原因&#xff1f;php artisan resetPass是什么 如何使用&#xff1f;-优雅草卓伊凡 可能的原因 命令不存在&#xff1a;如果你没有正确定义这个命令&#xff0c;Laravel 会报错而不是提示”重置密码失败”用户不存在&#xff1a;’a…...

AI大模型-微调和RAG方案选项

在搭建知识库的方向上&#xff0c;有两个落地方案&#xff1a;微调、RAG。两个方案的比对&#xff1a; 方案选型 微调 让大模型&#xff08;LLM&#xff09;去学习现有知识&#xff08;调整大模型的参数&#xff0c;让它学习新的知识&#xff09;&#xff0c;最终生成一个新的…...