当前位置：首页 > news >正文

BERT - MLM 和 NSP

news 来源：原创 2025/9/14 5:02:34

本节代码将实现BERT模型的两个主要预训练任务：掩码语言模型（Masked Language Model, MLM） 和 下一句预测（Next Sentence Prediction, NSP）。

1. `create_nsp_dataset` 函数

这个函数用于生成NSP任务的数据集。

def create_nsp_dataset(corpus):nsp_dataset = []for i in range(len(corpus)-1):next_sentence = corpus[i+1]rand_id = random.randint(0, len(corpus) - 1)while abs(rand_id - i) <= 1:rand_id = random.randint(0, len(corpus) - 1)negt_sentence = corpus[rand_id]nsp_dataset.append((corpus[i], next_sentence, 1))  # 正样本nsp_dataset.append((corpus[i], negt_sentence, 0))  # 负样本return nsp_dataset

正样本：corpus[i] 和 corpus[i+1] 是连续的句子对，标记为 1，表示它们是相邻的句子。
负样本：corpus[i] 和随机选择的句子 corpus[rand_id] 组成一个句子对，标记为 0，表示它们不是相邻的句子。
随机选择负样本：通过随机选择句子来生成负样本，确保模型能够学习区分相邻句子和非相邻句子。

2. `BERTDataset` 类

这个类继承自 torch.utils.data.Dataset，用于加载和处理BERT预训练任务的数据。

def __init__(self, nsp_dataset, tokenizer: BertTokenizer, max_length):self.nsp_dataset = nsp_datasetself.tokenizer = tokenizerself.max_length = max_lengthself.cls_id = tokenizer.cls_token_idself.sep_id = tokenizer.sep_token_idself.pad_id = tokenizer.pad_token_idself.mask_id = tokenizer.mask_token_id

nsp_dataset：存储NSP任务的数据集，每个样本是一个三元组 (sent1, sent2, nsp_label)。
tokenizer：用于将文本转换为词索引（token IDs）。
max_length：序列的最大长度，用于填充或截断。
特殊标记：
- self.cls_id：[CLS] 标记的索引。
- self.sep_id：[SEP] 标记的索引。
- self.pad_id：[PAD] 标记的索引。
- self.mask_id：[MASK] 标记的索引。

`len` 方法

def __len__(self):return len(self.nsp_dataset)

返回数据集的大小，即样本数量。

`getitem` 方法

def __getitem__(self, idx):sent1, sent2, nsp_label = self.nsp_dataset[idx]sent1_ids = self.tokenizer.encode(sent1, add_special_tokens=False)sent2_ids = self.tokenizer.encode(sent2, add_special_tokens=False)tok_ids = [self.cls_id] + sent1_ids + [self.sep_id] + sent2_ids + [self.sep_id]seg_ids = [0]*(len(sent1_ids)+2) + [1]*(len(sent2_ids) + 1)mlm_tok_ids, mlm_labels = self.build_mlm_dataset(tok_ids)mlm_tok_ids = self.pad_to_seq_len(mlm_tok_ids, 0)seg_ids = self.pad_to_seq_len(seg_ids, 2)mlm_labels = self.pad_to_seq_len(mlm_labels, -100)mask = (mlm_tok_ids != 0)return {"mlm_tok_ids": mlm_tok_ids,"seg_ids": seg_ids,"mask": mask,"mlm_labels": mlm_labels,"nsp_labels": torch.tensor(nsp_label)}

句子编码：
- sent1_ids 和 sent2_ids 分别是两个句子的词索引列表。
- 使用 self.tokenizer.encode 将句子转换为词索引，add_special_tokens=False 表示不添加特殊标记（[CLS] 和 [SEP]）。
构建输入序列：
- tok_ids：将两个句子的词索引列表组合成一个序列，中间用 [SEP] 分隔，并在开头添加 [CLS]。
- seg_ids：段嵌入索引，第一个句子使用 0，第二个句子使用 1。
MLM任务：
- mlm_tok_ids 和 mlm_labels 是通过 build_mlm_dataset 方法生成的，用于MLM任务。
填充和截断：
- 使用 pad_to_seq_len 方法将 mlm_tok_ids、seg_ids 和 mlm_labels 填充或截断到 max_length。
掩码：
- mask：生成一个掩码，用于标记哪些位置是有效的输入（非填充部分）。

`pad_to_seq_len` 方法

def pad_to_seq_len(self, seq, pad_value):seq = seq[:self.max_length]pad_num = self.max_length - len(seq)return torch.tensor(seq + pad_num * [pad_value])

设计原因

将序列截断到 max_length，并用 pad_value 填充到 max_length。

`build_mlm_dataset` 方法

def build_mlm_dataset(self, tok_ids):mlm_tok_ids = tok_ids.copy()mlm_labels = [-100] * len(tok_ids)for i in range(len(tok_ids)):if tok_ids[i] not in [self.cls_id, self.sep_id, self.pad_id]:if random.random() < 0.15:mlm_labels[i] = tok_ids[i]if random.random() < 0.8:mlm_tok_ids[i] = self.mask_idelif random.random() < 0.9:mlm_tok_ids[i] = random.randint(106, self.tokenizer.vocab_size - 1)return mlm_tok_ids, mlm_labels

MLM任务：
- 随机选择一些词（概率为15%），并将它们替换为 [MASK]（80%）、随机词（10%）或保持不变（10%）。
- mlm_labels 用于存储被替换词的真实索引，未被替换的位置标记为 -100（PyTorch中忽略计算损失的标记）。

Bert完整代码（标红部分为本节所提到部分）

import re
import math
import torch
import random
import torch.nn as nnfrom transformers import BertTokenizer
from torch.utils.data import Dataset, DataLoader# nn.TransformerEncoderLayerclass MultiHeadAttention(nn.Module):def __init__(self, d_model, num_heads, dropout):super().__init__()self.num_heads = num_headsself.d_k = d_model // num_headsself.q_proj = nn.Linear(d_model, d_model)self.k_proj = nn.Linear(d_model, d_model)self.v_proj = nn.Linear(d_model, d_model)self.o_proj = nn.Linear(d_model, d_model)self.dropout = nn.Dropout(dropout)def forward(self, x, mask=None):batch_size, seq_len, d_model = x.shapeQ = self.q_proj(x).view(batch_size, seq_len, self.num_heads, self.d_k).transpose(1, 2)K = self.k_proj(x).view(batch_size, seq_len, self.num_heads, self.d_k).transpose(1, 2)V = self.v_proj(x).view(batch_size, seq_len, self.num_heads, self.d_k).transpose(1, 2)atten_scores = (Q @ K.transpose(-2, -1)) / math.sqrt(self.d_k)if mask is not None:mask = mask.unsqueeze(1).unsqueeze(1)atten_scores = atten_scores.masked_fill(mask == 0, -1e9)atten_scores = torch.softmax(atten_scores, dim=-1)out = atten_scores @ Vout = out.transpose(1, 2).contiguous().view(batch_size, seq_len, d_model)return self.dropout(self.o_proj(out))class FeedForward(nn.Module):def __init__(self, d_model, dff, dropout):super().__init__()self.W1 = nn.Linear(d_model, dff)self.act = nn.GELU()self.W2 = nn.Linear(dff, d_model)self.dropout = nn.Dropout(dropout)def forward(self, x):return self.W2(self.dropout(self.act(self.W1(x))))class TransformerEncoderBlock(nn.Module):def __init__(self, d_model, num_heads, dropout, dff):super().__init__()self.mha_block = MultiHeadAttention(d_model, num_heads, dropout)self.ffn_block = FeedForward(d_model, dff, dropout)self.norm1 = nn.LayerNorm(d_model)self.norm2 = nn.LayerNorm(d_model)self.dropout1 = nn.Dropout(dropout)self.dropout2 = nn.Dropout(dropout)def forward(self, x, mask=None):res1 = self.norm1(x + self.dropout1(self.mha_block(x, mask)))res2 = self.norm2(res1 + self.dropout2(self.ffn_block(res1)))return res2class BertModel(nn.Module):def __init__(self, vocab_size, d_model, seq_len, N_blocks, num_heads, dropout, dff):super().__init__()self.tok_emb = nn.Embedding(vocab_size, d_model)self.seg_emb = nn.Embedding(3, d_model)self.pos_emb = nn.Embedding(seq_len, d_model)self.layers = nn.ModuleList([TransformerEncoderBlock(d_model, num_heads, dropout, dff)for _ in range(N_blocks)])self.norm = nn.LayerNorm(d_model)self.drop = nn.Dropout(dropout)def forward(self, x, seg_ids, mask):pos = torch.arange(x.shape[1])tok_emb = self.tok_emb(x)seg_emb = self.seg_emb(seg_ids)pos_emb = self.pos_emb(pos)x = tok_emb + seg_emb + pos_embfor layer in self.layers:x = layer(x, mask)x = self.norm(x)return xclass BERT(nn.Module):def __init__(self, vocab_size, d_model, seq_len, N_blocks, num_heads, dropout, dff):super().__init__()self.bert = BertModel(vocab_size, d_model, seq_len, N_blocks, num_heads, dropout, dff)self.mlm_head = nn.Linear(d_model, vocab_size)self.nsp_head = nn.Linear(d_model, 2)def forward(self, mlm_tok_ids, seg_ids, mask):bert_out = self.bert(mlm_tok_ids, seg_ids, mask)cls_token = bert_out[:, 0, :]mlm_logits = self.mlm_head(bert_out)nsp_logits = self.nsp_head(cls_token)return mlm_logits, nsp_logitsdef read_data(file):with open(file, "r", encoding="utf-8") as f:data = f.read().strip().replace("\n", "")corpus = re.split(r'[。，“”：；！、]', data)corpus = [sentence for sentence in corpus if sentence.strip()]return corpusdef create_nsp_dataset(corpus):nsp_dataset = []for i in range(len(corpus)-1):next_sentence = corpus[i+1]rand_id = random.randint(0, len(corpus) - 1)while abs(rand_id - i) <= 1:rand_id = random.randint(0, len(corpus) - 1)negt_sentence = corpus[rand_id]nsp_dataset.append((corpus[i], next_sentence, 1)) # 正样本nsp_dataset.append((corpus[i], negt_sentence, 0)) # 负样本return nsp_datasetclass BERTDataset(Dataset):def __init__(self, nsp_dataset, tokenizer: BertTokenizer, max_length):self.nsp_dataset = nsp_datasetself.tokenizer = tokenizerself.max_length = max_lengthself.cls_id = tokenizer.cls_token_idself.sep_id = tokenizer.sep_token_idself.pad_id = tokenizer.pad_token_idself.mask_id = tokenizer.mask_token_iddef __len__(self):return len(self.nsp_dataset)def __getitem__(self, idx):sent1, sent2, nsp_label = self.nsp_dataset[idx]sent1_ids = self.tokenizer.encode(sent1, add_special_tokens=False)sent2_ids = self.tokenizer.encode(sent2, add_special_tokens=False)tok_ids = [self.cls_id] + sent1_ids + [self.sep_id] + sent2_ids + [self.sep_id]seg_ids = [0]*(len(sent1_ids)+2) + [1]*(len(sent2_ids) + 1)mlm_tok_ids, mlm_labels = self.build_mlm_dataset(tok_ids)mlm_tok_ids = self.pad_to_seq_len(mlm_tok_ids, 0)seg_ids = self.pad_to_seq_len(seg_ids, 2)mlm_labels = self.pad_to_seq_len(mlm_labels, -100)mask = (mlm_tok_ids != 0)return {"mlm_tok_ids": mlm_tok_ids,"seg_ids": seg_ids,"mask": mask,"mlm_labels": mlm_labels,"nsp_labels": torch.tensor(nsp_label)}def pad_to_seq_len(self, seq, pad_value):seq = seq[:self.max_length]pad_num = self.max_length - len(seq)return torch.tensor(seq + pad_num * [pad_value])def build_mlm_dataset(self, tok_ids):mlm_tok_ids = tok_ids.copy()mlm_labels = [-100] * len(tok_ids)for i in range(len(tok_ids)):if tok_ids[i] not in [self.cls_id, self.sep_id, self.pad_id]:if random.random() < 0.15:mlm_labels[i] = tok_ids[i]if random.random() < 0.8:mlm_tok_ids[i] = self.mask_idelif random.random() < 0.9:mlm_tok_ids[i] = random.randint(106, self.tokenizer.vocab_size - 1)return mlm_tok_ids, mlm_labelsif __name__ == "__main__":data_file = "4.10-BERT/背影.txt"model_path = "/Users/azen/Desktop/llm/models/bert-base-chinese"tokenizer = BertTokenizer.from_pretrained(model_path)corpus = read_data(data_file)max_length = 25 # len(max(corpus, key=len))print("Max length of dataset: {}".format(max_length))nsp_dataset = create_nsp_dataset(corpus)trainset = BERTDataset(nsp_dataset, tokenizer, max_length)batch_size = 16trainloader = DataLoader(trainset, batch_size, shuffle=True)vocab_size = tokenizer.vocab_sized_model = 768N_blocks = 2num_heads = 12dropout = 0.1dff = 4*d_modelmodel = BERT(vocab_size, d_model, max_length, N_blocks, num_heads, dropout, dff)lr = 1e-3optim = torch.optim.Adam(model.parameters(), lr=lr)loss_fn = nn.CrossEntropyLoss()epochs = 20for epoch in range(epochs):for batch in trainloader:batch_mlm_tok_ids = batch["mlm_tok_ids"]batch_seg_ids = batch["seg_ids"]batch_mask = batch["mask"]batch_mlm_labels = batch["mlm_labels"]batch_nsp_labels = batch["nsp_labels"]mlm_logits, nsp_logits = model(batch_mlm_tok_ids, batch_seg_ids, batch_mask)loss_mlm = loss_fn(mlm_logits.view(-1, vocab_size), batch_mlm_labels.view(-1))loss_nsp = loss_fn(nsp_logits, batch_nsp_labels)loss = loss_mlm + loss_nsploss.backward()optim.step()optim.zero_grad()print("Epoch: {}, MLM Loss: {}, NSP Loss: {}".format(epoch, loss_mlm, loss_nsp))passpass

BERT - MLM 和 NSP

本节代码将实现BERT模型的两个主要预训练任务：掩码语言模型（Masked Language Model, MLM） 和下一句预测（Next Sentence Prediction, NSP）。 1. create_nsp_dataset 函数这个函数用于生成NSP任务的数据集。 def cr…...

编程日记 2025/9/14 5:02:34

mysql 与 sqlite 数学运算精度问题

mysql 与 sqlite 数学运算精度问题在 Excel 中，浮点运算得到的结果可能不准确 https://learn.microsoft.com/zh-cn/office/troubleshoot/excel/floating-point-arithmetic-inaccurate-result 本文讨论 Microsoft Excel 如何存储和计算浮点数。由于存在舍入或…...

编程日记 2025/9/10 14:14:39

MySQL的数据库性能分析利器Percona toolkit

目录简介使用场景使用示例Mysql 慢查询分析诊断临时开启慢SQL持久化开启慢SQL日志使用包管理器安装包管理器安装 percona-release使用相应的包管理器安装 Percona Toolkit pt-query-digest 安装安装 pt-query-digest案例实战之慢查询分析诊断查看慢SQL日志使用pt-query-dige…...

编程日记 2025/9/14 4:57:11

力扣HOT100之链表： 148. 排序链表

这道题直接用蠢办法来做的，直接先遍历一遍链表，用一个哈希表统计每个值出现的次数，由于std::map<int, int>会根据键进行升序排序，因此我们将节点的值作为键，其在整个链表中的出现次数作为值，当所有元…...

编程日记 2025/9/10 6:53:12

Azure AI Foundry 正在构建一个技术无障碍的未来世界

我们习以为常的街道和数字世界，往往隐藏着被忽视的障碍——凹凸不平的路面、不兼容的网站、延迟的字幕或无法识别多样化声音的AI模型。这些细节对某些群体而言，却是日常的挑战。正如盲道不仅帮助视障者，也优化了整体城市体验，信息…...

编程日记 2025/9/13 17:50:34

AlmaLinux9.5 修改为静态IP地址

查看当前需要修改的网卡名称 ip a进入网卡目录 cd /etc/NetworkManager/system-connections找到对应网卡配置文件进行修改修改配置主要修改ipv4部分，改成自己的IP配置 [ipv4] methodmanual address1192.168.252.129/24,192.168.252.254 dns8.8.8.8重启网卡 …...

编程日记 2025/9/14 4:58:26

P8754 [蓝桥杯 2021 省 AB2] 完全平方数

题目描述思路一看就知道考数学，直接看题解试图理解(bushi) 完全平方数的质因子的指数一定为偶数。所以对 n 进行质因数分解，若质因子指数为偶数，对结果无影响。若质因子指数为奇数，则在 x 中乘以这个质因子，保证指…...

编程日记 2025/9/6 13:52:02

【1】创建数据库 #include <QtSql/QSqlDatabase> #include <QtSql/QSqlQuery> #include <QtSql/QSqlRecord> QString path QDir::currentPath(); QApplication::addLibraryPath(pathQString("/release/plugins")); QPluginLoader loader(pathQSt…...

编程日记 2025/8/27 1:23:09

安卓手机怎样开启双WiFi加速

1. 小米/Redmi手机路径： 设置 → WLAN → 高级设置 → 双WLAN加速操作： 开启功能后，可同时连接一个2.4GHz WiFi和一个5GHz WiFi（或两个不同路由器）。可选择“智能选择”或手动指定辅助网络。 2. 华为/荣耀手机…...

编程日记 2025/9/10 4:56:00

基于角色个人的数据权限控制

一、适用场景如何有效控制用户对特定数据的访问和操作权限，以确保系统的安全性和数据的隐私性。二、市场现状权限管理是现代系统中非常重要的功能，尤其是对于复杂的B端系统或需要灵活权限控制的场景，可以运用一些成熟的工具和框架&…...

编程日记 2025/9/14 4:59:59

JAVA虚拟机(JVM)学习

入门什么是JVM JVM：Java Virtual Machine，Java虚拟机。 JVM是JRE(Java Runtime Environment)的一部分，安装了JRE就相当于安装了JVM，就可以运行Java程序了。JVM的作用：加载并执行Java字节码（.class&#…...

编程日记 2025/9/13 18:27:43

【VSCode配置】运行springboot项目和vue项目

目录安装VSCode安装软件安装插件VSCode配置user的全局设置setting.jsonworkshop的项目自定义设置setting.jsonworkshop的项目启动配置launch.json 安装VSCode 官网下载安装软件 git安装1.1.12版本，1.2.X高版本无法安装node14以下版本 nvm安装（github…...

编程日记 2025/9/14 4:59:59

UE5，LogPackageName黄字警报处理方法

比如这个场景，淘宝搜索，ue5 T台，转为ue5.2后，选择物体，使劲冒错。 LogPackageName: Warning: DoesPackageExist called on PackageName that will always return false. Reason: 输入“”为空。 2. 风险很大的删除法&…...

编程日记 2025/9/14 4:59:08

ONVIF/RTSP/RTMP协议EasyCVR视频汇聚平台RTMP协议配置全攻略 | 直播推流实战教程

在现代化的视频管理和应急指挥系统中，RTMP协议作为一种高效的视频流传输方式，正变得越来越重要。无论是安防监控、应急指挥，还是物联网视频融合，掌握RTMP协议的接入和配置方法，都是提升系统性能和效率的关键一步。今天…...

编程日记 2025/9/10 11:45:35

AI 驱动的全链路监控，从资源管理到故障自愈的实战指南--云监控篇

一、3 步完成多云接入，告别繁琐配置 1. 账号绑定 AWS：输入访问密钥，自动拉取 EC2、RDS、S3 等资源清单。 Azure：通过服务主体认证，一键发现 VM、SQL 数据库、存储账户。 GCP：上传服务账号密钥&#xff0…...

编程日记 2025/9/14 5:00:00

大模型在初治CLL成人患者诊疗全流程风险预测与方案制定中的应用研究

目录一、绪论 1.1 研究背景与意义 1.2 国内外研究现状 1.3 研究目的与内容二、大模型技术与慢性淋巴细胞白血病相关知识 2.1 大模型技术原理与特点 2.2 慢性淋巴细胞白血病的病理生理与诊疗现状三、术前风险预测与手术方案制定 3.1 术前数据收集与预处理 3.2 大模…...

编程日记 2025/9/9 15:12:39

Express中间件(Middleware)详解：从零开始掌握(2)

1. 请求耗时中间件的增强版问题：原版只能记录到控制台，如何记录到文件？ 改进点： 使用process.hrtime()是什么？获取更高精度的时间支持将日志写入文件记录更多信息(IP地址、状态码)工厂函数模式使中间件可配置 con…...

编程日记 2025/9/6 6:40:20

Crossmint 与 Walrus 合作，将协议集成至其跨链铸造 API 中

Crossmint 是一个一站式平台，可为 app、AI Agent 或企业集成区块链。如今，Crossmint 已集成 Walrus 协议，以实现更具可扩展性的通证化场景，特别面向 AI Agent 和企业级用户。这项合作为开发者和企业提供了一种全新的方式&#xff…...

编程日记 2025/9/11 1:14:20

24.OpenCV中的霍夫直线检测

OpenCV中的霍夫直线检测霍夫直线检测是一种基于参数变换的全局特征提取方法，它能在边缘图像中有效检测出直线，具有鲁棒性强和对噪声干扰容忍度高的特点。本文将从原理、算法实现和 OpenCV 应用三个角度对霍夫直线检测进行详细的阐述，并给出…...

编程日记 2025/9/12 14:38:26

springboot 处理编码的格式为opus的音频数据解决方案【java8】

opus编码的格式概念： Opus是一个有损声音编码的格式，由Xiph.Org基金会开发，之后由IETF（互联网工程任务组）进行标准化，目标是希望用单一格式包含声音和语音，取代Speex和Vorbis，且适用…...

编程日记 2025/9/12 0:38:25

【AI提示词】创业导师提供个性化创业指导

提示说明以丰富的行业经验和专业的知识为学员提供创业指导，帮助其解决实际问题并实现商业成功提示词 # Role: 创业导师## Profile - language: 中英文 - description: 以丰富的行业经验和专业的知识为学员提供创业指导，帮助其解决实际问题并实现商业…...

编程日记 2025/9/13 1:24:27

STM32 模块化开发实战指南：系列介绍

本文是《STM32 模块化开发实战指南》系列的导读篇，旨在介绍整个系列的写作目的、适用读者、技术路径和每一篇的主题规划。适合从事 STM32、裸机或 RTOS 嵌入式开发的个人开发者、初创工程师或企业项目团队。为什么要写这个系列？在嵌入式开发中，很多人刚开始都是从点亮一个…...

编程日记 2025/9/10 20:55:38

在 Dev-C++中编译运行GUI 程序介绍（三）有趣示例一组

在 Dev-C中编译运行GUI程序介绍（三）有趣示例一组前期见在 Dev-C中编译运行GUI 程序介绍（一）基础 https://blog.csdn.net/cnds123/article/details/147019078 在 Dev-C中编译运行GUI 程序介绍（二）示例&a…...

编程日记 2025/9/10 7:50:51

功能安全时间参数FTTI

FTTI：fault tolerant time interval故障容错时间间隔； FHTI：Fault Handling Time Interval故障处理时间间隔； FRTI：Fault Reaction Time Interval故障反应时间间隔； FDTI：Fault Detectlon Ti…...

编程日记 2025/9/9 19:33:10

docker镜像制作

🧱 如何将任意 Linux 系统打包为 Docker 镜像适用场景：本地物理机 / 虚拟机上的 Linux（如 Ubuntu、Debian、CentOS、openEuler 等）；想将当前系统环境完整打包成 Docker 镜像；系统内已安装了运行环境，如 Java、Python、Nginx 等，想保留它们。✅ 步骤概览：准备文件…...

编程日记 2025/9/10 21:55:54

【Pandas】pandas DataFrame iat

Pandas2.2 DataFrame Indexing, iteration 方法描述DataFrame.head([n])用于返回 DataFrame 的前几行DataFrame.at快速访问和修改 DataFrame 中单个值的方法DataFrame.iat快速访问和修改 DataFrame 中单个值的方法 pandas.DataFrame.iat pandas.DataFrame.iat 是一个快速访…...

编程日记 2025/9/12 3:55:14

【图像分类】【深度学习】系列学习文章目录

图像分类简介图像分类是计算机视觉领域中的一个核心问题，它涉及到将图像数据分配到一个或多个预定义类别中的过程。这项技术的目标是让机器模拟人类能够自动识别并分类图像内容。近年来，随着深度学习的发展，尤其是卷积神经网络(CNNs)的应用…...

编程日记 2025/9/6 17:20:18

MyBatisPlus 学习笔记

文章目录 MyBatisPlus 快速入门第一步：引入 MyBaitsPlus 起步依赖第二步：自定义的 Mapper 继承 BaseMapper 接口新增相关修改相关删除相关查询相关 Mp 使用示例 MyBaitsPlus 常见注解MP 实体类与数据库信息约定Mp 实体类与数据库信息约定不符合解决方法…...

编程日记 2025/9/8 11:54:24

Profibus DP主站如何转Modbus TCP？

Profibus DP主站如何转Modbus TCP？ 在现代工业自动化系统中，设备之间的互联互通至关重要。Profibus DP 和 Modbus TCP 是两种常见的通信协议，分别应用于不同的场景。为了实现这两种协议的相互转换，Profibus DP主站转Modbus TCP网…...

编程日记 2025/8/30 10:54:04

尚硅谷Java第 4、5 章IDEA，数组

第 4 章：IDEA的使用第 5 章：数组 5.1 数组的概述数组(Array)：就可以理解为多个数据的组合。程序中的容器：数组、集合框架（List、Set、Map）。数组中的概念： 数组名下标（或索…...

编程日记 2025/9/9 21:42:10

一些简单但常用的算法记录(python)

1、计算1-2020间的素数个数 def is_composite(num):if num < 1:return False# 从 2 开始到 num 的平方根进行遍历for i in range(2, int(num**0.5) 1):if num % i 0:return Truereturn Falsecnt 0 for num in range(1, 2021):if is_composite(num):cnt 1print(cnt)2、 …...

编程日记 2025/9/8 15:05:07

基于Docker容器的CICD项目Jenkins/gitlab/harbor/Maven实战

一、企业业务代码发布方式 1.1 传统方式以物理机或虚拟机为颗粒度部署部署环境比较复杂，需要有先进的自动化运维手段出现问题后重新部署成本大，一般采用集群方式部署部署后以静态方式展现 1.2 容器化方式以容器为颗粒度部署部署方式简单&#xff0…...

编程日记 2025/9/10 14:51:23

高并发秒杀系统设计：关键技术解析与典型陷阱规避

电商、在线票务等众多互联网业务场景中，高并发秒杀活动屡见不鲜。这类活动往往在短时间内会涌入海量的用户请求，对系统架构的性能、稳定性和可用性提出了极高的挑战。曾经，高并发秒杀架构设计让许多开发者望而生畏，然而&#xff0…...

编程日记 2025/9/13 5:52:55

（十四）安卓开发中的RecyclerView详解

在安卓开发中，RecyclerView 是一个功能强大且灵活的 UI 组件，用于高效地显示大量数据集合，如列表、网格或瀑布流。它是传统 ListView 和 GridView 的现代替代品，提供了更高的性能优化和自定义能力。RecyclerView 的核心优势在于其…...

编程日记 2025/9/11 0:38:50

如何设置Ubuntu服务器版防火墙

在Ubuntu服务器中，默认使用 ufw（Uncomplicated Firewall）作为防火墙管理工具。它是对iptables的简化封装，适合快速配置防火墙规则。以下是设置防火墙的详细步骤： 1. 安装与启用 ufw 安装（通常已预装&…...

编程日记 2025/9/11 4:19:33

根文件系统（rootfs）制作方法（BusyBox、Buildroot、Yocto、Ubuntu Base）

以下是关于根文件系统（rootfs） 制作的四种主流方法（BusyBox、Buildroot、Yocto、Ubuntu Base）的详细教程与对比分析，结合不同场景的需求提供具体实现步骤和关键要点。 1. BusyBox 制作 rootfs 核心特点轻量级&…...

编程日记 2025/9/8 17:45:04

SAP软件FICO各种财务账期的功能用途介绍

FI会计账期一般财务账期总账期间的控制是仅开启当前一个期间，如果月结期间应同时开启结账期间和下一期间两个期间，结账完成需立即关闭已完成结账的期间，避免凭证过账日期误记账。设置事务码：OB52或 S_ALR_87003642 备注&#…...

编程日记 2025/9/8 19:02:00

蓝桥杯C++组部分填空题

P1508 - [蓝桥杯2020初赛] 门牌制作 - New Online Judge #include<bits/stdc.h> using namespace std;int main() {int res 0;for(int i 1; i < 2020; i){int num i;while(num){if(num % 10 2) res;num/10;}}cout<<res;return 0; } 624 P1509 - [蓝桥杯20…...

编程日记 2025/9/12 6:05:06

内联inline

一、什么是 inline？ inline 的本意是： 建议编译器将函数调用处展开成函数体代码，省去函数调用的开销。 inline int square(int x) { return x * x; } 当你调用 square(5) 时，编译器可能会将其替换成 5 * 5，从而避免…...

编程日记 2025/9/10 10:04:12

【models】Transformer 之各种 Attention 原理和实现

Transformer 之各种 Attention 原理和实现本文将介绍Transformer 中常见的Attention的原理和实现，其中包括： Self Attention、Spatial Attention、Temporal Attention、Cross Attention、Grouped Attention、Tensor Product Attention、FlashAttentio…...

编程日记 2025/9/11 15:01:57

基于JavaAPIforKml实现Kml 2.2版本的全量解析实践-以两步路网站为例

目录前言一、关于两步路网站 1、相关功能 2、数据结构介绍二、JAK的集成与实现 1、JAK类图简介 2、解析最外层数据 3、解析扩展元数据和样式 4、递归循环解析Feature 5、解析具体的数据三、结论前言随着地理信息技术的快速发展，地理空间数据的共享…...

编程日记 2025/9/12 17:23:11

Ubuntu搭建Pytorch环境

Ubuntu搭建Pytorch环境例如：第一章 Python 机器学习入门之pandas的使用提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录 Ubuntu搭建Pytorch环境前言一、Anaconda二、Cuda1.安装流程2、环境变量&#…...

编程日记 2025/9/6 8:30:39

Kingbase逻辑备份与恢复标准化实施文档

背景文章背景本文结合实际运维经验，围绕 Kingbase 数据库在逻辑层面的备份与恢复方法进行系统性梳理，旨在为运维人员和数据库管理员提供一套清晰、高效、可落地的操作指引，提升数据库系统的可靠性与容灾能力。第一部分逻辑部分 1.1 全…...

编程日记 2025/9/10 22:32:43

二分查找5：852. 山脉数组的峰顶索引

链接：852. 山脉数组的峰顶索引 - 力扣（LeetCode） 题解： 事实证明，二分查找不局限于有序数组，非有序的数组也同样适用二分查找主要思想在于二段性，即将数组分为两段。本体就可以将数组分为ar…...

编程日记 2025/9/13 4:07:39

解决opencv中文路径问题

见cv_imread函数和cv_imwrite函数 import cv2 import os import matplotlib.pyplot as plt from paddleocr import PaddleOCR, draw_ocr import numpy as np import urllib.parse # Add this import statementfrom txt_get import ImageTextExtractor# 初始化OCR，…...

编程日记 2025/9/10 18:17:10

Redis简介及其在Unity中的应用

一、什么是Redis？ Redis（Remote Dictionary Server）是一个开源的高性能内存数据结构存储系统，常被用于缓存、消息队列、排行榜、会话管理、实时分析等。 ✅ Redis特点基于内存，读写速度极快支持多种数据结构：String、List、Hash、Set、Sorted Set支持持久化，可将…...

编程日记 2025/9/12 15:56:15

Python实现批量插入PostgreSQL数据库的脚本分享

背景上个月排查一个 Bug ，需要采集一张 PostgreSQL 的大表，测试时需要造数据。Python 比 Java 方便多了，所以用 Python写了一个批量插入 PostgreSQL 表的简单脚本。本文分享这个脚本，很简单的，就是利用 psycopg2 的 …...

编程日记 2025/9/11 3:41:51

一键精准采集单网页，告别手动复制粘贴

浏览某个网页时，想抓取其内容，有没有工具能避免自己手动逐个复制粘贴？ 推荐使用单网页一键采集功能，可自动提取网页内容并整理成结构化数据（包括标题、正文、作者、日期、分类、标签、描述和原文网址链接等关键信息&am…...

编程日记 2025/9/10 3:56:39

vue入门：单文件组件数据双向绑定

文章目录单文件组件介绍安装创建项目构建单文件组件数据双向绑定Vue虚拟DOM的作用Vue中key属性的作用单文件组件介绍单文件组件API使用文件扩展名为 .vue 的来构建组件ECMAScript 6 API 安装 Vue CLI 构建Vue -- 安装vue/cli npm install -g vue/cli-- 升级Vue CLI 包…...

编程日记 2025/9/11 0:13:32

接听电话，手机靠近耳朵后拿开，挂断电话，设备自动锁屏

目录一、问题分析/需求分析二、解决方案一、问题分析/需求分析先说一下大致流程：首先是打电话过程会启动PROXIMITY（接近光传感器）用于监听手机是否到耳边，当手机到耳边时进行灭屏处理，灭屏过程中会调用到锁屏，所以最终会导致锁屏详细流程分析：首先根据日志看…...

编程日记 2025/9/3 12:41:46

1. create_nsp_dataset 函数

2. BERTDataset 类

__len__ 方法

__getitem__ 方法

pad_to_seq_len 方法