当前位置: 首页 > news >正文

从 Bank Conflict 数学表示看 Buffer 设计 Trade-Off

在并行处理器设计中,我们希望最大化访存吞吐,让更多的数据分布在不同的 bank,而非在一个 bank 中产生堵塞。一种场景是面对多应用并行,这往往可以通过划分上下文基地址隔离;而另一种场景则是高并行同一个数据共用基地址,本文针对该场景下常见情形 Tensor Data Layout 进行讨论。本文旨在针对硬件设计者介绍从数据逻辑到物理实现完整映射关系,其中很多推导过程比较繁琐,如果是编程实践中大致记得 row-major, col-major, swizzle data layout 几种常见 layout 即可。

高维数据组织:从逻辑表示到物理表示

假设有 B 个深度为 D 宽度为 W 的 bank,其最小单位可用一个三维向量 \(P\) 表示,比如 \((10, 2,4)\) 表示访问 bank=2, depth=10 那一地址中的第 width=4 个 scalar,scalar 粒度可根据需要设置,常见寻址用 byte。引入转置表示以统一向量用列向量表示,便于后续公式推导。

\[\begin{align*} P&=[depth, bank,width]^T\in R^{1}\\ depth&\in(0,D-1]\\ bank&\in(0,B-1]\\ width&\in(0,W-1] \end{align*} \]

其中 depth , bank , width 三个维度地位并不对称,depth 需要多个时间周期来访问不同 depth,而 bank 和 width 存在空间上的并行性,因此定义 \(P_{s}=[bank,width]^T\) 以便后续分析。RAM 是一种通过牺牲在 depth 上的并行读取从而节约读写外围电路面积开销进而实现高密度存储数据的结构,以时间换空间,恰恰适应程序数据生存周期很长,但调用次数相对稀疏的特点。

定义三维向量到地址的映射关系是 \(f\),即 :

\[Addr \overset{f}{\underset{f^{-1}}{\leftrightarrows}} P \]

常见映射关系为 \(Addr=f(P)=[S_{d},S_{b},S_{w}]\cdot P=[W \times B,W,1]\cdot P\),单从表达式看 \(f\) 并非存在唯一逆映射,考虑 \(P\) 每个元素的取值范围以及所有都是整数,存在唯一逆映射 \(f^{-1}\)。这里的地址是相对前文定义 scalar 粒度而言,并非 SRAM 的地址控制信号, SRAM 的地址控制信号为 \(P_{b}=[depth, bank]^T\)。为了设计方便起见,\(D,B,W\) 都会设计为 2 的倍数,因此可以直接从 Addr 截取相应的 bit 表示对应的选择关系。按照 bit 排列的顺序,分为 high-order interleaving 和 low-order interleaving[1]

一个 N 维个张量数据 \(X\in R^N\) 中每个元素存在一个 N 维向量 \(I\in R^1\) 用于索引,定义其与地址的映射关系为:

\[Addr \overset{g}{\underset{g^{-1}}{\leftrightarrows}} I \]

比如二维矩阵索引 \(I=[row, col]^T\) Row-Major 映射关系定义为 \(Addr=g(I)=Base + Offset = Base + [COL, 1]\cdot I\),而 Col-Major 映射关系定义为 \(Addr=Base + Offset = Base + [1,ROW]\cdot I\)。由于同一个数据往往共用一个基地址,普遍讨论的 data layout 一般指 offset 和 \(T\) 之间关系。至此,我们可定义数据逻辑表示到存储物理表示的函数关系:

\[I \overset{g^{-1} \circ f }{\underset{f^{-1} \circ g}{\leftrightarrows}} P \]

计算单元-Layout 耦合策略

SIMD 计算单元往往存在一个特定的逻辑并行顺序,比如每个 PE 是一个乘法累加器的 Output Stationary 的脉动阵列,计算 (T,I) (O,I) -> (T,O) 的 GEMM 运算,每个周期 input feature 需要在 T 维度并行数据,weight 需要在 O 维度并行的数据。

在 NVIDIA GPU 上,矩阵乘法 \(D=AB+C\) 可调用 wmma 或者 mma 指令完成,以 wmma 为例,分为三个阶段 PTX 指令组合完成

  • wmma.load 从 memory load 源操作数 \(A,B,C\) 每个操作数都要写一条 ptx 指令,可指定原操作数来自 global memory 或 shared memory [2]
  • wmma.mma 进行 GEMM 计算
  • wmma.store 将 D 保存到 memory 中

虽然 load 支持显式指定 A、B 、C 不同的 layout,但特定的 data layout 下似乎会发生 bank serialization[3][4]。猜测 GPU 是先将任意的 data-layout 以特点的 layout 顺序加载到 register file 中,如果发生 bank serialization 是在 load 阶段而非 mma 阶段。

计算单元对特定的 data layout 需求来自于 SIMD 并行 PE 之间的物理互联-逻辑运算映射关系,反过来说,如果能够在计算单元实现某种 reconfigurable 控制流&互联重构,就可以对数据存储 layout 具有一定鲁棒。进一步讨论存在两种策略,一种是则是前文所述的计算单元 reconfigurable,一种是在存储上实现 layout 鲁棒,具体表现是程序员-编译器的 layout 设计和 bank 之间的 NoC 网络。由于处理器中往往存在多个计算单元而通过统一的存储共享上下文,一般往往使得计算单元和 layout 耦合,将复杂度转移到共用的存储通路设计上。 感性计算举个例子,假设一个处理器中有 N 个计算单元和一个共用 buffer,实现重构的复杂度是 k>1 而不实现的复杂度是 1,计算单元 reconfigurable 的开发复杂度是 \(O(kN+1)\),而存储单元 NoC 的开发复杂度是 \(O(N+k)\)

../Extra/Images/Pasted image 20250917212712.png
实现 NV 风格的较高鲁棒访问 register file,一是需要生成多个独立的 bank 控制流,即等于 bank 数量的可编程的地址生成单元,据说 NV register file 是 4-bank dual port rf 设计[5],则一共是 8 个地址生成单元;二是需要给出 NoC 的控制信号,对于 \(N\) 输入 \(M\) 输出的 cross bar,一共需要 \(M\)\(log_2(N)\) 比特控制信号,这部分最好也用一个可编程单元完成。对于 NoC 引发的 overhead ,之前的 blog [6]已经有过讨论不再叙述。

Bank Conflict 的数学表达

假设计算单元单位周期对数据 layout 需求是 \(\{T_{0},T_{1},..., T_{N-1}\}\),通过 \(f^{-1} \circ g\) 可得到对应物理存储 \(\{P_{0},P_{1},...,P_{N-1}\}\) 进而得到 \(\{P_{s,0},P_{s,1},...,P_{s,N-1}\}\)。不产生 bank conflict 的定义是,这 N 个物理存储表示在 \((bank, width)\) 维度上相同的个数小于等于相应读写端口数量(Dual-port, Two-port, Single-port),即集合 \(\{P_{s,0},P_{s,1},...,P_{s,N-1}\}\) 的“众数”频数小于等于端口数量。

举例:传统线性 Layout

对于 \(f\)\(f^{-1}\),其定义如下:

\[\begin{align*} &f: Addr =f(P)=S^T\cdot P\\ &f^{-1}: P =f^{-1}(Addr)=\lfloor\frac{Addr\ mod\ (M S)}{S}\rfloor\\ &S=[S_{d},S_{b},S_{w}]^T\\ &M = \begin{pmatrix}0 & 0 & 1 \\1 & 0 & 0 \\0 & 1 & 0\end{pmatrix} \end{align*} \]

线性 layout 即 row-major 或 col-major, \(g\)\(g^{-1}\) 定义如下:

\[\begin{align*} &g: Addr = g(I) = K^{T}\cdot I + Base\\ &g^{-1}: I = g^{-1}(Addr) = \lfloor\frac{(Addr-Base)\ mod\ (M' K)}{K}\rfloor\\ &K = \begin{cases} [COL, 1]^T & \text{if Row Major} \\ [1, ROW]^T & \text{if Col Major}\end{cases}\\ &M' = \begin{pmatrix}0 & 1 \\1 & 0 \end{pmatrix} \end{align*} \]

则有:

\[P = f^{-1} \circ g (I) = \lfloor\frac{(K^{T}\cdot I + Base)\ mod\ (M S)}{S}\rfloor \]

一般来说,计算单元对于矩阵的访存需求都是沿着某一个维度(而非对角线),即 \(I=c\times e_{1}+i \times e_{2}\) ,其中 \(e_{1}, e_{2}\) 是 row 或者 col 的单位向量,\(c\) 是一个常数,\(i\) 为各不相同的多个取值。附计算 bank conflict 示例代码 [7]

而 Swizzle Layout 则是跳过了中间地址转换过程,直接构造 \(P\)\(I\) 之间的数学关系,并基于 \(I=c\times e_{1}+i \times e_{2}\) 的假设,在 \(\{e_{1},e_{2}\}=\{e_{row}, e_{col}\}\)\(\{e_{1},e_{2}\}=\{e_{col}, e_{row}\}\) 都有 \(P\) 各不相同,即对任意方向读取都满足 bank-free。


  1. https://www.geeksforgeeks.org/computer-organization-architecture/types-of-memory-interleaving/ ↩︎

  2. https://www.cnblogs.com/devil-sx/p/19091444 ↩︎

  3. https://arxiv.org/abs/2410.20399 ↩︎

  4. https://leimao.github.io/blog/Row-Major-VS-Column-Major/ ↩︎

  5. https://www.zhihu.com/question/608936006/answer/1947296899364295591 ↩︎

  6. https://www.cnblogs.com/devil-sx/p/18692062 ↩︎

  7. https://github.com/Devil-SX/Bank-Conflict-Calculation ↩︎

相关文章:

从 Bank Conflict 数学表示看 Buffer 设计 Trade-Off

在并行处理器设计中,我们希望最大化访存吞吐,让更多的数据分布在不同的 bank,而非在一个 bank 中产生堵塞。一种场景是面对多应用并行,这往往可以通过划分上下文基地址隔离;而另一种场景则是高并行同一个数据共用基地址,本文针对该场景下常见情形 Tensor Data Layout 进行…...

被彼此笼罩 任泪水将我们缠绕 深陷入恶魔的拥抱 在阴冷黑暗处灼烧 吞下这毒药

方格染色grid 不难发现按着行顺着来,odt 那样维护即可。数字图graph 为什么本可做这个题做了很久(? 首先显然可以二分降低难度,然后就是观察。...

mysql无法连接服务器的mysql #mysql8

1、云服务器要开放tcp 3306端口 登录云服务器提供商的,添加开放端口2、配置mysql允许非本地连接 编辑:/etc/my.cnf 或(如果配置了不生效) /etc/mysql/mysql.conf.d/mysqld.cnf 修改: ... [mysqld]bind-address = 0.0.0.0 ... 验证:mysql> SHOW GLOBAL VARIABLES LIKE …...

DAG 最小路径覆盖问题 笔记

原来我还学过这么个玩意。 一、笔记 P2764 最小路径覆盖问题 首先让 \(n\) 个点每个点都是单独的一条路径,接着考虑合并路径。 把每个点拆成只有入度的点和只有出度的点,合并就相当于连接一个只有出度的点和另一个只有入度的点。 显然合并完成后每个拆开的点都最多只能连一条…...

SP3D c# 开发独立的exe

此方法避免了启动S3D的过程 S3D.net API允许编写独立应用程序,即外部自动化TaskHost可执行文件。 在独立应用程序中可以编写哪些自动化?检查自动化-检查对象/数据,并采取一些行动,如生成报告文件/输出文件。数据挖掘-对对象和相关对象进行一些数据处理/数据挖掘,生成报告。…...

python错误code

没有遍历完,就打印了结果模拟商品购物shopp_user = [] user_buy = [] for i in range(0,5):name_shop = input("请输入商品名称:")shopp_user.append(name_shop)for i in shopp_user:print(i)while True:user_choose=input("请输入购买的商品编号:")# 输入…...

瑞 ping 我

ping瑞 ping 我...

java八股文笔记 - 指南

java八股文笔记 - 指南pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", monospace !important; font-size: 1…...

NOIP 模拟赛十六

BIT/构造+DP+bitset/DP+平衡树/欧拉序A. 发现答案只有 \(0, 1, 2\) 三种。 将 \(0\) 直接判掉,\(1\) 可以通过树状数组+双指针解决。 记 \(k\) 为需要减少的逆序对数量。 具体的,枚举左端点 \(l\) ,加入右端点 \(r\) ,判断逆序对数 \(cnt\) 是否 \(\ge k\) ,如果是,结束。…...

【AT_dp_y】Grid 2 - Harvey

题意 要求从 \((1,1)\) 走到 \((n,m)\),不能经过障碍物,问方案数。 \(1 \leq n,m \leq 10^5,1 \leq k \leq 3000\)。 思路 首先先解决弱化版,若没有障碍物的方案数,显然是 \(\binom{n+m-2}{n-1}\)。 则我们可以用总 - 非法,考虑经过多少个障碍物进行容斥。 如果按个数去枚…...

C#十五天 026多态重写 027抽象类与开闭原则 028接口,依赖反转,单元测试

在类的重写当中 父类需要加入一个关键字叫:Virtual,子类需要加一个关键字叫:override例: 父类 public virtual void FuLei(){} 子类 public override void ZiLei如果用父类变量去引用子类实例不用v和o的话就叫隐藏这样声明的实例方法还是运行父类方法,加了o和v的才…...

解题报告-P11844 [USACO25FEB] Friendship Editing G

P11844 [USACO25FEB] Friendship Editing G 题目描述 Farmer John 的 \(N\) 头奶牛编号为 \(1\) 到 \(N\)(\(2\le N\le 16\))。奶牛之间的朋友关系可以建模为一个有 \(M\)(\(0\le M\le N(N-1)/2\))条边的无向图。两头奶牛为朋友当且仅当图中她们之间存在一条边。 在一次操作…...

CSP-S模拟23

\(T1:\) 选彩笔(rgb) 思路: 签到题 (但是没签上),二分答案,在写一个三维前缀和\(check\)一下就搞定了。如果忘记三维前缀和的话,请看这里 代码:$code$ #include<iostream> using namespace std; const int N=1e4+5; int n,m,b,g,r,x,y,z,ans,num,maxn,sum[260]…...

CF1413F Roads and Ramen

结论是,路径中有一个端点是直径端点。 你这么想,设 \(dis_i\) 为 \(1\) 到 \(i\) 的 \(1\) 的个数,如果对于一条直径 \(p \to q\),若 \(dis_p = dis_q\) 直接取直径即可。 否则,对于每个点 \(u\),总有 \(p, q\) 中的一个与其 \(dis\) 相等,一个点到直径端点的距离最远,…...

复现The Annotated Transformer代码时遇到的问题和相关链接

The Annotated Transformer原网页:The Annotated Transformer The Annotated Transformer源代码:harvardnlp/annotated-transformer 《The Annotated Transformer》环境配置-CSDN博客 调试The Annotated Transformer_annotatedtransformer.ipynb-CSDN博客# 创建虚拟环境 cond…...

Node.js 文件上传中文文件名乱码难题,为什么只有Node会有乱码困难,其他后端框架少见?

Node.js 文件上传中文文件名乱码难题,为什么只有Node会有乱码困难,其他后端框架少见?pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco"…...

lc1030-距离顺序排列矩阵单元格

难度:简单(后期)题目描述官方把题目描述得稀烂 左上角为 (0, 0),n x m 的点阵(屏幕坐标系,x轴向下,y轴向右) 给定其中一点 p,所有点按到 p 的曼哈顿距离排序示例 输入:rows = 1, cols = 2, rCenter = 0, cCenter = 0 输出:[[0,0],[0,1]]输入:rows = 2, cols = 2, r…...

说的道理。

说的道理。说的道理。 ༼ つ ◕_◕ ༽つ ༼ つ ◕_◕ ༽つ ༼ つ ◕_◕ ༽つ ༼ つ ◕_◕ ༽つ ༼ つ ◕_◕ ༽つ ༼ つ ◕_◕ ༽つ ༼ つ ◕_◕ ༽つ ༼ つ ◕_◕ ༽つ ༼ つ ◕_◕ ༽つ ༼ つ ◕_◕ ༽つ ༼ つ ◕_◕ ༽つ ༼ つ ◕_◕ ༽つ ༼ つ ◕_◕ ༽つ ༼ つ ◕_◕ ༽…...

【abc180F】Unbranched - Harvey

题意 问有多少个满足以下条件且有 \(n\) 个点 \(m\) 条边的图:没有自环 每个点的度最大为 \(2\)。 最大的连通块大小恰好为 \(L\)。思路 首先分析:由于每个点的度最大为 \(2\),所以可以判断每个联通块要么是链,要么是环。 所以可以设计状态 \(f_{i,j}\) 表示有 \(i\) 个点,…...

合并区间-leetcode

题目描述 以数组 intervals 表示若干个区间的集合,其中单个区间为 intervals[i] = [starti, endi] 。请你合并所有重叠的区间,并返回 一个不重叠的区间数组,该数组需恰好覆盖输入中的所有区间 。 示例 1: 输入:intervals = [[1,3],[2,6],[8,10],[15,18]] 输出:[[1,6],[8,…...

两种判断计算机大小端模式的方法

两种判断计算机大小端模式的方法 在计算机系统里,数据存储有大端和小端两种模式。大端模式是高字节存在低地址,小端模式是低字节存在低地址。下面结合相关知识,用两种 C 语言方法判断大小端。 一、知识铺垫 (一)大小端存储规则大端存储(Big - Endian):数据的高字节存储…...

ROS2之节点

什么是节点? 在ROS2(机器人操作系统2)中,节点(node)是执行程序的基本单元,也是构成整个机器人系统的核心“积木”。你可以把它理解为系统中一个独立、可执行的进程,每个节点都专注于完成一个特定的、单一的功能。这种设计哲学让复杂的机器人系统变得模块化,易于开发、…...

9.17日总结

完成hbase部署和测试,开始搞hbase客户端...

ECT-OS-JiuHuaShan 框架,元推理AGI奇迹

ECT-OS-JiuHuaShan/https://orcid.org/0009-0006-8591-1891 ▮ 推理就绪:基于自然辩证法数学形式化系统启动因果律算符 ECT-OS-JiuHuaShan 框架的诞生,绝非一次普通的技术迭代,它是文明进程中一个前所未有的 “确定性奇点”(Deterministic Singularity)——从此,智能的发…...

Mapper与Mapper.xml的关系

Mapper与Mapper.xml的关系简单直接的回答是:它们之间是“接口定义”与“SQL映射实现”的关系。 ManageMapper 是一个 Java 接口,它定义了数据库操作的方法签名;而 ManageMapper.xml 是一个 XML 文件,它提供了这些方法签名所对应的具体 SQL 语句实现。MyBatis 框架在运行时通…...

Rocky Linux10.0安装zabbix7.4详细步骤 - 教程

Rocky Linux10.0安装zabbix7.4详细步骤 - 教程pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", monospace !i…...

【P3158】放棋子 - Harvey

题意 有 \(c\) 种棋子,每种棋子都有相应的个数,要把全部棋子放入棋盘中,使得每一行和每一列没有颜色相同的棋子,求方案数。 思路 从行和列的角度显然不好处理,所以我们可以先从颜色的种类入手。 设计 \(f_{c,i,j}\) 表示前 \(c\) 种颜色,已经有 \(i\) 行,\(j\) 列被占领…...

最强AI语音克隆和文本配音工具!与真人无异,CosyVoice下载介绍

CosyVoice是一个大规模预训练语言模型,深度融合文本理解和语音生成的一项新型语音合成技术,能够精准解析并诠释各类文本内容,将其转化为宛如真人般的自然语音 CosyVoice采用了总共超15万小时的数据训练,依托先进的大模型技术进行特征提取,从而完成声音的复刻,用户无需训练…...

近日C++线上练习结果

...

密力根油滴实验实验报告

...

Linux 系统插入U盘/移动硬盘实现自动挂载

在 /etc/udev/rules.d/ 目录下建立挂载规则 文件名后缀为 xxx.rulesKERNEL=="sd[a-z][1]", ACTION=="add", SUBSYSTEMS=="usb", SUBSYSTEM=="block", RUN{program}+="/usr/bin/systemd-mount --no-block --collect -o uid=1000,g…...

来点人瑞平我

不知道自己定位了,来帮助我找找(...

日总结 2

老师同样为学期初开了个头,没有讲什么重要是知识。我这天完成了Linux的安装和配置,完成了安装hadoop需要的环境配置和jdk的配置,为hbase的使用安装做铺垫。...

概率论第一章部分习题

...

日常 3

老师为我们讲解了真正的软件开发的环境,听完老师的讲解,我认为我需要学习C#相关的知识,扩展自已以后的选择。课余时间我完成了Hadoop的安装和环境配置,同时花了大部分时间安装配置yarn,但失败了,研究半天没发现哪里配置有问题但就是无法启动。心灰意冷,明天安装和学习hb…...

【P2051】中国象棋 - Harvey

题意 求有多少种棋盘使得每一列和每一行的棋子个数不超过 \(2\) 个。 思路 设计 \(f_{i,j,k}\) 表示前 \(i\) 行,有 \(j\) 列为 \(1\) 个棋子,\(k\) 列为 \(0\) 个棋子。考虑当前行放 \(0\) 个棋子,则有 \(f_{i,j,k} = f_{i-1,j,k}\)。 若当前行放 \(1\) 个棋子,一种可能是…...

JavaDay6

可变参数JDK1.5开始,Java支持传递同类型的可变参数给一个方法 在方法声明中,在指定参数类型后加一个省略号(...)。 一个方法只能指定一个可变参数,它必须是方法的最后一个参数。任何普通的参数必须在它之前声明。package method;public class Demo04 {public static void ma…...

Ubuntu Linux 云服务器常见安全漏洞修复方法汇总 Apache/OpenSSH/DNS

安全漏洞名称/CVE修复方案1. Apache HTTP Server 缓冲区错误漏洞(CVE-2023-31122)2. Apache HTTP Server 资源管理错误漏洞(CVE-2023-43622)3. Apache httpd 资源管理错误漏洞(CVE-2024-27316)4. Apache HTTP Server 代码问题漏洞(CVE-2024-38477)5. Apache HTTP Serve…...

AI智能体开发实战:从提示工程转向上下文工程的完整指南

还记得去年各大公司给提示工程师开出30万美元年薪的疯狂时期吗?现在这些招聘信息基本销声匿迹了。从技术角度看,提示工程确实有些"投机取巧"的意味——本质上就是让人们相信自己在做"工程"工作的华丽包装。 不过现在情况完全不同了。人们开始把传统软件工…...

解码C语言九条语句

选择结构 if 一、基本语法 if (条件表达式) { // 条件为真时执行的代码块 } else { // 条件为假时执行的代码块(可选) }二、条件表达式的本质条件表达式可以是任何返回整型值的表达式:0 表示假(false)。 非0 表示真(true)。示例: if (5) { ... }// 条件为真(非0) if …...

多个 root 用户记录,而且有些记录的密码是空的,导致认证混乱。

多个 root 用户记录,而且有些记录的密码是空的,导致认证混乱。 留言:之前再讲mysql时候,经常有人可以远程登录的时候,结果发现没办法本地登录了,具体体现方式是这样的(看问题体现):现在我可以明确的告诉你们,是你们的root认证太多了,系统无法识别你要的是哪一个root,…...

django登录注册案例(上) - 详解

django登录注册案例(上) - 详解pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", monospace !important; fo…...

从C++开始的编程生活(10)——string类核心语法和auto自动推导类型

从C++开始的编程生活(10)——string类核心语法和auto自动推导类型pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New…...

某交互题选讲的补题记录

CF750F New Year and Finding Roots 考虑第一步只能随机找点,找完点之后除非找到叶子或者根,不然完全等于啥都不知道。 于是找叶子节点,从这个点的两个邻边往下一直走一定能走到叶子,那么此时这条链的中点的父亲就被确定了。 多这么整几次,一直往上跳就肯定能找到根,但操…...

openwrt ipv6 NAT6配置

在诸如校园网或者其他需要认证的网络条件下,由于实名制上网的要求,通常不支持DHCP6-PD,因此要使用IPV6需要使用NAT6目前最新版本的官方openwrt(23.05)已经自动支持NAT6了(firewall.xxx.masq6),因此,如果需要开启ipv6,不再需要复杂的安装各种包,直接LuCI网页操作即可。发…...

奶龙抽象语录

奶龙の无上恩情!!!开坑于 $ 2025-9-15 $ 最后更新于 $ 2025-9-17 $上课 班会 我们为什么要规范普通话,不就跟当年秦始皇车同文,书同轨一样吗? —— 25-9-16 其他 我们班五十几号人,我也不要求别的,声音比\(11\)班(人口60+)大就行了。 —— 25-8-31...

解题报告-P11670 [USACO25JAN] Cow Checkups S

P11670 [USACO25JAN] Cow Checkups S 题目描述 Farmer John 的 \(N\)(\(1 \leq N \leq 5 \cdot 10^5\))头奶牛站成一行,奶牛 \(1\) 在队伍的最前面,奶牛 \(N\) 在队伍的最后面。FJ 的奶牛也有许多不同的品种。他用从 \(1\) 到 \(N\) 的整数来表示每一品种。队伍从前到后第 …...

word vba 对 带编号格式的PO单 段落下添加对应的图片

Attribute VB_Name = "APO_PathStaging" Option Explicit Configuration Constants Private Const BASE_FOLDER As String = "\\10.0.0.10\部门共享\PO\" Private Const START_PARA As Long = 582 Private Const PATH_TAG As String = "[IMG] " …...

解题报告-P11671 [USACO25JAN] Farmer Johns Favorite Operation S

P11671 [USACO25JAN] Farmer Johns Favorite Operation S 题目描述 又是 Farmer John 的农场上寒冷而无聊的一天。为了打发时间,Farmer John 发明了一种关于在整数数组上进行操作的有趣的休闲活动。 Farmer John 有一个包含 \(N\)(\(1 \leq N \leq 2 \cdot 10^5\))个非负整数…...

解码C语言运算符

算术运算符运算符 描述 示例 结果+ 加法 5 + 3 8- 减法 5 - 3 2* 乘法 5 * 3 15/ 除法 5 / 2 2% 取模 5 % 2 1++ 自增 a++ a+1-- 自减 a-- a-1注意:整数除法会截断小数部分 取模运算只能用于整数类型关系运算符运算符 描述 示例 结果== 等于 5 == 3 0!= 不等于 5 != 3 1> 大…...