当前位置：首页 > news >正文

RNope：结合 RoPE 和 NoPE 的长文本建模架构

news 来源：原创 2025/8/9 4:47:38

TL;DR

2025 年 Cohere 提出的一种高效且强大的长上下文建模架构——RNope-SWA。通过系统分析注意力模式、位置编码机制与训练策略，该架构不仅在长上下文任务上取得了当前最优的表现，还在短上下文任务和训练/推理效率方面实现了良好平衡。

Paper name

Rope to Nope and Back Again: A New Hybrid Attention Strategy

Paper Reading Note

Paper URL:

https://arxiv.org/pdf/2501.18795

Introduction

背景

现有的基于 RoPE 的方法在处理进一步扩展的上下文长度时表现出一定的性能局限。
Query-Key Normalization（QK-Norm）被提出用于改善训练稳定性，该方法在计算注意力前对查询-键向量在头维度上进行归一化处理。虽然 QK-Norm 缓解了训练过程中的数值不稳定性并被广泛采用，但它可能削弱模型的长上下文建模能力。
“无位置嵌入”（NoPE）的提出，认为移除显式的位置嵌入、仅依赖因果掩码带来的隐式位置信息，反而可能提升长上下文的表现。

本文方案

首先分析不同注意力机制（包括 NoPE 和 QK-Norm）在训练至 7500 亿 token 后的注意力模式及其对长上下文性能的影响
提出了一种结合 RoPE 和 NoPE 的新架构——RNoPE 。该架构不仅在长上下文任务上超越了传统的基于 RoPE 的 Transformer 模型，同时在较短上下文需求的基准测试中也表现出具有竞争力的性能。

Methods

实验配置

模型架构，参数总量为80亿（包括词嵌入参数）
模型训练分为两个阶段：预训练阶段和监督微调（SFT）阶段。
- 在进行长上下文评估时，SFT阶段是必要的，因为它可以降低长上下文任务中的方差，并使仅通过预训练无法显现的长上下文能力得以展现
测试的三种模型变体如下：
- RoPE 模型：该变体使用旋转位置嵌入（Rotary Position Embedding, RoPE）来编码位置信息。在预训练阶段，RoPE 参数 θ 设置为10,000；在随后的SFT阶段，θ 被提升至200万，以适应更长的上下文长度。该变体作为基线模型，其架构与大多数现有模型相似。
- QK-Norm 模型：在执行RoPE中的角度旋转之前，对查询向量和键向量分别应用层归一化（Layer Normalization）。除归一化操作外，其他超参数（包括θ值和训练方法）均与RoPE变体保持一致。
- NoPE 模型：已有研究表明，不使用位置嵌入（NoPE）的Transformer变体在长上下文任务中仍可有效运行。然而，这些模型在训练序列长度内的困惑度（perplexity）和下游任务表现通常较差。在我们的研究中，NoPE变体未使用QK-Norm，其余训练方法与上述两种变体相同。

评估与注意力分析

RoPE 和 QK-Norm 变体在标准基准上的表现相当，而 NoPE 变体则相对落后，这与先前研究结果一致
在长上下文评估中，QK-Norm 表现最差，尽管它在其他能力上表现尚可

注意力模式分析

为了探究不同架构的影响，对各模型内部的注意力模式进行了分析
继续使用 NIAH 任务，将上下文划分为四个部分
- 前10个token（begin）
- 针句token（needle）
- 一般上下文token（context）
- 问题/补全token（qc）
对于每个模型，我们首先计算“qc”查询token与所有四个段落的键token之间的注意力分数。注意力分数在每个段内进行求和，然后在所有注意力头和层之间进行聚合，以获得每个段的平均注意力分数。这些分数进一步在多个样本上按序列长度（8000、32000、128000 token）进行平均。我们称这一指标为“注意力质量”（attention mass），结果见表3。
- 随着序列长度增加，所有变体在“针”token上的注意力质量都在下降，表明相关信息的检索难度随上下文增长而增大。
- 在同一上下文长度下，NoPE 变体对“针”的注意力质量最高，其次是 RoPE，而 QK-Norm 最低。
- QK-Norm 在 “开头token” 上的注意力质量极低，而在“噪声上下文”上的注意力质量较高，这与其在 NIAH 任务中相对较差的表现一致。QK-Norm 中的归一化操作削弱了 Query 与 Key 向量点积中的幅度信息，导致注意力 logit 更接近且分布更平坦。

混合模型（Hybrid Model）

提出了一种结合 RoPE 和 NoPE 的新架构——RNoPE，以融合两种方法的优势。将两者结合有望在保持长上下文能力的同时提升整体性能。

NoPE 能够通过向量相似性实现高效的信息检索
RoPE 则能够显式建模位置信息和“最近性偏置”（recency bias）

实现方式：在模型中交替使用 NoPE 层和 RoPE 层：在一个层中应用 NoPE，在下一层中应用 RoPE

RNoPE 训练与评估

预训练阶段 RoPE 参数 θ 统一设为 10,000。随后我们进行多轮微调，分别尝试了不同的 θ 值：10,000、100,000、200万和400万，以评估不同配置下的模型表现。
将该变体称为 RNoPE 变体，并根据 SFT 阶段使用的 θ 值分别命名为：
- RNoPE-10k（θ = 10,000）
- RNoPE-100k（θ = 100,000）
- RNoPE-2M（θ = 2,000,000）
- RNoPE-4M（θ = 4,000,000）

在序列长度为 128,000 的 NIAH 任务上报告针句得分，并计算各变体的注意力质量（attention mass），结果见表4。注意力质量分别对所有 RoPE 层和 NoPE 层进行聚合。

随着 SFT 阶段 RoPE 参数 θ 的增加，模型的长上下文能力反而下降。这与之前纯 RoPE 模型中的观察相矛盾：在那些模型中，更大的 θ 值通常有助于提升长上下文性能，并扩展注意力机制的有效感受野
NoPE 层的表现
- 表现出强大的信息检索能力，表现为在针句 token 上注意力质量显著增强
- 在开头 token 上出现明显的 attention sink 现象
- 相较于纯 RoPE 或纯 NoPE 模型，其 recency bias 更弱
RoPE 层的表现
- 检索能力极弱，针句和开头 token 的注意力质量都很低。
- 几乎没有 attention sink 现象。
- 却展现出比纯 RoPE 模型更强的 recency bias。
不同 θ 值的影响：
- 随着 θ 增大，RoPE 层的 recency bias 减弱，表现为对 qc token 的注意力质量下降。
- 这与已有研究一致：增大 θ 会扩展注意力机制的有效感受野，使注意力分布更平坦
- RoPE 层感受野的扩大引入了噪声，干扰了后续 NoPE 层进行相似度计算和信息检索的能力，最终导致针句得分下降。

在这里插入图片描述

【结论】

NoPE 与 RoPE 层的组合具有协同优势：
- NoPE 层擅长全局信息检索；
- RoPE 层则因具备 recency bias 而适合处理局部上下文信息。

改进方案：RNoPE-10k-swa

基于上述洞察，我们提出了一个新的变体：RNoPE-10k-swa ，其中 “swa” 表示滑动窗口注意力（Sliding Window Attention）。

具体做法是：
- 对 RoPE 层设置硬性的注意力窗口大小（设为 8,192），从而限制其有效注意力范围；
- 同时保留 NoPE 层的全注意力机制，用于长上下文信息检索；
- 其他训练参数与 RNoPE-10k 保持一致，包括 θ 值不变。
变体取得了显著改进：
- 在 128,000 token 长度下的 NIAH 得分达到 9.562 ，明显优于基线模型和原始 RNoPE-10k；
- NoPE 层展现出结构清晰的注意力模式，表明其具备强大的长上下文检索能力。

模型架构

在 Command R+ 架构（Cohere For AI, 2024）的基础上进行了以下关键架构设计选择：
- 移除 QK-Norm 组件：由于其注意力模式不佳，严重影响长上下文性能，因此我们决定不再使用 Query-Key Normalization。
- 引入全注意力范围的 NoPE 层：通过在部分层中使用无位置嵌入（NoPE）机制，增强模型对长距离信息的检索能力。
- 对 RoPE 层应用滑动窗口机制：设置 RoPE 层的滑动窗口大小为 4,096，利用 RoPE 固有的“最近性偏置”（recency bias），提升模型在中短上下文范围内的表现。
- 全注意力层与滑动窗口层交错比例为 1：3

Experiments

标准基准任务

RNope-SWA 在长上下文任务上显著优于基线模型，同时在短上下文任务中也保持竞争力，实现了效率与性能之间的良好平衡。
- 在 MMLU 上提升 +2.0%，在 GSM8k 上提升 +1.8%；
长文本下的检索能力， NIAH 任务（Needles-in-a-Haystack）
- 虽然两个模型在训练见过的上下文长度内都能接近满分，但 RNope-SWA 具有更强的外推能力
- 在 256k 上下文长度下，RNope-SWA 几乎没有性能下降，而 Baseline 即使使用了 θ=8,000,000 的 RoPE 参数，也表现出显著的性能退化

Ruler 基准任务（检索与问答）

Ruler 是比 NIAH 更具挑战性的任务集合，包含多查询/键/值设置、长上下文问答等；

Baseline 在超过 64k 的上下文长度后性能急剧下降
- 在 8k 到 256k 的变化中：
  - 检索任务得分从 96.6 降至 57.1（下降约 41%）
  - 问答任务得分从 53.5 降至 30.0（下降约 44%）
而 RNope-SWA 分别仅下降 22.1% 和 23.4% ，表现更稳定。

训练与推理效率分析

训练阶段：
- 设滑动窗口大小为 S，完整上下文长度为 L；
- 75% 的层现在使用 O(SL) 复杂度计算，而非传统 O(L²)；
- 使用 Flash Attention 和序列并行技术（sequence-parallel）：
  - 在 64k 上下文长度下，训练吞吐量提升约 50%；
  - 在 128k 上下文长度下，提升近 2 倍。
推理阶段：
- 理论上，KV 缓存最多可节省 75%；
- 实测结果：
  - 使用 132k 输入 token、96 输出 token 时，端到端延迟降低约 44%；
  - 使用 990k 输入 token、8 输出 token 时，延迟降低近 70%；

Conclusion

提出了 RNope-SWA ，一种结合 NoPE 与 RoPE 的混合注意力架构，通过交错使用全注意力与滑动窗口机制，在保持高性能的同时大幅提升训练与推理效率。

RNope：结合 RoPE 和 NoPE 的长文本建模架构

TL;DR 2025 年 Cohere 提出的一种高效且强大的长上下文建模架构——RNope-SWA。通过系统分析注意力模式、位置编码机制与训练策略，该架构不仅在长上下文任务上取得了当前最优的表现，还在短上下文任务和训练/推理效率方面实现了良好平衡。 Paper name …...

编程日记 2025/8/9 4:47:38

22、能源监控与优化 - 数据中心模拟 - /能源管理组件/data-center-energy-monitoring

76个工业组件库示例汇总能源监控与优化组件 - 数据中心模拟 1. 组件概述本组件旨在模拟一个典型数据中心的能源消耗情况，并提供实时的监控数据和基本的优化建议/警报功能。用户可以通过界面直观地了解数据中心总体功耗、PUE (电源使用效率)、各部分能耗构成、机…...

编程日记 2025/8/8 8:03:40

docker学习与使用（概念、镜像、容器、数据卷、dockerfile等）

文章目录前言引入docker 简介docker的应用场景docker的虚拟化技术VS虚拟机docker的优点docker架构Docker仓库Docker镜像linux操作系统的大致组成部分 Docker容器 docker安装与启动校验版本移除旧的版本安装依赖工具设置软件源安装docker验证配置镜像加速器docker服务相关命令…...

编程日记 2025/8/8 23:18:03

突围“百机大战”，云轴科技ZStack智塔获IDC中国AI大模型一体机推荐品牌

随着DeepSeek在今年年初火爆全球，AI大模型市场的“百模大战”已迅速燃向AI一体机市场形成“百机大战”。近日，国际数据公司（IDC）发布的《中国AI大模型一体机市场分析与品牌推荐2025》报告显示，当前中国市场有100多家厂…...

编程日记 2025/8/9 4:44:14

Python-homework

1.if_name_main的含义，why? 假设有一个文件 module.py，内容如下： def greet():print("Hello from module!")if __name__ __main__:print("This is the main script.")greet()如果直接执行 module.py： pyt…...

编程日记 2025/8/8 4:22:13

内核性能测试（60s不丢包性能）

以xGAP-200-SE7K-L（双口10G）在飞腾D2000上为例（单通道最高性能约2.8Gbps) 单口测试 0口： tcp： taskset -c 4 iperf -c 1.1.1.1 -i 1 -t 60 -p 60001 taskset -c 4 iperf -s -i 1 -p 60001 udp： taskse…...

编程日记 2025/8/3 17:36:14

解决LeetCode 47. 全排列 II 问题的正确姿势：深入分析剪枝与状态跟踪

文章目录问题描述常见错误代码与问题分析错误代码示例错误分析正确解决方案修正后的代码关键修正点核心逻辑详解1. 为何使用 boolean[] used 而非 HashSet？2. 剪枝条件 !used[i - 1] 的作用场景对比：何时用数组？何时用哈希表？…...

编程日记 2025/8/9 4:40:11

面向SDV的在环测试深度解析——仿真中间件SIL KIT应用篇

1.引言在汽车行业向软件定义汽车（SDV）转型的过程中，传统硬件在环（HIL）测试方案因难以适应新的技术架构与需求，其局限性日益凸显。传统HIL对硬件依赖性强，扩展性差，更换ECU或传感器…...

编程日记 2025/7/31 18:59:31

03算法学习_977、有序数组的平方

03算法学习_977、有序数组的平方 03算法学习_977、有序数组的平方题目描述：个人代码：学习思路：移除元素第一种写法：暴力解法题解关键点： 移除元素第二种写法：双指针法（快慢指针）题解…...

编程日记 2025/8/7 2:04:11

AWS Elastic Beanstalk控制台部署Spring极简工程(LB版)

问题之前文章《AWS Elastic Beanstalk控制台部署Spring极简工程》，是最简单的eb设置，里面没有负载均衡器的配置，这次，我需要尝试创建一个有LB的eb部署。步骤配置eb 打开eb网页开始创建应用程序，如下图&#xff…...

编程日记 2025/8/4 19:42:48

前端JSON序列化中的隐形杀手：精度丢失全解析与实战解决方案

当你在电商平台看到订单ID从 “1298035313029456899” 变成 “1298035313029456900”，或者在金融系统中发现账户余额 100.01 元变成了 100.00999999999999 元时，这很可能遭遇了前端开发中最隐蔽的陷阱之一 —— JSON序列化精度丢失。本文将深入解析这一问…...

编程日记 2025/8/4 19:14:12

防篡改小工具监测被该文件

核心功能模块哈希计算模块：通过 SHA-256 算法计算文件的哈希值，用于唯一标识文件内容。基线构建模块：遍历指定目录下的所有文件，计算哈希值并保存到 JSON 文件中，形成初始基线。文件监控模块：使用 watchd…...

编程日记 2025/8/9 4:43:02

【四川省专升本计算机基础】第二章计算机软硬件基础（1）

【四川省专升本计算机基础】第二章计算机软硬件基础（1） 2.1 计算机系统组成计算机系统分为硬件系统和软件系统，其详细分类如下图所示：计算机硬件是由电子、机械和光电原件组成的各种设备和部件的总称。是计算机运行的物质基础。计算机软件是运行的各种程序、文档和…...

编程日记 2025/8/8 9:40:19

质量管理工程师面试总结

今天闲着无聊参加了学校招聘会的一家双选会企业，以下是面试的过程。此次面试采用的是一对多的形式。（此次三个求职者，一个面试官） 面试官：开始你们每个人先做个自我介绍吧。哈哈哈哈哈哈哈哈，其实我们…...

编程日记 2025/8/9 1:21:14

【沉浸式求职学习day41】【Servlet】

沉浸式求职学习 Servlet1.Servlet简介2.HelloServletServlet原理 3.ServletContext共享数据拿到初始化信息请求转发读取资源文件 Servlet 1.Servlet简介 Servlet就是sun公司开发动态web的一门技术。 Sun在这些API中提供一个接口叫做：Servlet，如果你想开…...

编程日记 2025/8/8 21:03:23

Java 多线程基础：Thread 类核心用法详解

一、线程创建 1. 继承 Thread 类（传统写法） class MyThread extends Thread { Override public void run() { System.out.println("线程执行"); } } // 使用示例 MyThread t new MyThread(); t.start(); 缺点：Java 单…...

编程日记 2025/8/9 4:46:17

时频分析的应用—外部信号的显影和定点清除

上面的图样是一张时频图，横坐标是时间，纵坐标是频率，颜色标志着主要的干扰源。50Hz工频谐波。这类信号在数据分析领域往往是需要过滤掉的杂波。因为这类信号足够强，所以他会在频域弥漫为一组同样特征的谐波信号，比如…...

编程日记 2025/8/9 4:42:11

目标检测指标计算

mAP（mean Average Precision） 概述预备参数：类别数，IoU阈值；根据模型输出的置信度分数，将所有预测框按从高到低排序；根据IoU是否超过阈值，判断每个预测框是 T P I o U TP_{IoU} T…...

编程日记 2025/8/9 4:42:11

独立开发者利用AI工具快速制作产品MVP

在当今快速发展的科技时代，独立开发者面临着前所未有的机遇与挑战。曾经需要花费数天甚至数周才能完成的产品MVP（Minimum Viable Product，最小可行性产品），如今借助强大的AI工具，可以在短短1小时内实现。 …...

编程日记 2025/8/6 16:25:21

YOLOv3深度解析：多尺度特征融合与实时检测的里程碑

一、YOLOv3的诞生：继承与突破的起点 YOLOv3作为YOLO系列的第三代算法，于2018年由Joseph Redmon等人提出。它在YOLOv2的基础上，针对小目标检测精度低、多类别标签预测受限等问题进行了系统性改进。通过引入多尺度特征图检测、残差网络架构和独…...

编程日记 2025/8/7 14:15:10

MATLAB中的概率分布生成：从理论到实践

MATLAB中的概率分布生成：从理论到实践引言 MATLAB作为一款强大的科学计算软件，在统计分析、数据模拟和概率建模方面提供了丰富的功能。本文将介绍如何使用MATLAB生成各种常见的概率分布，包括均匀分布、正态分布、泊松分布等，并…...

编程日记 2025/8/8 15:35:06

今日积累：若依框架配置QQ邮箱，来发邮件，注册账号使用

QQ邮箱SMTP服务器设置首先，我们需要了解QQ邮箱的SMTP服务器地址。对于QQ邮箱，SMTP服务器地址通常是smtp.qq.com。这个地址适用于所有使用QQ邮箱发送邮件的客户端。 QQ邮箱SMTP端口设置 QQ邮箱提供了两种加密方式：SSL和STARTTLS。根据您选…...

编程日记 2025/8/3 13:04:19

MySQL高效开发规范

1.基础规范 数据库字符集默认使用utf8mb4，兼容utf8，并支持存储emoji表情等四字节内容 禁止在线上生产环境做数据库压力测试 禁止从测试、开发环境、本机直连线上生产数据库 禁止在数据库中存储明文密码 禁止在数据库中存储图片、文件等大数据 …...

编程日记 2025/8/3 18:00:50

MySQL基础面试通关秘籍（附高频考点解析）

文章目录一、事务篇（必考重点）1.1 事务四大特性（ACID）1.2 事务实战技巧二、索引优化大法2.1 索引类型全家福2.2 EXPLAIN命令实战三、存储引擎选型指南3.1 InnoDB vs MyISAM 终极对决四、SQL优化实战手册4.1 慢查询七宗罪4.2 分…...

编程日记 2025/8/2 16:06:52

信贷风控笔记5——风控贷中策略笔记（面试准备13）

1.划分贷前贷中的标准：授信通过 2.框架：贷中风险管理：用信审批/贷中风险预警存量客户运营：不仅考虑风险，还要考虑客户需求、体验等因素，通过精细化的客户分层和差异化的权益调整方式&#xff…...

编程日记 2025/8/8 5:09:31

第五章：Linux用户管理

Linux系统中超级用户是root，通过超级用户root可以创建其它的普通用户，Linux是一个支持多用户的操作系统。在实际使用中，一般会分配给开发人员专属的账户，这个账户只拥有部分权限，如果权限太高，操作的范围过…...

编程日记 2025/8/6 1:46:52

低空态势感知：基于AI的DAA技术是低空飞行的重要安全保障-机载端地面端

低空态势感知：基于AI的DAA技术是低空飞行的重要安全保障-机载端&地面端目前空中已经有大量无人机和其他飞机，未来几年还会有空中出租车。目前，美国每年平均发生 15 到 25 起空中相撞事故。检测和避免 (DAA) 检测和避免 (DAA) 技术可…...

编程日记 2025/8/8 19:14:26

Web服务器怎么压测？可用什么软件？

针对Web服务器的压力测试，需要系统性地模拟真实用户请求，评估服务器在高并发场景下的性能表现（如吞吐量、响应时间、错误率等）。以下是完整的压测方案和工具选型指南：一、压测核心指标指标类型关键指标健康阈值参考并发能力最大支持并发用户数（Concurrency）错误率<…...

编程日记 2025/8/5 11:01:31

IntelliJ IDEA克隆项目失败的解决方法

IntelliJ IDEA克隆项目失败。咨询AI后，在它建议下，在Windows PowerShell中执行语句，成功克隆。操作流程如下； 1. 检查网络连接确保你的网络连接稳定，尝试更换网络环境或使用有线连接代替无线连接。 2. 删除项目 …...

编程日记 2025/8/3 23:28:43

云存储最佳实践

大家好,我是Petter Guo 对Coding充满热情的🐂🐎，坚信实操出真知。在这里，你将听到最真实的经验分享，绝不贩卖焦虑，只提供积极向上的硬核干货，助你一路前行！ 如果对你有帮助, 请点赞…...

编程日记 2025/8/8 16:51:10

矫平机技术新维度：材料科学、数字孪生与零缺陷制造

矫平机技术正经历从"被动修正"到"主动预判"的范式革命。本文聚焦三大前沿方向，揭示如何通过跨学科融合实现金属板材加工的极限突破。一、微观组织调控：材料科学与矫平工艺的量子纠缠晶粒定向技术通过矫平过程中的应变诱导取向&a…...

编程日记 2025/8/8 18:37:24

Dify中使用插件LocalAI配置模型供应商报错

服务器使用vllm运行大模型，今天在Dify中使用插件LocalAI配置模型供应商后，使用工作流的时候，报错：“Run failed: PluginInvokeError: {"args":{},"error_type":"ValueError","message":&…...

编程日记 2025/7/28 1:19:51

第二天的尝试

目录一、每日一言二、练习题三、效果展示四、下次题目五、总结一、每日一言清晰的明白自己想要的是什么，培养兴趣也好，一定要有自己的一技之长。我们不说多优秀，但是如果父母需要我们出力，不要只有眼泪。二、练习题对…...

编程日记 2025/8/7 21:01:44

专业版降重指南：如何用Python批量替换同义词？自动化操作不香嘛？

还在手动一个个改词降重？👀 是兄弟就别再CtrlF了，来试试Python自动同义词替换批量降重法，简直是论文改写效率神器！ 这篇我们来一波实操干货： 👉 如何用Python写出一个自动替换论文关键词的脚本…...

编程日记 2025/8/6 4:52:56

动态图标切换的艺术

动态图标切换的艺术 - Vue实战指南图标切换的本质：状态与视觉的双重舞蹈在前端开发中，图标切换就像我们日常生活中的换装游戏。想象一下，当你按下卧室的开关，灯泡从暗变亮；当你打开衣柜，选择不同场合的着装。图标切换的核心就是根据状态变化呈现不同的视觉效果。方…...

编程日记 2025/8/4 9:17:59

最小二乘法：从房价预测到损失计算

以下通过一个简单例子说明 y = w x + b y = wx + b y=...

编程日记 2025/8/6 6:23:19

C++ asio网络编程(7)增加发送队列实现全双工通信

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、数据节点设计二、封装发送接口介绍锁mutex和加锁工具lock_guard回调函数的实现为什么在回调函数中也要加锁修改读回调总结前言前文介绍了通过智能指针实…...

编程日记 2025/8/8 10:37:54

【C语言字符函数和字符串函数(一)】--字符分类函数，字符转换函数，strlen，strcpy，strcat函数的使用和模拟实现

目录一.字符分类函数 1.1--字符分类函数的理解 1.2--字符分类函数的使用二.字符转换函数 2.1--字符转换函数的理解 2.2--字符转换函数的使用三.strlen的使用和模拟实现 3.1--strlen的使用演示 3.2--strlen的返回值 3.3--strlen的模拟实现四.strcpy的使用和模拟实现…...

编程日记 2025/8/3 21:07:03

ADC深入——SNR、SFDR、ENOB等概念

目录 SNR（Spurious‑Free Dynamic Range 信噪比） ENOB（Effective Number Of Bits 有效位） SFDR（Spurious‑Free Dynamic Range） 感觉SNR和SFDR差不多？看看下图输入带宽混叠带通采样/欠…...

编程日记 2025/8/5 11:07:35

逻辑回归（二分类）

一.逻辑回归的由来逻辑回归不是一个回归的算法，不是用来做预测的，逻辑回归是一个分类的算法，那为什么不叫逻辑分类？因为逻辑回归算法是基于多元线性回归的算法（多元线性回归：yw0x0w1x1.....wnxn)。正因为…...

编程日记 2025/8/4 17:26:42

深入 Linux 内核：GPU Runtime Suspend 源码和工作流程全面分析

这是系列文章中第二篇，我们将分析完整的 Linux runtime suspend 操作流程，以 Vivante GPU 为例，展示开发者如何通过内核程序实现和调试 runtime PM 机制。一、内核中的 Runtime PM 工作流程概览当调用者执行: pm_runtime_put(dev);时&…...

编程日记 2025/8/6 11:30:14

深入理解 this 指向与作用域解析

引言 JavaScript 中的 this 关键字的灵活性既是强大特性也是常见困惑源。理解 this 的行为对于编写可维护的代码至关重要，但其动态特性也会让我们感到困惑。与大多数编程语言不同，JavaScript 的 this 不指向函数本身，也不指向函数的词法作…...

编程日记 2025/8/4 12:43:06

c++20引入的三路比较操作符＜=＞

目录一、简介二、三向比较的返回类型 2.1 std::strong_ordering 2.2 std::weak_ordering 2.3 std::partial_ordering 三、对基础类型的支持四、自动生成的比较运算符函数 4.1 std::rel_ops的作用 4.2 使用<> 五、兼容他旧代码一、简介 c20引入了三路比较操…...

编程日记 2025/8/4 1:17:11

Spring框架（三）

目录一、JDBC模板技术概述 1.1 什么是JDBC模板二、JdbcTemplate使用实战 2.1 基础使用（手动创建对象） 2.2 使用Spring管理模板类 2.3 使用开源连接池（Druid） 三、模拟转账开发 3.1 基础实现 3.1.1 Service层 3.1.2 Da…...

编程日记 2025/8/5 11:45:34

CS016-4-unity ecs

【37】将系统转换为任务 Converting System to Job 【Unity6】使用DOTS制作RTS游戏|17小时完整版|CodeMonkey|【37】将系统转换为任务 Converting System to Job_哔哩哔哩_bilibili a. 将普通的方法，转化成job。第一个是写一个partial struct xxx；第二…...

编程日记 2025/8/4 9:50:17

CMU-15445(4)——PROJECT#1-BufferPoolManager-Task#2

PROJECT#1-BufferPoolManager Task #2 - Disk Scheduler 在前一节我实现了 TASK1 并通过了测试，在本节中，我将逐步实现 TASK2。如上图，Page Table（页表）通过哈希表实现，用于跟踪当前存在于内存中的页&am…...

编程日记 2025/8/5 14:46:07

[原创](计算机数学)(The Probability Lifesaver)(P10): 生日概率问题.

[作者] 常用网名: 猪头三出生日期: 1981.XX.XX 企鹅交流: 643439947 个人网站: 80x86汇编小站编程生涯: 2001年~至今[共24年] 职业生涯: 22年开发语言: C/C++、80x86ASM、Object Pascal、Objective-C、C#、R、Python、PHP、Perl、开发工具: Visual Studio、Delphi、XCode、…...

编程日记 2025/8/4 4:51:53

计算机组成原理——数据的表示

2.1数据的表示整理自Beokayy_ 1.进制转换十六进制与二进制的转换一位十六进制等于四位二进制四位二进制等于一位十六进制 0x173A4C0001 0111 0011 1010 0100 1100 十六进制与十进制的转换十六转十：每一位数字乘以相应的16的幂再相加十转十六&#xff1a…...

编程日记 2025/8/9 1:19:38

源码：处理文件格式和字符集的相关代码（3-3）

总入口：源码：处理文件格式和字符集的相关代码（3-1）-CSDN博客目录六、预览（正确显示文本文件） 6.1 总体逻辑 6.2 二进制显示 6.3 文本显示六、预览（正确显示文本文件） 6.1 总…...

编程日记 2025/8/5 13:48:31

Spring MVC 对 JavaWeb 的优化：从核心组件到注解

Spring MVC 功能组件与注解对 JavaWeb 的优化文章介绍： SpringMVC对比JavaWeb优势，Spring MVC 通过引入功能组件和注解，从多个维度对传统 JavaWeb 开发进行了优化，显著提升了开发效率和代码可维护性。以下是关键优化点的详细对…...

编程日记 2025/8/6 0:14:55