当前位置：首页 > news >正文

On the Biology of a Large Language Model——Claude团队的模型理解文章【论文阅读笔记】其一CLT与LLM知识推理

news 来源：原创 2025/9/25 11:15:08

这个学习笔记，是在精读Anthropic的博客 On the Biology of a Large Language Model 的过程中留下的笔记。
由于原文非常长，我会分2-3 个博客来写。

作者的思路

作者对常用的LLM特征解读工具 SAE/Transcoder 进行了优化，增加了跨层连接的能力和替换主模型的能力，开发出了一个新的解释工具 CLT（cross-layer transcoder），然后用这个解释工具分析Claude模型，在↓

知识推理
写作规划
表征空间
数学上的“加法运算”
越狱防范
COT可靠性
价值观改变

这些层面上的工作机制。

本篇先介绍 1. CLT模型；2. Claude在知识推理和写作规划上的工作机制。

分析工具 CLT

模型解释的思路

针对<模型隐层特征>的分析解释的工作，大体是围绕着这样一个思路展开的↓：
第一步：提炼特征
不管是最近常用的SAE、Transcoder还是Claude团队的CLT（cross-layer transcoder），核心逻辑都是先用一个超大的码表（codebook）来映射Transformer模型中的特征。

第二步：特征和句子中的token进行关联分析。
在有了码表以后，就要将<码表中的code>与<LLM中的token或语义>进行关联。比如，如果码表中第1257号特征激活的时候，"capital"这个token或者这个概念被LLM生成的概率提高，那说明这个token和capital“牵手成功”。

这个思路中要解的关键问题

1）如何保证提炼的特征有效？——减小还原误差
像一般的AE一样，只要隐层特征有能力还原出<输入>，就说明提炼出了输入中的关键信息。SAE和Transcoder使用的都是和目标输出的还原误差作为自己的训练目标。

2）如何保证特征可解释——强迫稀疏性
此类方法都用了稀疏化的正则项来保证在训练的过程中，压迫自身码表的稀疏性。这样能够大大压制神经网络模型的特征堆叠现象，避免一个解释code对应多个原模型特征。而且，即便是出现码表中有多个特征对应到了一个Transformer的抽象特征上，只要把这些特征划到一个分组上就行了。

CLT的特殊之处

下图的左侧子图就是CLT的结构–>以LLM每层的attention运算结果项作为输入，FFN层的输出作为输出，逐层向前传递信息。
在这里插入图片描述
不同于SAE只关心和重建单层的MLP输出，CLT为了分析特征的传递特性，考虑了一种模型解释工作中 <解释模型>的终极形态——直接替换原模型（也就是上图右侧的图像的样子），所以CLT在Transcoder的结构上做了一点点改造，其核心构造见下面公式。
在这里插入图片描述
图上的公式中 $l$ 代表CLT的层数， $a$ 代表CLT的特征层，即从原模型attention output转化成的稀疏编码向量， $W^l_{enc}$ 代表的是CLT encode到稀疏特征 $a$ 的权重矩阵， $W^{l^{\prime}\to l}_{dec}$ 指的是用来解码–>从 $l$ 层前面的某一层 $l^{\prime}$ 这层传递过来的 $a^{\prime}$ 的权重。简而言之， $\hat{y}^l$ 是前面所有特征一起解码的结果。

CLT相对于Transcoder的主要改造有两个

使用了JumpRelu 这个函数在刺激稀疏表征表达的时候效果更好（具体见：Jumping Ahead: Improving Reconstruction Fidelity with JumpReLU Sparse Autoencoders 我下面把那个论文里的核心图贴过来）
causal decode：所有前面已经算过的层的特征a都会参与下一层的decode（也就是还原的步骤的计算），也就是计算 $\hat{y}^l$ 的公式中展示的那样。
正则项：CLT使用的正则项是

使用了 $t anh (c * x)$ 的意思就是希望把这里的 $x$ 压到 $[-\frac{1}{c},\frac{1}{c}]$ 之间。

CLT的其他实现细节

JumpReLU

↓ 这个图是Google团队JumpReLU SAE论文里的图，意思是这样的：通常，我们用ReLU激活函数来过滤掉大部分负值（从左一图到左二图），但是还是有一些正值虽然是正的，但并不高（左二图中的蓝色柱子）被放过了。虽然我们可以通过调整偏置（bias）来把这些不高的正值拉回到负值，但这样一来，原本我们想保留的那些高的正值（左二中的红色柱子）也会被降低成左三那样。最理想的做法是，在ReLU函数的基础上再加一个阈值，不到这个阈值的值全部变成0，达到阈值的值保持原样。在这里插入图片描述
所以JumpReLU的函数图就长↓下面这样↓（需要复现Claude这个CLT的老哥得看一下他的附录，他这里再训练的时候用的初始，bandwidth等等参数都跟Google的原作有一点差别）

在这里插入图片描述

为了减少误差累积，引入了误差修正项

所谓的误差修正项，就是每一层的CLT解码出来的 $\hat{y}$ 和原模型中真实的 $y$ （也就是原始大语言模型这一层的真实输出）之间的差值。因为稀疏模型本身舍弃了MLP自带的特征堆叠能力，同时无论是SAE、Transcoder还是Claude团队使用的CLT，其实研究的都是transformer的残差的前向路径，这里并没有对Attention机制和Transformer的FFN层的激活函数进行等效建模，所以不可避免地会带来一些误差。作者直接把自己复原的 $\hat{y}$ 和误差修正项加起来传递给CLT的下一层解码，以减少这种误差累积的影响。

CLT特征和<语义>关联

知道每层CLT的<哪些>特征会在<什么>上下文中激活就等于有了解释工具了吗？
是也不是。是的原因是，“解释”的意思在这个场景下确实是：

CLT的<哪些>特征会在<什么>语义下激活

不是的原因是，这个语义解释其实并不是基于单个样本的结论，而是基于大量样本的归因分析之后的结论。大部分同类工作到这一步，都会启用<人>，而不是机器。因为这类工作的归因分析一般要做两件事，一个是要记录触发规律，另一个是要做扰动实验来固化影响传递路径。Claude的团队其实也差不多，他们虽然也启用了LLM但是让LLM来梳理规律并没有他们希望的那么顺。最后还是用了人来做这件事。

正片开始

第一个结论：证实了LLM的内部像一个条件概率图一样的知识推理结构

但要先声明一点，知识推理，指的是原先在知识图谱上常用的基于知识关联的推理↓

即“售卖苹果手机的公司的CEO是蒂姆库克”这种，先从知识图谱上查找到“出售卖苹果手机的公司”是苹果公司—>再查找到“苹果公司的CEO是蒂姆库克”

而不是我们最近一年内常探讨的数学推理。（当然，如果深究这两种推理是否本质是一个，那就是另外一个话题了。）
而作者举的例子跟我这个差不多↓↓
在这里插入图片描述
作者拿来举例子的是这样一个句子：

“达拉斯”所在的“州”的“首府”是

然后观察is这个词在运算的过程中，CLT的哪些特征被点亮，而这些特征又分别对应着哪些提前分析过已知的语义。
作者得到了以下结论

达拉斯这个token会点亮很多跟德州相关的特征

这个情况其实在Physics of LLM这篇文章中也有提及，很多实体的关系和实体的属性特征都是储存在实体token上的，通过FFN层就会被拉起来，像KV对一样。

capital 和 state 两个词的中间融合特征会让模型有欲望吐出大量不同首都的名称

这里强烈建议点进原文看一眼，他say a captial这个feature组对应了若干会吐出不同地区capital的feature。

Austin的生成就是由Dallas把Texas拉起来，capital and state 把capital这个概念拉起来，最后被模型找到的概率最高的token。

如果把作者的这张图上下颠倒，就非常像一个条件概率图了。不知道和国内一些研究神经符号推理的团队思路像不像？

和很多知识编辑的研究思路类似，Claude团队验证CLT特征可靠性（其实也顺带验证了非常像因果图这点）的终极扰动实验就是把中间对应某个语义的特征人为的替换成另外一个语义对应的CLT特征，来观察模型的生成是否收到影响。而这个实验的结果就如下图：
在这里插入图片描述
即，把中间层中代表的Texas的特征替换成已经知道的代表<中国>的特征，模型就会生成跟北京最为相关的中间层特征，模型也就会生成北京。
在这一刻 Transformer中常用的causal才能和我们中文认知中的因果对应上。

拓展：模型在医疗的case上呈现的模式也呈现了条件概率图的模式

在这里插入图片描述

第二个结论：模型会在生成第一个词之前对要生成的一句做规划

作者研究这个内容的方法是让模型写诗。这确实还是挺巧的一个思路，因为如果使用常规的提问，又会落到知识存储相关的问题上，很难剥离这方面能力的影响。
如↓下图↓所示，作者让模型接着一个已经写好的诗的开头“He saw a carrot and had to grab it” 然后观察到，在下一行的起始token“换行符”这里，rabbit和habbit这两个与上文相关且韵脚“it”一致的词相关的feature在CLT内部被点亮了。
在这里插入图片描述
具体而言，模型先是激活了和‘it/et/eet’读音相关的feature，这个feature又找到最接近的rabbit和habit这两个词相关的feature。
而且，经过分析，这个规划是仅在生成前的这一个token上完成的。

On the Biology of a Large Language Model——Claude团队的模型理解文章【论文阅读笔记】其一CLT与LLM知识推理

这个学习笔记，是在精读Anthropic的博客 On the Biology of a Large Language Model 的过程中留下的笔记。由于原文非常长，我会分2-3 个博客来写。作者的思路作者对常用的LLM特征解读工具 SAE/Transcoder 进行了优化，增加了跨层连接的能力…...

编程日记 2025/9/25 11:15:08

Postman忘记密码访问官网总是无响应

1.Header Editor插件下载百度网盘下载： 链接：https://pan.baidu.com/s/1EV6cY7TYQVgPjip3v-vhfQ 提取码：yyds 2.插件配置下载规则url：https://azurezeng.github.io/static/HE-GoogleRedirect.json ![在这里插入图片描述](htt…...

编程日记 2025/9/20 12:53:49

NEUOJ网格路径

在一个 77 的网格中，从左上方的方格走到左下方的方格，共有 88418 条路径。每条路径对应一个由字符 D（向下）、U（向上）、L（向左）和 R（向右）组成的 48 字符描…...

编程日记 2025/9/20 11:41:45

深度学习中的黑暗角落：梯度消失与梯度爆炸问题解析

📌 友情提示： 本文内容由银河易创AI（https://ai.eaigx.com）创作平台的gpt-4o-mini模型生成，旨在提供技术参考与灵感启发。文中观点或代码示例需结合实际情况验证，建议读者通过官方文档或实践进一步确认其准…...

编程日记 2025/9/19 12:43:00

【数字图像处理】机器视觉（1）

判别相对应的点 1. 图像灰度化 2. 局部特征 3. 仿射不变性特征图像变化的类型【1】几何变化：旋转、相似（旋转各向相同的尺度缩放）、仿射（非各向相同的尺度缩放） 【2】灰度变化：仿射灰度变化角点角…...

编程日记 2025/9/17 20:06:20

# 构建和训练一个简单的CBOW词嵌入模型

构建和训练一个简单的CBOW词嵌入模型在自然语言处理（NLP）领域，词嵌入是一种将词汇映射到连续向量空间的技术，这些向量能够捕捉词汇之间的语义关系。在这篇文章中，我们将构建和训练一个简单的Continuous Bag of Words…...

编程日记 2025/9/25 11:14:26

Ubuntu20.04下GraspNet复现流程中的问题

pytorchcudacudnn的版本问题相对于GraspNet来说至关重要！！！至关重要！！！至关重要！！！（重要的事情说三边） 我的显卡是3070 那么首先说结论使用30系…...

编程日记 2025/9/17 12:42:21

【ROS2】机器人操作系统安装到Ubuntu简介

主要参考： https://book.guyuehome.com/ROS2/1.系统架构/1.3_ROS2安装方法/ 官方文档：https://docs.ros.org/en/humble/Installation.html 虚拟机与ubuntu系统安装略，见参考文档 ubutun换国内源，略 1. 设置本地语言确保您有…...

编程日记 2025/9/12 0:25:28

从0到1掌握机器学习核心概念：用Python亲手构建你的第一个AI模型（超多代码+可视化）

🧠 一、开始真正动手实现一个完整的AI项目！从数据预处理、特征工程、模型训练，到评估与调优，一步步还原你在动画视频中看到的所有核心知识点。 📦 二、环境准备建议使用 Python 3.8，推荐工具&#xff1…...

编程日记 2025/9/25 3:08:41

Java面试题汇总

1王二哥 https://javabetter.cn/sidebar/sanfene/redis.html#_10-redis-%E6%8C%81%E4%B9%85%E5%8C%96%E6%96%B9%E5%BC%8F%E6%9C%89%E5%93%AA%E4%BA%9B-%E6%9C%89%E4%BB%80%E4%B9%88%E5%8C%BA%E5%88%AB 2.小林 https://www.xiaolincoding.com/redis/data_struct/command.html#…...

编程日记 2025/9/24 3:15:40

Ollama API 应用指南

1. 基础信息默认地址: http://localhost:11434/api数据格式: application/json支持方法: POST（主要）、GET（部分接口） 2. 模型管理 API (1) 列出本地模型端点: GET /api/tags功能: 获取已下载的模型列表。示例:curl http://lo…...

编程日记 2025/9/25 11:15:08

React SSR + Redux 导致的 Hydration 报错踩坑记录与修复方案

一条“Hydration failed”的错误，让我损失了半天时间背景我在用 Next.js App Router Redux 开发一个任务管理应用，一切顺利，直到打开了 SSR（服务端渲染），突然看到这个令人头皮发麻的报错： …...

编程日记 2025/9/20 1:23:10

【论文精读】Reformer：高效Transformer如何突破长序列处理瓶颈？

目录一、引言：当Transformer遇到长序列瓶颈二、核心技术解析：从暴力计算到智能优化1. 局部敏感哈希注意力（LSH Attention）：用“聚类筛选”替代“全量计算”关键步骤：数学优化： 2. 可逆残差网络…...

编程日记 2025/8/17 18:08:24

iOS18 MSSBrowse闪退

iOS18 MSSBrowse闪退问题方案结果问题最近升级了电脑系统(15.4.1)，并且也升级了xcode(16.3)开发工具。之后打包公司很早之前开发的项目。上线之后发现在苹果手机系统18以上，出现了闪退问题。涉及到的是第三方MSSBrowse，在选择图片放大的…...

编程日记 2025/9/23 8:29:39

create_function()漏洞利用

什么是 create_function() create_function() 是 PHP 早期提供的一个用来创建匿名函数的函数： $func create_function($a,$b, return $a $b;); echo $func(1, 2); // 输出 3 第一个参数是函数的参数列表（字符串形式），第二个参…...

编程日记 2025/9/23 19:24:10

leetcode-数组

数组 31. 下一个排列题目整数数组的一个排列就是将其所有成员以序列或线性顺序排列。例如，arr [1,2,3] ，以下这些都可以视作 arr 的排列：[1,2,3]、[1,3,2]、[3,1,2]、[2,3,1] 。整数数组的下一个排列是指其整数的下一个字典序更大…...

编程日记 2025/9/25 9:17:27

Tailwind CSS 实战：基于 Kooboo 构建个人博客页面

在现代 web 开发中，Tailwind CSS 作为一款实用优先的 CSS 框架，能让开发者迅速搭建出具有良好视觉效果的页面；Kooboo 则是一个强大的快速开发平台，提供了便捷的页面管理和数据处理功能。本文将详细介绍如何结合 Tailwind CSS 和 K…...

编程日记 2025/9/10 2:16:03

C#学习1_认识项目/程序结构

一、C#项目文件的构成 1.新建一个项目 2.运行项目 3.认识文件 1）解决方案（Solution）：组织多个项目的容器抽象理解：餐厅解决方案.sln文件，点击即可进入VS编辑 2）项目（…...

编程日记 2025/9/25 5:34:19

边缘计算在工业自动化中的应用：开启智能制造新时代

在工业4.0的浪潮中，智能制造成为推动工业发展的核心驱动力。随着物联网（IoT）技术的广泛应用，工业设备之间的互联互通变得越来越紧密，但这也带来了数据处理和传输的挑战。边缘计算作为一种新兴技术，通过将计…...

编程日记 2025/9/22 18:31:35

《MySQL：MySQL表的内外连接》

表的连接分为内连接和外连接。内连接内连接实际上就是利用where子句对两种表形成的笛卡尔积进行筛选，之前的文章中所用的查询都是内连接，也是开发中使用的最多的连接查询。 select 字段 from 表1 inner join 表2 on 连接条件 and 其他条件&#xff1…...

编程日记 2025/9/24 6:22:30

人工智能催化民航业变革：五大应用案例

航空业正在经历一场前所未有的技术革命，人工智能正成为变革的主要催化剂。从停机坪到航站楼，从维修机库到客户服务中心，人工智能正在从根本上重塑航空公司的运营和服务方式。这种转变并非仅仅停留在理论上——全球主要航空公司已从人工智能投…...

编程日记 2025/9/21 23:58:45

机器视觉中有哪些常见的光学辅助元件及其作用？

在机器视觉领域，光学元件如透镜、反射镜和棱镜扮演着至关重要的角色。它们不仅是高精度图像捕获的基础，也是提升机器视觉系统性能的关键。深入了解这些光学元件的功能和应用，可以帮助我们更好地掌握机器视觉技术的精髓。透镜：精…...

编程日记 2025/9/20 23:45:38

Stream API 对两个 List 进行去重操作

在 Java 8 及以上版本中，可以使用 Lambda 表达式和 Stream API 对两个 List 进行去重操作。以下是几种常见的去重场景及对应的 Lambda 表达式实现方式： 1. 合并两个 List 并去重 List<String> list1 Arrays.asList("A", "B"…...

编程日记 2025/9/25 6:14:51

lerna 8.x 详细教程

全局安装 lerna npm install lerna -g初始化项目 mkdir lerna-cli-do cd lerna-cli-do npm init -y初始化项目 lerna init --packages="packages/*"lerna create 创建子项目 lerna create core lerna create util...

编程日记 2025/8/26 18:24:52

ROS第十二梯：ros-noetic和Anaconda联合使用

1) 概述 ros-noetic默认Python版本是Python2.7，但在使用过程中，通常需要明确调用python3进行编译。 Anaconda：支持创建独立的python2/3环境，避免系统库冲突；方便安装ROS依赖的科学计算库（如Numpy，Pandas）和机器学习框架；核心目标：在anaconda环…...

编程日记 2025/9/22 17:27:57

网络原理 - 5（TCP - 2 - 三次握手与四次挥手）

目录 3. 连接管理建立连接 - 三次挥手三次握手的意义断开连接 - 四次挥手握手和挥手的相似和不同之处连接管理过程中涉及到的 TCP 状态转换完！ 3. 连接管理连接管理分为建立连接和断开连接~（important 重点！） 建…...

编程日记 2025/9/24 9:05:06

【开源】STM32HAL库移植Arduino OneWire库驱动DS18B20和MAX31850

项目开源链接 github主页https://github.com/snqx-lqh本项目github地址https://github.com/snqx-lqh/STM32F103C8T6HalDemo作者 VXQinghua-Li7 📖 欢迎交流如果开源的代码对你有帮助，希望可以帮我点个赞👍和收藏项目说明最近在做一个项目…...

编程日记 2025/9/18 18:31:58

【maven-7.1】POM文件中的属性管理：提升构建灵活性与可维护性

在Maven项目中，POM (Project Object Model) 文件是核心配置文件，而属性管理则是POM中一个强大但常被低估的特性。良好的属性管理可以显著提升项目的可维护性、减少重复配置，并使构建过程更加灵活。本文将深入探讨Maven中的属性管理机制。 1.…...

编程日记 2025/9/22 7:47:40

DC-2寻找Flag1、2、3、4、5，wpscan爆破、git提权

一、信息收集 1、主机探测 arp-scan -l 探测同网段2、端口扫描 nmap -sS -sV 192.168.66.136 80/tcp open http Apache httpd 2.4.10 ((Debian)) 7744/tcp open ssh OpenSSH 6.7p1 Debian 5deb8u7 (protocol 2.0)这里是扫描出来两个端口，80和ssh&…...

编程日记 2025/9/20 8:43:24

数据结构手撕--【栈和队列】

目录 1、栈 2、队列 1、栈先进后出（都在栈顶进行操作） 使用数组结构比使用链式结构更优，因为数组在尾上插入数据的代价更小。并且采用动态长度的数组来表示。定义结构体 #include <stdio.h> #include <stdlib.h> #include &l…...

编程日记 2025/9/24 9:10:35

八大排序——选择排序/堆排序

八大排序——选择排序/堆排序目录一、选择排序二、堆排序 2.1 大顶堆（升序） 2.1.1 步骤 2.1.2 代码实现 2.2 小顶堆（降序） 一、选择排序每一趟从待排序序列中找到其最小值，然后和待排序序列的第一个值进行交换&am…...

编程日记 2025/9/24 21:04:46

【KWDB 创作者计划】_深度学习篇---归一化反归一化

文章目录前言一、归一化（Normalization）1. 定义2. 常用方法Min-Max归一化Z-Score标准化（虽常称“标准化”，但广义属归一化）小数缩放（Decimal Scaling）3. 作用4. 注意事项二、反归一化（Denormalization）1. 定义2.方法3. 应用场景三、Python示例演示四、归一化 vs. 标准…...

编程日记 2025/9/23 5:25:23

windows端远程控制ubuntu运行脚本程序并转发ubuntu端脚本输出的网页

背景对于一些只能在ubuntu上运行的脚本，并且这个脚本会在ubuntu上通过网页展示运行结果。我们希望可以使用windows远程操控ubuntu，在windows上查看网页内容。方法 start cmd.exe /k "sshpass -p passwd ssh namexxx.xxx.xxx.xxx "cd /hom…...

编程日记 2025/9/21 16:26:26

推荐系统（二十四）：Embedding层的参数是如何在模型训练过程中学习的？

近来有不少读者私信我关于嵌入层（Embedding层）参数在模型训练过程中如何学习的问题。虽然之前已经在不少文章介绍过 Embedding，但是为了读者更好地理解，笔者将通过本文详细解读嵌入层（Embedding Layer）的参…...

编程日记 2025/9/24 1:24:33

【Ubuntu】关于系统分区、挂载点、安装位置的一些基本信息

在ubuntu22及以前的版本中，最好是手动配置分区及其挂载点，通常我们会配置成3/4个分区： 引导区，交换区，根挂载点，home挂载点（有时根挂载点和home合二为一） 配置各种环境所占用的内存 …...

编程日记 2025/9/21 12:56:49

概率dp总结

概率 DP 用于解决概率问题与期望问题，建议先对概率 & 期望的内容有一定了解。一般情况下，解决概率问题需要顺序循环，而解决期望问题使用逆序循环，如果定义的状态转移方程存在后效性问题，还需要用到高斯消元来优…...

编程日记 2025/9/3 13:02:09

深入解析：RocketMQ、RabbitMQ和Kafka的区别与使用场景

互联网大厂Java求职者面试：RocketMQ、RabbitMQ和Kafka的深入解析故事场景：严肃且专业的面试官与架构师程序员马架构在一家知名的互联网大厂，Java求职者正在接受一场严格的面试。面试官是一位经验丰富的技术专家，他将通过多轮提…...

编程日记 2025/9/24 14:42:09

探秘Transformer系列之（30）--- 投机解码

探秘Transformer系列之（30）— 投机解码文章目录探秘Transformer系列之（30）--- 投机解码0x00 概述0x01 背景1.1 问题1.2 自回归解码 0x02 定义 & 历史2.1 投机解码2.2 发展历史 0x03 Blockwise Parallel Decoding3.1 动机3.2…...

编程日记 2025/9/20 12:22:29

【CSS】层叠，优先级与继承（三）：超详细继承知识点

目录继承一、什么是继承？2.1 祖先元素2.2 默认继承/默认不继承二、可继承属性2.1 字体相关属性2.2 文本相关属性2.3 列表相关属性三、不可继承属性3.1 盒模型相关属性3.2 背景相关属性四、属性初始值4.1 根元素4.2 属性的初始值4.3 得出结论五、强制继承5.1 in…...

编程日记 2025/9/23 2:14:45

SpringBoot中6种自定义starter开发方法

在SpringBoot生态中，starter是一种特殊的依赖，它能够自动装配相关组件，简化项目配置。自定义starter的核心价值在于： • 封装复杂的配置逻辑，实现开箱即用 • 统一技术组件的使用规范，避免"轮子"泛滥 • 提高开发效率，减少重复代码方法一：基础配置类方式 …...

编程日记 2025/9/1 11:44:36

时间自动填写——电子表格公式的遗憾（DeepSeek）

now()/today()缘源来，人肉值粘胜无依。用函数抓取系统时间，人肉CTRLC“永葆青春”——直接时间数据存储。笔记模板由python脚本于2025-04-23 23:21:44创建，本篇笔记适合想要研究电子表格日期自动填写的coder翻阅。【学习的细节是欢悦的历程…...

编程日记 2025/9/25 2:20:17

AUTODL关闭了程序内存依然占满怎么办

AutoDL帮助文档关闭了程序，使用nvidia-smi查看，内存任然爆满： 执行 ps -ef | grep train | awk {print $2} | xargs kill -9...

编程日记 2025/9/21 2:26:24

Spark集群搭建之Yarn模式

1.把spark安装包复制到你存放安装包的目录下，例如我的是/opt/software cd /opt/software，进入到你存放安装包的目录然后tar -zxvf 你的spark安装包的完整名字 -C /opt/module，进行解压。例如我的spark完整名字是spark-3.1.1-bin-hadoop3.2.…...

编程日记 2025/9/21 5:43:29

CSS-跟随图片变化的背景色

CSS-跟随图片变化的背景色获取图片的主要颜色并用于背景渐变需要安装依赖 colorthief获取图片的主要颜色. 并丢给背景注意 getPalette并不是个异步方法 import styles from ./styles.less; import React, { useState } from react; import Colortheif from colorthief;cons…...

编程日记 2025/9/21 0:18:35