当前位置：首页 > news >正文

【论文学习】基于规模化Transformer模型的低比特率高质量语音编码

news 来源：原创 2025/9/14 15:06:39

以下文章基于所提供的文档内容撰写，旨在对该论文“Scaling Transformers for Low-Bitrate High-Quality Speech Coding”进行较为系统和深入的分析与总结。
论文地址：https://arxiv.org/pdf/2411.19842

一、研究背景与动机

自20世纪70年代以来，音频与语音数据的数字化压缩编码一直是通信与信号处理领域的活跃研究方向。尤其在1990年代末期，诸如mp3等广泛流行的音乐压缩格式引起了极大关注。这些早期编解码器大多依赖传统信号处理手段，通过频谱变换、时域特征提取、量化与熵编码等步骤，实现音频数据体积的显著压缩。

然而，随着深度学习技术的崛起，人们开始尝试将机器学习算法应用于音频编解码领域。“神经音频编解码器”（Neural Audio Codec, NAC）一词应运而生。最初，神经网络在音频编解码中的应用延续了传统编解码器的目标：即在较低的比特率下尽量保持较高的音质，并兼顾计算成本的可行性。然而，最新一代的大规模生成式模型则提出了新的需求：**它们所需的音频“标记化”或“离散化”**不仅是为了更高的压缩率或者单纯追求高保真度，还要考虑如何为后续的大型生成模型提供适合的离散表示。也就是说，NAC在新需求下更看重如何活动化“语音token”的潜在分布，使大型生成模型在理解或生成音频时更具灵活性与准确度。

在此背景下，该论文所提出的模型围绕“极低比特率”和“可与强大生成式模型配合”这两大核心诉求进行设计。为进一步提高音频标记化质量，作者们认为可以牺牲一部分模型的计算复杂度，以换取更强的编码和生成能力。这种思路与传统编解码器“追求极低计算开销”的理念不同，属于一种范式转变：当下的大模型时代，编解码器在整个语音生成或理解流水线中只占很小一部分参数量，因此具备向单体参数规模更大、表示能力更强的方向演进的“空间”。

基于上述认识，该论文将Transformer架构大规模应用于语音编解码器主干网络，并引入了一种基于有限标量量化（Finite Scalar Quantization, FSQ）的量化方法，试图在400bps至700bps的超低码率下实现高质量语音的波形重建。相较传统的残差矢量量化（RVQ），FSQ能减少层级并行带来的复杂性，也能在极低比特率的场景中带来更好的码本利用率。

二、神经音频编解码器概述

2.1 传统NAC的发展

根据文档中所述，早期的神经音频编解码研究主要集中在VQ-VAE（Vector Quantized Variational AutoEncoder）的结构上，遵循“编码器-量化-解码器”的三段式流水。Soundstream、EnCodec等工作通过残差矢量量化（RVQ）方法，利用多个层级的码本来增强对输入特征空间的表示能力。随着研究的深入，这类模型在语音、通用音频（如音乐、环境音）等多种类型的任务中均有不错的表现。

不过，随着“生成式模型”在音频领域大放异彩，仅具备“压缩-重建”功能的编解码器已经无法满足一些新需求。例如，用于多模态的文本到音频生成任务，需要编解码器提供能反映音频中语义与声学信息的离散token，以便大模型对其进行操控。

2.2 低比特率语音编码的新挑战

文档指出，如何在1kbps甚至更低比特率下实现高保真度语音重建，是当前一个颇具挑战性的目标。一些模型（如SingleCodec、SemantiCodec等）采用将音频先转换为语谱图再进行VQ或扩散式生成的思路，在极低码率时亦能维持一定的语音可懂度。但也出现了对高频成分和复杂声学结构失真的现象。

另一方面，一些端到端波形级神经编解码器则通过提升数据规模（例如Mimi用于英语语音的700万小时训练数据）来缓解低比特率编码的泛化不足。但这些大数据模型通常需要更长的训练周期和更高的硬件资源。

该论文主张，通过大规模Transformer与FSQ结合，可在语音范围内取得比以往RVQ模型更优的平衡——既能在400-700bps维度保持好的重建质量，又不完全依赖数百万小时级别的数据量。

三、所提方法：大规模Transformer与FSQ

3.1 整体结构与动机

论文所提出的模型称为“TAAE”（Transformer Audio AutoEncoder），其核心是一个以Transformer为主的编解码结构，而非以卷积层或混合卷积—Transformer层为主导。动机在于进一步“规模化”Transformer，从而在时域上下文建模、注意力机制等方面充分挖掘信息编码潜力。

此外，作者提到，目前大多数模型在量化环节采用“残差矢量量化”（RVQ），这会引入多重层级并行的token序列，使得后续生成式模型（尤其是因果结构）需要在推理和训练过程中处理相互依赖的多条token流，变得复杂且容易产生码本利用率不足等问题。FSQ则通过有限标量量化的方式，将潜在向量分解为更简洁的低阶标量子空间，便于后续统一建模。

3.2 编码器-解码器架构

TAAE的Encoder部分首先对输入波形进行下采样或分块处理（论文中提到20ms为一块），再将其映射到较高维度（文档中并未提供具体维度的精确数值，但提到1024维嵌入是常用规模）。随后，通过分层Transformer块进行时序依赖的建模。Transformer块中嵌入了滑动窗口注意力（window-size = 128）等技术，以控制计算量并有效地捕捉局部上下文。

Decoder部分则与Encoder保持对称结构，通过相同或相似规模的Transformer反向进行特征还原，最终与波形重建模块相结合，以恢复最终音频信号。文档中还提到，该模型在非因果和因果两种版本间进行了比较，因果版本仅带来极小的性能退化，却能支持实时流式场景——这一点对实际通信及实时生成都很关键。

3.3 有限标量量化（FSQ）

相较于RVQ，FSQ将潜在空间分解为若干标量通道，每个通道可通过一个有限离散集进行量化。作者同时提出一种**后训练阶段的“低阶残差分解”**策略，以提高FSQ的精细度并保持码率可控。据文档所述，FSQ能带来如下好处：

简化token流：避免多层级的并行VQ码本导致的复杂依赖关系。
增强码本利用率：通过后训练的方式可更好地覆盖潜在空间，减少无效码字。
灵活可调比特率：在400bps到700bps区间可依动态需求进行快速切换。

四、训练过程与实验设置

4.1 训练数据与损失函数

论文并未在文档中给出详细的语料规模或语种覆盖范围，但存在提及Mimi使用700万小时英语语音，EnCodec、Soundstream经常采用DNS、CommonVoice等多源数据进行多任务训练等背景。就该模型而言，作者主要强调了两个训练阶段：

主训练阶段：以对抗损失和重构损失（如STFT或GAN Feature Matching）为核心，保证波形质量与逼真度。
微调阶段：引入WavLM-Large等额外感知损失，进一步提高听觉主观评分。

在损失权重设置上，作者并未详细列举，但提到对抗损失与感知损失同样重要，彼此需平衡。

4.2 评价指标与主客观测试

为衡量压缩质量、感知清晰度与比特率效果，论文使用了多种指标，包括：

客观指标：如SI-SDR（其中>0一般表示一定程度保真，数值越大越好）、PESQ、梅尔距离等。
主观听感测试：采用MUSHRA形式，让测试者对模型重建音频和参考音频进行相似度评定，评分范围为0到100。

作者在实验中同时对若干已有模型（Encodec、DAC、Mimi等）做了对比，并特别关注了“比特率与音质”的关系。当比特率降低到不足1kbps时，如果能保持相对清晰可懂的语言特征，就已算极具突破性成果。

五、结果与发现

5.1 重建质量与比特率

根据上传文档信息，TAAE在400bps或700bps的场景下仍能取得被称为“良好”甚至“高质量”的语音重建效果。尤其相比一些在1kbps上下的其他模型，TAAE以更低比特率、更少token数量达到了更佳的主客观指标。这一点在下表（文档中示例的表格略见端倪）得以体现：

TAAE在700bps时，SI-SDR可达4.73左右，PESQ和MUSHRA得分也相对较高。
EnCodec、DAC或者Mimi等模型虽然在高比特率下音质不错，但其在超低比特率（如700bps及以下）时，往往音质有明显下降。

5.2 模型规模化带来的收益

作者针对不同参数量（约2.5亿、5亿和10亿）的TAAE进行了对比试验。结果显示：增大模型规模，可以线性或甚至超线性地提升语音重建效果与压缩能力。 这与该论文所强调的“编解码器在现代生成式管线中仅占少部分参数量”这一思路高度吻合。也就是说，在现有的大模型系统中，适度提升编解码器的规模是可行的，并且带来的收益显著。

5.3 其他扩展结果

文档提及了对因果版本、其它语言支持及不同时长语音的适应性测试：

因果版TAAE：相较非因果版仅有小幅度性能损失，却具备实时流式应用能力。
多语言或跨语言测试：最初的英文数据训练模型在面对一些其他语言的测试集时，结果“优于或可比”某些多语言训练的基线。在低比特率下保持了相对稳健的解码质量，显示了模型一定程度上的跨语言泛化潜力。
不同音频时长：模型在更长或更短的语音段落上依旧维持了与训练时相似的重建质量，说明了Transformer注意力机制对变长输入的适应能力。

六、与现有研究的比较

在文档中，作者也回顾了其他音频编解码与生成技术的发展状况。其中，VQ-VAE家族（SoundStream, EnCodec, SpeechTokenizer等）和结合扩散模型或其他生成模型（如SemantiCodec，AudioLDM系列）成为对比重点。

SoundStream/EnCodec类模型：主要依赖较多的卷积网络和分层RVQ，并在中高比特率（通常>1kbps）获得优质重建。
扩散式语谱图生成：如SemantiCodec或AudioLDM的(Mel-spectrogram→扩散→声码器Vocoder)流程，码率虽然可低至0.31kbps上下，但多步生成的时域失真问题仍待解决，而且依赖外部高质量vocoder以完成波形重建。

在这些工作里，TAAE的突出点在于直接在波形级完成压缩与重建，不需要额外的vocoder。再者，FSQ的使用也让作者得以简化多层VQ层叠带来的复杂性，便于后续生成式模型逐token进行推断。

七、局限性与未来展望

7.1 论文局限与未解决问题

尽管在超低比特率下取得了出色的语音重建质量，该模型在超宽带音乐或环境声等更复杂的音频维度上是否同样能保持高水准尚未完全证实。文档中提到频率越高或声学成分越丰富时，低比特率编码会遇到更大的挑战。此外，FSQ与大规模Transformer训练势必带来推断时的计算消耗，也需要在移动端或低算力场景仔细权衡。

7.2 未来工作方向

文档给出的一些思路包括：

进一步的因果结构优化：减少延迟、提升流式性能，使之能与实时交互需求对接。
拓展到多语种或跨模态：在扩充训练语料的同时，研究如何让音频编解码器与图像或文本生成模型更好地融合。
探索更低码率边界：作者在附录中提到曾尝试200bps，但训练较慢且效果明显下滑。或许改进网络结构后，仍有进一步冲击的可能性。
与自监督音频表示结合：文档提到与WavLM-Large等模型的整合，或许可以深化这类自监督预训练方法与NAC的跨模型协同。

八、总结

通过对论文“Scaling Transformers for Low-Bitrate High-Quality Speech Coding”及其提供的实验细节和架构说明，我们可以看到，大规模Transformer与FSQ相结合确实为极低比特率语音编码带来了新的可能性。它的核心理念在于：与其在编解码器段过度强调计算负载的限制，不如在当今大模型时代下适度提升编解码器自身的参数量与网络深度，从而获得更优的压缩率与音质平衡。这一思路与传统音频编码技术形成了鲜明的对比，也为后续研究提供了一个创新范式。

从结果上看，TAAE在400bps与700bps区间依旧能维持相对良好的语音信息保真度，客观测度（如SI-SDR、PESQ）与主观测度（MUSHRA）均达到了或逼近更高比特率模型的表现。同时，通过对比因果与非因果版本的结果，作者也进一步证明了实时性与高保真度之间并非不可兼顾。

然而，该论文仍然面临一些挑战，如极低码率下如何兼顾多语言或通用音频（包括音乐、环境声等），以及在硬件资源受限场合如何高效部署。尽管如此，本研究不失为一项对神经编解码器思路的大胆拓展，为未来大模型与神经音频标记化的结合指出了一条可行路径。随着代码和模型开源，学术和工业界将有机会共同验证它的适用性与可扩展性，也可能催生更多基于Transformer与FSQ的新一代音频编解码器。

综上所述，该论文的贡献主要在以下几个方面：

首次大规模地将Transformer应用于音频编解码主干结构，并将参数规模扩展至数亿乃至10亿量级，突破了先前主要依赖卷积或混合网络的限制。
提出了改进的有限标量量化（FSQ）方法，取代常用的RVQ以简化并行token流并提高码本利用率，且通过后训练的残差分解策略进一步增强了模型在极低码率下的压缩能力和生成质量。
实验证明其在400bps-700bps超低比特率区域既能保持较优的重建质量，也为生成式模型提供了紧凑而富含语义的离散token，适应多种下游场景。
开放式的研究视角：在附录中对因果模式、多语言适配、长短语音段处理的扩展分析为后续工作指明了方向。

对于有志于深入探索低比特率语音编解码技术的读者而言，这篇论文不仅是一份详实的技术报告，也是一次前瞻性的思维启示：当生成式AI逐渐左右语音处理领域的未来，编解码器的角色已不再局限于“压缩效率”这一点，而是成为了庞大多模态语音生成体系中的一环。如何在这个体系的“前端”环节里大幅提升建模能力，与后续的复杂生成器无缝衔接，正是该论文积极尝试并取得一定成果的重大贡献。

项目地址：github.com/Stability-AI/stable-codec

【论文学习】基于规模化Transformer模型的低比特率高质量语音编码

以下文章基于所提供的文档内容撰写，旨在对该论文“Scaling Transformers for Low-Bitrate High-Quality Speech Coding”进行较为系统和深入的分析与总结。论文地址：https://arxiv.org/pdf/2411.19842 一、研究背景与动机自20世纪70年代以来&#xff…...

编程日记 2025/9/14 15:06:39

Docker 2025/2/24

用来快速构建、运行和管理应用的工具。帮助部署。快速入门代码略解释 docker run :创建并运行一个容器，-d是让容器在后台运行 --name mysql :给容器起个名字，必须唯一 -p 3306:3306 :设置端口映射 -e KEYVALUE :是设置环境变量 mysql :指定运行的…...

编程日记 2025/9/9 21:49:13

Rust语言基础知识详解【一】

1.在windows上安装Rust Windows 上安装 Rust 需要有 C 环境，以下为安装的两种方式： 1. x86_64-pc-windows-msvc（官方推荐） 先安装 Microsoft C Build Tools，勾选安装 C 环境即可。安装时可自行修改缓存路径与安装路…...

编程日记 2025/9/14 4:38:29

Kronecker分解（K-FAC）：让自然梯度在深度学习中飞起来

Kronecker分解（K-FAC）：让自然梯度在深度学习中飞起来在深度学习的优化中，自然梯度下降（Natural Gradient Descent）是一个强大的工具，它利用Fisher信息矩阵（FIM）调整梯度…...

编程日记 2025/9/14 0:04:08

Ubutu部署WordPress

前言什么是word press WordPress是一种使用PHP语言开发的建站系统，用户可以在支持PHP和MySQL数据库的服务器上架设WordPress。它是一个开源的内容管理系统（CMS），允许用户构建动态网站和博客。现在的WordPress已经强大到几乎可以…...

编程日记 2025/9/14 9:10:45

请解释 React 中的 Hooks，何时使用 Hooks 更合适？

一、Hooks 核心理解 1. 什么是 Hooks？ Hooks 是 React 16.8 引入的函数式编程范式，允许在函数组件中使用状态管理和生命周期能力。就像给函数组件装上了"智能芯片"，让原本只能做简单展示的组件具备了处理复杂逻辑的能力。 2. 类…...

编程日记 2025/9/10 15:57:55

在Linux桌面上创建Idea启动快捷方式

1、在桌面新建idea.desktop vim idea.desktop [Desktop Entry] EncodingUTF-8 NameIntelliJ IDEA CommentIntelliJ IDEA Exec/home/software/idea-2021/bin/idea.sh Icon/home/software/idea-2021/bin/idea.svg Terminalfalse TypeApplication CategoriesApplication;Developm…...

编程日记 2025/9/13 9:03:55

如何在netlify一键部署静态网站

1. 准备你的项目确保你的静态网站文件（如 HTML、CSS、JavaScript、图片等）都在一个文件夹中。通常，项目结构如下： my-static-site/ ├── index.html ├── styles/ │ └── styles.css └── scripts/└── script.js…...

编程日记 2025/9/14 15:04:01

网页制作09-html,css,javascript初认识のhtml如何使用表单

表单主要用来收集客户端提供的相关信息。,使网页具有交互作用。在网页制作的过程中，常常需要使用表单，如进行会员注册，网上调查和搜索等访问者可以使用如文本域列表框，复选框以及单选按钮之类的表单对象输入信息，然后…...

编程日记 2025/9/13 22:59:17

Linux 命令大全完整版（03）

1. 系统管理命令 screen 功能说明：多重视窗管理程序。语　　法：screen [-AmRvx -ls -wipe][-d <作业名称>][-h <行数>][-r <作业名称>][-s <shell>][-S <作业名称>]补充说明：screen 为多重视窗管理程序。此处…...

编程日记 2025/9/14 5:40:27

【新人系列】Python 入门专栏合集

✍ 个人博客：https://blog.csdn.net/Newin2020?typeblog 📝 专栏地址：https://blog.csdn.net/newin2020/category_12801353.html 📣 专栏定位：为 0 基础刚入门 Python 的小伙伴提供详细的讲解，也欢迎大佬们…...

编程日记 2025/9/14 15:06:39

嵌入式软件数据结构（一）链表知识点专栏附源码附原理

嵌入式软件数据结构（一）链表知识点专栏附源码附原理前言： 首先我们要知道什么是链表？ 什么是链表，链表是一种通过指针串联在一起的线性结构，每一个节点由两部分组成，一个是数据域一个是指…...

编程日记 2025/9/11 16:54:15

order by布尔盲注、时间盲注

pdo防御下，order by、limit不能参数绑定，可以进行sql注入案例：靶场的less-46 布尔盲注： import requests from lxml import htmldef get_id_one(URL, paload):res requests.get(urlURL, paramspaload)tree html.fromstring(…...

编程日记 2025/9/14 15:04:01

数据结构与算法-图论-最短路-拓展运用

选择最佳路线分析： 这是一道图论中的最短路径问题，目标是在给定的公交网络中，找到从琪琪家附近的车站出发，到她朋友家附近车站（编号为 s ）的最短时间。以下是对该问题的详细分析： 问题关键信息…...

编程日记 2025/9/14 3:43:50

数据开发的简历及面试

简历个人信息: 邮箱别写QQ邮箱, 写126邮箱/189邮箱等学历>>本科及以上写,大专及以下不写专业>>非计算机专业不写政治面貌>>党员写, 群众不用写掌握的技能: 精通 > 熟悉 > 了解专业工具: 大数据相关的公司: 如果没有可以写的>>金融服…...

编程日记 2025/9/13 18:54:06

android s下make otapackage编译失败

[DESCRIPTION] android s上，我司推荐使用split build的方式进行编译，但是部分客户依旧会采用AOSP full build的方式进行编译。而我司在这块release的时候，并未进行验证。因此执行make otapackage的时候，会出现如下报错。 [0312/…...

编程日记 2025/9/13 23:42:58

【算法通关村 Day12】字符串

字符串青铜挑战字符串转换转换为小写字母给你一个字符串 s ，将该字符串中的大写字母转换成相同的小写字母，返回新的字符串。leetcode791 public class ToLowerCase {/*** 将字符串中的大写字母转换为小写字母。** param s 输入字符串* return 转换…...

编程日记 2025/9/14 1:21:04

grafana K6压测

文章目录 install and runscript.jsoptions最佳实践 report 解析 https://grafana.com/docs/k6/latest/get-started install and run install # mac brew install k6当前目录下生成压测脚本 # create file script.js k6 new [filename] # create file ‘script.js’ in …...

编程日记 2025/9/11 14:12:38

SQLite 安装教程以及可视化工具介绍

目录简述 1. Windows 系统安装 1.1 下载预编译的二进制文件 1.2 解压文件 1.3 配置环境变量 1.4 验证安装 2. GUI 可视化工具 2.1 免费工具 2.1.1 DB Browser for SQLite 2.1.2 SQLiteStudio 2.1.3 SQLite Expert 2.1.4 SQLiteGUI 2.1.5 Antares SQL 2.1.6 DbGa…...

编程日记 2025/9/13 21:49:59

谷云科技iPaaS×DeepSeek：构建企业智能集成的核心底座

2025年，DeepSeek大模型的爆发式普及，正引领软件行业实现 “智能跃迁”。从代码生成到系统集成，从企业级应用到消费级产品，自然语言交互能力已成为新一代软件的核心竞争力。据行业分析，超60%的软件企业已启动大模型适配…...

编程日记 2025/9/11 7:26:05

mac 下 java 调用 gurobi 不能加载 jar

在 mac 电脑中的 java 始终不能加载 gurobi 的 jar 包，java 的开发软件 eclipse，idea 总是显示找不到 gurobi 的 jar 包，但是 jar 包明明就在那里。摸索了三个小时，最后发现原因竟然是： jar 包太新，替换…...

编程日记 2025/9/13 19:39:02

京准电钟：NTP精密时钟服务器在自动化系统中的作用

京准电钟：NTP精密时钟服务器在自动化系统中的作用京准电钟：NTP精密时钟服务器在自动化系统中的作用 NTP精密时钟服务器在自动化系统中的作用非常重要，特别是在需要高精度时间同步的场景中。NTP能够提供毫秒级的时间同步精度，这…...

编程日记 2025/9/8 15:34:01

京东-零售-数据研发面经【附答案】

近期，有参加春招的同学和我交流了他的面试历程，我针对这些内容进行了细致的总结与梳理，并在此分享出来，希望能助力大家学习与借鉴。 1.八股文 1）HashMap的底层原理是什么【见V6.0面试笔记 Java基础部分第19题】 2&am…...

编程日记 2025/9/7 11:42:42

面试之《react hooks在源码中是怎么实现的？》

要深入理解 React Hooks 在源码中的实现，可以从以下几个关键方面来剖析： 核心数据结构在 React 内部，使用链表来管理每个函数组件的 Hooks。每个 Hook 对应一个节点，这些节点通过 next 指针相连。以下是简化后的 Hook 节点结构…...

编程日记 2025/9/10 4:35:32

泛型的约束有哪几种？（C#）

目录 1 值类型约束（where T : struct） 2 引用类型约束（where T : class） 3 无参构造函数约束（where T : new ()） 4 基类约束（where T : <基类名>） 5 接口约束&#xff08…...

编程日记 2025/9/13 16:57:17

Harmony开发笔记（未完成）

一、感想作为一名拥有11年经验的Android开发者，我亲历了Android从高速发展到如今面临“僧多粥少”的过程。技术的世界瞬息万变，没有一种技术能够让人依赖一辈子。去年初，我自学了鸿蒙系统，并顺利通过了鸿蒙官方的初级和高级认。…...

编程日记 2025/9/14 0:50:04

DevSecOps普及：安全与开发运维的深度融合

一、引言随着软件开发模式的演进，DevOps已成为现代软件工程的主流实践。然而，在传统的DevOps流程中，安全往往被视为开发和运维之外的额外环节，导致安全漏洞在产品交付后才被发现，增加了修复成本和风险。为了解决这一…...

编程日记 2025/9/12 0:43:15

JavaScript 系列之：Ajax、Promise、Axios

前言同步：会阻塞。同步代码按照编写的顺序逐行依次执行，只有当前的任务完成后，才会执行下一个任务。异步：异步代码不会阻塞后续代码的执行。当遇到异步操作时，JavaScript 会将该操作放入任务队列中，继续…...

编程日记 2025/9/12 14:44:35

為什麼使用不限量動態住宅IP採集數據？

在瞭解“不限量動態住宅IP數據採集”之前，我們需要先搞清楚什麼是“動態住宅IP”。簡單來說，動態IP是一種會定期變化的IP地址，通常由互聯網服務提供商（ISP）分配給家庭用戶。與固定IP（靜態IP）不同…...

编程日记 2025/9/11 17:47:33

vue3-06vue2(Object.defineProperty)与vue3(基于ES6的Proxy)的响应式原理对比

1.vue2响应原理 1.1对于对象与数组对象类型: 通过 object.defineProperty() 对属性的读取、修改进行拦截 (数据劫持) 数组类型:通过重写更新数组的一系列方法来实现拦截。 (对数组的变更方法进行了包裹) Vue2的响应式是基于Object.defineProperty实现的 1.2 基本原理Objec…...

编程日记 2025/9/12 10:09:20

MySQL数据库入门到大蛇尚硅谷宋红康老师笔记高级篇 part 4

第04章_逻辑架构 1. 逻辑架构剖析首先MySQL是典型的C/S架构，即Client/Server架构，服务器端程序使用的mysqld。不论客户端进程和服务器进程是采用哪种方式进行通信，最后实现的效果都是：客户端进程向服务器进程发送一段文本&…...

编程日记 2025/9/11 8:29:00

清华大学DeepSeek文档下载，清华大学deepseek下载（完成版下载）

文章目录前言一、清华大学DeepSeek使用手册下载二、清华大学DeepSeek使用手册思维导图前言这是一篇关于清华大学deepseek使用手册pdf的介绍性文章，主要介绍了DeepSeek的定义、功能、使用方法以及如何通过提示语设计优化AI性能。以下是对这些核心内容的简要概述&…...

编程日记 2025/9/13 17:03:43

HDFS数据多目录、异构存储、回收站

1.NameNode元数据多目录 HDFS集群中可以在hdfs-site.xml中配置“dfs.namenode.name.dir”属性来指定NameNode存储数据的目录，默认NameNode数据存储在${hadoop.tmp.dir}/dfs/name目录，“hadoop.tmp.dir”配置项在core-site.xml中。我们也可以将NameNod…...

编程日记 2025/9/11 14:57:04

windows设置暂停更新时长

windows设置暂停更新时长 win11与win10修改注册表操作一致 ，系统界面不同 1.打开注册表 2.在以下路径 \HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\WindowsUpdate\UX\Settings 右键新建 DWORD 32位值，名称为FlightSettingsMaxPauseDays 根据需求填写数…...

编程日记 2025/9/11 1:26:00

04 路由表的IP分组传输过程

目录 1、路由表的核心结构 2、IP分组传输过程和数据包转发过程 2.1、IP分组传输过程 2.2、数据包转发过程 2.3、IP分组传输过程和数据包转发的区别 3、数据包的变化 3.1、拓扑结构 3.2、传输过程详解（主机A → 主机B） 3.2.1、主机A发送数据 3.2…...

编程日记 2025/9/13 3:34:24

实现Python+Django+Transformers库中的BertTokenizer和BertModel来进行BERT预训练，并将其应用于商品推荐功能

一、环境安装准备 #git拉取 bert-base-chinese 文件#创建虚拟运行环境python -m venv myicrplatenv#刷新source myicrplatenv/bin/activate#python Django 集成nacospip install nacos-sdk-python#安装 Djangopip3 install Django5.1#安装 pymysql settings.py 里面需要 # 强制…...

编程日记 2025/9/10 20:06:03

数据结构---定长顺序表

1.线性表的定义存在唯一的一个被称为“第一个”的数据元素；存在唯一的一个被称为“最后一个”的数据元素；除第一个之外，集合中的每一个数据元素都只有一个前驱；除最后一个之外，集合中的每一个数据元素都只有一个后继…...

编程日记 2025/9/12 13:08:46

Elasticsearch 相关面试题

1. Elasticsearch基础 Elasticsearch是什么？ Elasticsearch是一个分布式搜索引擎，基于Lucene实现。 Mapping是什么？ES中有哪些数据类型？ Mapping：定义字段的类型和属性。数据类型：text、keyword、integer、…...

编程日记 2025/9/12 20:17:55

冒泡排序（Bubble Sort）详细教程：Java实现与优化

一、什么是冒泡排序？ 冒泡排序（Bubble Sort）是一种简单的排序算法，它的基本思想是通过两两比较相邻元素，将较大的元素“冒泡”到数列的末尾。每一轮遍历会将一个较大的元素放到正确的位置，直到整个数组有序…...

编程日记 2025/9/14 4:57:41

【git】【reset全解】Git 回到上次提交并处理提交内容的不同方式

Git 回到上次提交并处理提交内容的不同方式在 Git 中，若要回到上次提交并对提交内容进行不同处理，可使用 git reset 命令搭配不同选项来实现。以下为你详细介绍操作步骤及各选项的作用。 1. 查看提交历史在操作之前，可通过以下命令查看提…...

编程日记 2025/9/13 5:08:03

矩阵的正定（Positive Definite）与负定（Negative Definite）：从Fisher信息矩阵看“曲率”的秘密

矩阵的正定与负定：从Fisher信息矩阵看“曲率”的秘密在数学和统计学中，矩阵的“正定性”和“负定性”是一对重要概念，尤其在优化、统计推断和机器学习中频繁出现。比如，Fisher信息矩阵（Fisher Information Matrix, F…...

编程日记 2025/9/12 9:23:58

Uniapp 小程序：语音播放与暂停功能的实现及优化方案

界面部分 //开启语音 <button class"open" v-if"showPlayfalse" click"playText">这是开启播放的图片</button >//关闭语音 <button class"close" v-if"showPlaytrue" click"stopText">这是…...

编程日记 2025/9/12 13:55:19

Python基于机器学习的微博舆情情感分析系统，微博评论情感分析可视化系统（全新升级）

大家好，今天为大家带来的是Python基于机器学习的微博舆情情感分析系统，微博评论情感分析可视化系统，这个系统在原本的系统上进行优化升级。算法从开源框架的 snlow ，到支持机器学习的 lstm 算法可以手动输入语句，进行…...

编程日记 2025/9/13 6:48:13

IP-------GRE和MGRE

4.GRE和MGRE 1.应用场景现实场景居家工作，公司工作，分公司工作----------需要传输交换数据--------NAT---在该场景中需要两次NAT（不安全） 为了安全有两种手段-----1.物理专线---成本高 2.VPN--虚拟专用网---隧道技术--封装技…...

编程日记 2025/9/13 16:20:14

内网综合渗透测试——WinterMute: 1靶场

靶场来源 <WinterMute: 1 ~ VulnHub> Wintermute 虚拟机网络配置指南本实验涉及网络跳转技术，需正确配置VirtualBox网络。所有IP均为动态分配，配置快速简便。通过"文件 >> 导入虚拟设备"导入各虚拟机。 STRAYLIGHT (网络#1 和 …...

编程日记 2025/9/9 4:24:21

项目进度管理工具：甘特图与关键路径法（2025实战指南）

在全球数字化转型加速的背景下，项目延期率高达42%的现状倒逼管理者掌握科学的进度管理工具。本文结合2025年最新实践，深度解析甘特图与关键路径法的原理及应用，助你构建精准可控的项目进度管理体系。一、双剑合璧：工具组合的价值…...

编程日记 2025/9/11 9:33:02

deepseek-r1-centos-本地服务器配置方法

参考： 纯小白 Centos 部署DeepSeek指南_centos部署deepseek-CSDN博客 https://blog.csdn.net/xingxin550/article/details/145574080 手把手教大家如何在Centos7系统中安装Deepseek，一文搞定_centos部署deepseek-CSDN博客 https://blog.csdn.net/soso67…...

编程日记 2025/9/13 21:44:06

C# Unity 唐老狮 No.2 模拟面试题

本文章不作任何商业用途仅作学习与交流安利唐老狮与其他老师合作的网站,内有大量免费资源和优质付费资源,我入门就是看唐老师的课程打好坚实的基础非常非常重要: Unity课程 - 游习堂 - 唐老狮创立的游戏开发在线学习平台 - Powered By EduSoho 如果你发现了文章内特殊的字体…...

编程日记 2025/9/14 8:16:08

一周学会Flask3 Python Web开发-flask3上下文全局变量session,g和current_app

锋哥原创的Flask3 Python Web开发 Flask3视频教程： 2025版 Flask3 Python web开发视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili flask3提供了session,g和current_app上下文全局变量来方便我们操作访问数据。以下是一个表格，用于比较Flask中的…...

编程日记 2025/9/8 17:41:15

SpringBoot整合Mybatis-Plus+Druid实现多数据源

概述 Spring Boot： Spring Boot是一个基于Spring框架的开源Java开发框架，旨在简化Spring应用程序的开发、配置和部署。它提供了一种快速、敏捷的方式来构建独立的、生产级别的Spring应用程序，同时还提供了许多开箱即用的功能和工具&#xff0…...

编程日记 2025/9/6 21:13:48