Ubuntu打开中文文本乱码
文章目录
- 中文乱码问题
- 修复乱码
- 系统字符编码
- 修改文本编码
- 修改vim乱码
- utf-8
- 编码原理
- 特点
- 应用场景
- 与其他编码的转换
- iso-8859-1
- 基本信息
- 字符涵盖
- 应用场景
- 与其他编码的关系
ubuntu打开文本出现乱码,可能是编码没设置对。
中文乱码问题
- 使用vim打开文本,或者cat文本都是乱码
cat 1.txt
修复乱码
系统字符编码
修改/etc/bash.bashrc在最后添加
export LC_ALL="C.UTF-8"
再调用
source /etc/bash.bashrc
修改文本编码
- 使用file命令查看文本编码是iso-8859-1
file -bi 1.txt
text/plain; charset=iso-8859-1
- 转换文本编码
先转换再打开
使用iconv,其命令方式如下
iconv -f 原编码 -t UTF - 8 原文件名 -o 新文件名
针对本例命令改为
iconv -f iso-8859-1 -t UTF-8 1.txt -o 1.txt
再cat发现还是乱码,正确命令如下
iconv -f GBK -t UTF-8 1.txt -o 1.txt
或者先打开文本再转换
cat 1.txt | iconv -f GBK -t UTF-8
这两种方式cat都正常了,但是使用vi打开文本还是乱码。
修改vim乱码
/etc/vim/vimrc添加以下内容
set fileencodings=utf-8,gb2312,gbk,gb18030
set termencoding=utf-8
set fileformats=unix
set encoding=prc
utf-8
编码原理
UTF - 8 使用 1 到 4 个字节来表示一个字符。对于 ASCII 码中的字符(0 - 127),UTF - 8 用 1 个字节表示,且编码与 ASCII 码相同,这保证了对 ASCII 字符的向后兼容性。对于其他 Unicode 字符,根据字符的 Unicode 码点大小,使用不同数量的字节进行编码。例如,常用的汉字通常用 3 个字节表示。
特点
- 通用性:它可以表示 Unicode 字符集中的任意字符,涵盖了世界上几乎所有的语言和符号,包括各种生僻的汉字、少数民族文字、特殊符号等,具有很强的通用性和兼容性。
- 变长编码:根据字符的使用频率来动态调整编码长度。对于频繁使用的字符,如 ASCII 字符,采用较短的编码长度,而对于不常用的字符则使用较长的编码长度,这样可以在存储和传输文本数据时节省空间。
- 自同步性:UTF - 8 编码具有自同步特性,即从任何位置开始读取字节流,都能快速确定每个字符的边界,便于对文本进行处理和解析,提高了数据处理的效率和准确性。
应用场景
- 网络应用:在互联网上,UTF - 8 是主流的字符编码。几乎所有的网页、电子邮件、XML 和 JSON 数据等都使用 UTF - 8 编码来确保不同语言和地区的用户能够正确地显示和交互文本信息。
- 操作系统:现代操作系统如 Windows、macOS 和 Linux 等都广泛支持 UTF - 8 编码,将其作为默认或重要的字符编码之一,用于文件系统、终端输入输出以及各种应用程序的文本处理。
- 数据库:许多数据库系统也支持 UTF - 8 编码,用于存储和查询各种语言的文本数据,保证了多语言环境下数据的正确存储和检索。
与其他编码的转换
可以使用多种工具和编程语言中的相关函数来实现 UTF - 8 与其他编码(如 ISO - 8859 - 1、GBK 等)之间的转换。例如,在 Java 中,可以使用InputStreamReader和OutputStreamWriter来进行不同编码之间的转换操作;在 Python 中,可以使用encode和decode方法来实现字符编码的转换。但在转换过程中需要注意字符集的兼容性,以避免数据丢失或乱码问题。
iso-8859-1
ISO - 8859 - 1 是一种字符编码标准,也被称为 Latin - 1。以下是关于它的详细介绍:
基本信息
- 定义:ISO - 8859 - 1 是国际标准化组织(ISO)制定的 ISO - 8859 字符集系列中的第一个编码标准,主要用于表示西欧语言的字符。
- 编码范围:它使用单字节编码,能表示 256 个不同的字符,编码范围从 0x00 到 0xFF。
字符涵盖
- 控制字符:包含了一些标准的 ASCII 控制字符,如换行、回车等,用于控制文本的格式和传输。
- 可打印字符:包括了大写和小写的英文字母、数字、标点符号以及一些特殊字符,如@、#、$等。此外,还涵盖了西欧语言中常见的带重音符号的字母,如á、é、í、ó、ú等,这使得它能够满足大多数西欧语言的基本字符表示需求。
应用场景
- 历史应用:在早期的计算机系统和互联网应用中广泛使用,特别是在处理西欧语言的文本数据时。例如,在 HTML 4.01 标准中,ISO - 8859 - 1 是默认的字符编码之一,许多早期的网页也是使用该编码来显示文本内容。
- 特定领域:尽管现在 UTF - 8 等更通用的编码逐渐占据主导地位,但 ISO - 8859 - 1 在一些特定领域仍然有应用。比如,在一些旧版的软件系统、遗留的文本文件格式以及某些特定的工业控制系统中,可能还会使用 ISO - 8859 - 1 编码来保证与原有系统的兼容性。
与其他编码的关系
- 与 ASCII 的关系:ISO - 8859 - 1 的前 128 个字符(0x00 - 0x7F)与 ASCII 编码完全相同,这保证了它与早期基于 ASCII 的系统和应用的兼容性。
- 与 UTF - 8 的转换:由于 ISO - 8859 - 1 和 UTF - 8 都是常见的字符编码,在实际应用中经常需要进行转换。可以使用各种编程语言中的字符编码转换函数或工具来实现两者之间的转换。例如,在 Python 中,可以使用encode和decode方法来进行字符编码的转换。
作者:帅得不敢出门
相关文章:
Ubuntu打开中文文本乱码
文章目录 中文乱码问题修复乱码系统字符编码修改文本编码修改vim乱码 utf-8编码原理特点应用场景与其他编码的转换 iso-8859-1基本信息字符涵盖应用场景与其他编码的关系 ubuntu打开文本出现乱码,可能是编码没设置对。 中文乱码问题 使用vim打开文本,或…...
车载通信网络安全:挑战与解决方案
1. 简介 当今时代见证了车载汽车技术的巨大发展,因为现代智能汽车可以被视为具有出色外部基础设施连接能力的信息物理系统 [ 1 ]。车载技术支持的现代智能汽车不应被视为类似于机械系统,而是由数百万行复杂代码组成的集成架构,可为车内乘客提…...
【Linux系统】读写锁
读者写者问题 重点 读者写者问题是并发编程中的经典问题,主要研究多个进程或线程对共享数据进行读和写操作时如何实现同步和互斥,以保证数据的一致性和操作的正确性 。 问题核心要点 同步与互斥:需要确保多个读者可以同时读共享数据&#…...
springBoot中自定义一个validation注解,实现指定枚举值校验
缘由 在后台写接口的时候,经常会出现dto某个属性是映射到一个枚举的情况。有时候还会出现只能映射到枚举类中部分枚举值的情况。以前都是在service里面自行判断,很多地方代码冗余,所以就想着弄一个自定义的validation注解来实现。 例如下面某…...
【Python】--装饰器
装饰器(Decorator)本质上是一个返回函数的函数 主要作用是:在不修改原函数代码的前提下,给函数增加额外的功能 比如:增加业务,日志记录、权限验证、执行时间统计、缓存等场景 my_decorator def func():pas…...
排序算法——堆排序
一、介绍 「堆排序heapsort」是一种基于堆数据结构实现的高效排序算法。我们可以利用已经学过的“建堆操作”和“元素出堆操作”实现堆排序。 1. 输入数组并建立小顶堆,此时最小元素位于堆顶。 2. 不断执行出堆操作,依次记录出堆元素,即可得…...
Day111 | 灵神 | 二叉树 | 验证二叉搜索树
Day111 | 灵神 | 二叉树 | 验证二叉搜索树 98.验证二叉搜索树 98. 验证二叉搜索树 - 力扣(LeetCode) 方法一:前序遍历 递归函数传入合法的左右边界,只有当前结点是合法的边界,才是二叉搜索树,否则就返回…...
软考-软件设计师中级备考 13、刷题 数据结构
倒计时17天时间不多了,数据库、UML、等知识点有基础直接略过,法律全靠考前的一两天刷题,英语直接放弃。 一、数据结构:链表、栈、队列、数组、哈希表、树、图 1、关于链表操作,说法正确的是: A)新增一个头…...
【5G通信】天线调整
在天线工程中,机械下倾角、电子下倾角和数字下倾角是调整天线波束指向的不同技术手段,其核心区别在于实现方式和灵活性: 1. 机械下倾角(Mechanical Downtilt) 定义:通过物理调整天线的安装角度,…...
Kafka的Log Compaction原理是什么?
Kafka的Log Compaction(日志压缩)是一种独特的数据保留策略,其核心原理是保留每个key的最新有效记录。以下是关键原理分点说明: 1. 键值保留机制 通过扫描所有消息的key,仅保留每个key对应的最新value值。例如&#…...
嵌入式面试八股文(十四)·内存管理机制、优先级继承机制以及优先级翻转
目录 1. 内存管理算法(五种内存管理机制) 1.1 heap_1.c 1.2 heap_2.c 1.3 heap_3.c 1.4 heap_4.c 1.5 heap_5.c 1.6 总结 2. STM32通知寄存器有哪些? 2.1 核心寄存器组(Cortex-M) 2.2 特殊功能寄存…...
深度剖析:可视化如何重塑驾驶舱信息交互模式
为什么你开车时总觉得“信息太多却抓不住重点”? 今天的汽车早已不是单纯的交通工具,而是一个高度集成的信息终端。从导航、油耗、胎压到自动驾驶提示,各种数据不断涌进驾驶舱。 但问题也随之而来: 关键信息被淹没在一堆图标里…...
app根据蓝牙名字不同,匹配不同的产品型号,显示对应的UI界面
在开发一个 App 时,如果希望根据蓝牙设备名称(Bluetooth Name)的不同,自动匹配不同的产品型号,并显示对应的 UI 界面,可以按照以下思路来实现: ✅ 功能目标 扫描并连接蓝牙设备;获取…...
数据结构 --- 栈
1.栈的初始化 2.入栈 3.出栈 4.取出栈顶元素 5.获取栈中有效元素个数 6.栈的销毁 栈:⼀种特殊的线性表,其只允许在固定的⼀端进⾏插⼊和删除元素操作。进⾏数据插⼊和删除操作 的⼀端称为栈顶,另⼀端称为栈底。栈中的数据元素遵守后进先…...
37-算法打卡-栈与队列-滑动窗口最大值-leetcode(239)-第三十七天
1 题目地址 239. 滑动窗口最大值 - 力扣(LeetCode)239. 滑动窗口最大值 - 给你一个整数数组 nums,有一个大小为 k 的滑动窗口从数组的最左侧移动到数组的最右侧。你只可以看到在滑动窗口内的 k 个数字。滑动窗口每次只向右移动一位。返回 滑…...
【原创分享】魔音变声器内含超多语音包实时变声
魔音变声器,一款专业的调音变声器软件 亲测可使用所有功能[真棒] 去除所有广告 ————————————【下 载 地 址】———————————— 【获取方法1】:https://pan.xunlei.com/s/VOP_TXtKNlevTgYvIlxmmJquA1?pwd8vpi# ————————————【下 …...
数据结构(一)——线性表的顺序表示和实现
一、线性表的定义 由n(n>0)个数据特性相同的元素构成的有限序列称为线性表,(n0)的时候被称为空表。 一个数据元素可以是简单的一个数据,一个符号,也可以是复杂的若干个数据项的组合。 二、线性表的类型定义 s线性表是由n(n≥0)个相同类…...
Winform(12.控件讲解)
ChildForm窗口: ChildForm代码: using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System.Linq; using System.Text; using System.Threading.Tasks; using System.Windows.Forms; namespac…...
Python 10天冲刺 《元编程(Meta-programming)》
Python 的元编程(Meta-programming)是指在程序运行期间动态生成、修改或操作代码的技术。它允许开发者通过代码控制代码的行为,从而实现灵活、可扩展和抽象化的编程模式。Python 提供了多种元编程工具,包括装饰器、元类、动态导入…...
Android开发-创建、运行、调试App工程
在移动应用开发的世界里,Android平台凭借其开放性和广泛的设备支持,成为了许多开发者的选择。而要成为一名合格的Android开发者,掌握如何创建、运行以及调试应用程序是必不可少的基础技能。本文将详细介绍如何使用Android Studio完成这些任务…...
系统级编程(二):通过读取PE文件获取EXE或者DLL的依赖
PE文件 Windows的PE文件(Portable Executable)是一种专为Windows操作系统设计的标准可执行文件格式,用于存储和管理可执行程序、动态链接库(DLL)、驱动程序等二进制文件。PE文件格式自Windows NT 3.1引入以来,已成为Windows平台上所有可执行文件的标准格式,并广泛应用于…...
Linux主机时间设置操作指南及时间异常影响
一、Linux主机时间设置命令操作指南 1. 查看当前系统时间与时区 查看当前时间与时区:timedatectl # 显示详细时间与时区信息(systemd系统适用) date # 查看当前系统时间 hwclock --show # 查看硬件时…...
GPS定位方案
目录 一、常用的GPS定位方案包括: 二、主流品牌及热销型号 三、常用GPS算法及核心逻辑: 一、基础定位算法 二、高精度算法 三、辅助优化算法 四、信号处理底层算法 四、基本原理(想自己写算法的琢磨一下原理) 一、常用的GP…...
应对联网汽车带来的网络安全挑战
数字化加速正在彻底改变全球各行各业,而汽车行业更是走在了前列。目前,全球自动驾驶汽车保有量约为4860万辆,预计到2024年将增长至5420万辆。 智能汽车的崛起无疑令人兴奋,但也带来了一系列问题。为了保护客户免受新的威胁,汽车行业必须做出一系列考量:针对自动驾驶、网…...
人工智能与生命科学的深度融合:破解生物医学难题,引领未来科技革命
引言 随着人工智能技术的飞速发展,生命科学领域迎来了前所未有的变革。从药物研发到疾病预测,从个性化医疗到基因组学,AI的深度融入不仅加速了生物医学的进步,还在多个领域打破了传统科学研究的局限,开创了新的医学前沿…...
DeepSeek智能时空数据分析(七):4326和3857两种坐标系有什么区别?各自用途是什么?
序言:时空数据分析很有用,但是GIS/时空数据库技术门槛太高 时空数据分析在优化业务运营中至关重要,然而,三大挑战仍制约其发展:技术门槛高,需融合GIS理论、SQL开发与时空数据库等多领域知识;空…...
Qt/C++面试【速通笔记七】—Qt中为什么new QWidget不需要手动调用delete?
在Qt的开发中,管理内存是一个非常重要的话题,特别是在使用QWidget这类窗口组件时,很多开发者会遇到一个问题:“为什么我使用new QWidget创建的窗口对象不需要手动调用delete进行销毁?”。 1. 父子关系机制:…...
Super-vlan
Super VLAN(VLAN聚合)的理论与配置 1. 基本概念 Super VLAN(超级VLAN)是一种VLAN聚合技术,主要用于解决传统VLAN划分中IP地址浪费的问题。其核心思想是将多个Sub VLAN(子VLAN)聚合到一个Super …...
C——函数
一、函数的概念 数学中我们其实就⻅过函数的概念,⽐如:⼀次函数 y kx b ,k和b都是常数,给⼀个任意的 x,就得到⼀个y值。 其实在C语⾔也引⼊函数(function)的概念,有些翻译为&…...
5.6刷题并查集
P1551 亲戚 #include<bits/stdc.h> using namespace std; const int N 5010; int f[N]; int find(int x){if(f[x] x)return x;return f[x] find(f[x]); } void solve(){int n, m, p; cin >> n >> m >> p;for(int i 1; i < n; i)f[i] i;for(in…...
pcl平面投影
// 创建一个系数为XY0,Z1的平面pcl::ModelCoefficients::Ptr coefficients (new pcl::ModelCoefficients ());coefficients->values.resize (4);coefficients->values[0] coefficients->values[1] 0;coefficients->values[2] 1.0;coefficients->values[3] 0…...
Linux远程管理
如何查看ip 如何使用vim编辑器 如何设置网络信息 远程访问 一:网络管理 (1)获取计算机的网络信息 基本语法: windows ipconfig ifconfig enS33: f1agS4163<UP,BR0ADCAST,RUNNING,MULTICAST> mtu 1500 inet…...
如何添加或删除极狐GitLab 项目成员?
极狐GitLab 是 GitLab 在中国的发行版,关于中文参考文档和资料有: 极狐GitLab 中文文档极狐GitLab 中文论坛极狐GitLab 官网 项目成员 (BASIC ALL) 成员是有权访问您的项目的用户和群组。 每个成员都有一个角色,这决定了他们在项目中可以…...
2025年服务器技术全景解析:量子计算、液冷革命与未来生态构建
2025年服务器技术全景解析:量子计算、液冷革命与未来生态构建 一、量子计算:从实验室到产业化的跨越 1. 中国量子计算产业化突破 • 本源量子“悟空”超导计算机: 搭载72位自主超导量子芯片“悟空芯”,支持198个量子比特…...
Vue3+ Vite + Element-Plus + TypeScript 从0到1搭建
一环境准备 二vite 项目初始化 按照 🍃Vite 官方文档 - 搭建第一个 Vite 项目 说明,执行以下命令完成 vue 、typescirpt 模板项目的初始化 npm init vitelatest vue3-element-admin --template vue-tsvue3-element-admin: 自定义的项目名称 vue-ts &am…...
如何对 Redis 进行水平扩展和垂直扩展以应对微服务流量的增长?
核心概念: 垂直扩展 (Scale Up): 提升单个节点的性能。简单来说就是给现有的 Redis 服务器增加更多的 CPU 、内存、更快的存储(SSD)或更高的网络带宽。水平扩展 (Scale Out): 增加更多节点来分担负载。这意味着部署多个 Redis 实例ÿ…...
PyCharm 加载不了 conda 虚拟环境,不存在的
#工作记录 前言 在开发过程中,PyCharm 无法加载 Conda 虚拟环境是常见问题。 在不同情况下,“Conda 可执行文件路径”的指定可能会发生变化,不会一尘不变,需要灵活处置。 以下是一系列解决此问题的经验参考。 检查 Conda 安装…...
Matlab/Simulink的一些功能用法笔记(4)
水一篇帖子 01--MATLAB工作区的保护眼睛颜色设置 默认的工作区颜色为白色 在网上可以搜索一些保护眼睛的RGB颜色参数设置 在MATLAB中按如下设置: ①点击预设 ②点击颜色,点击背景色的三角标符号 ③点击更多颜色,找到RGB选项 ④填写颜色参数…...
OS7.【Linux】基本指令入门(6)
目录 1.zip和unzip 配置指令 使用 两个名词:打包和压缩 打包 压缩 Linux下的操作演示 压缩和解压缩文件 压缩和解压缩目录 -d选项 2.tar Linux下的打包和压缩方案简介 czf选项 xzf选项 -C选项 tzf选项 3.bc 4.uname 不带选项的uname -a选项 -r选项 -v选项…...
便捷OCR文字识别软件推荐
软件介绍 此次要介绍的是一款OCR识别软件。 核心功能及特点 这款小巧的OCR识别软件,功能简洁,操作方便,只需进行截图,随后就能自动识别文字内容。并且,它具备离线使用的特性,这一特点使得它非常适合在不联…...
【中间件】brpc_基础_栈管理
文章目录 BRPC bthread栈管理1 简介2 关键数据结构2.1 栈描述符 (bthread_stack_t)2.2 栈池 (StackPool) 3 核心操作3.1 栈分配 (bthread_stack_alloc)3.2 栈释放 (bthread_stack_dealloc)3.3 栈切换支持 4 性能优化5 安全性设计6 跨平台实现6.1 Linux6.2 Windows 7 应用场景8 …...
Linux 硬盘和光驱系统管理
一、硬盘与目录的容量 [rootwww ~]# df [-ahikHTm] [目录或档名] 选项与参数: -a :列出所有的档案系统,包括系统特有的 /proc 等档案系统; -k :以 KBytes 的容量显示各档案系统; -m :以 MByt…...
分库分表后复杂查询的应对之道:基于DTS实时性ES宽表构建技术实践
1 问题域 业务发展的初期,我们的数据库架构往往是单库单表,外加读写分离来快速的支撑业务,随着用户量和订单量的增加,数据库的计算和存储往往会成为我们系统的瓶颈,业界的实践多数采用分而治之的思想:分库…...
[三分钟]性能测试工具JMeter入门: 下载安装JMeter并设置中文;JMeter基本使用流程
文章目录 1.下载并打开JMeter2.设置JMeter中文3.JMeter基本使用流程 Apache JMeter 是 Apache 组织基于 Java 开发的压力测试工具。 JMeter 支持多种协议和技术,如 HTTP、HTTPS、FTP、JDBC、SOAP、REST、JMS 等。它不仅可以用于性能测试,还可以用于功能测…...
StableDiffusionWebUI的AI绘图AI绘视频详细使用教程+报错排坑
概述 这里是官方的最原始的体积最小的StableDiffusionWebUI的下载及其使用教程,已经帮你们把坑都排完了,本教程适合开发者、程序员自己折腾,源码体积只有1.8M。 从0安装到绘图 1.环境 Python与Git环境: 安装Python3.10.0 >…...
Flutter 合并 ‘dot-shorthands‘ 语法糖,Dart 开始支持交叉编译
最近在 Dart 在 main 3.9 合并了一项名为 「dot-shorthands」 的语法糖提议,该提议主要是为了简化开发过程中的相关静态固定常量的写法,通过上下文类型推断简化枚举值和静态成员的访问: 简单来说,就是在之前你可能需要写 SomeEnum…...
貌似我的ollama加载的模型被下载了两份?终于搞懂原理了。
文章目录 背景ollama的模型默认会被放在哪儿呢?什么是homedir?ollama服务直接ollama serve如何修改保存模型文件的路径?背景 如果你想以最快的方式,部署本地的大模型,那么ollama无疑是最合适的选择之一。我其实linux用的不多。之前一直是在windows上部署的ollama。后来有…...
【HarmonyOS 5】鸿蒙用户头像编辑功能实践
【HarmonyOS 5】鸿蒙用户头像编辑功能实践 一、前言 1、应用背景 在鸿蒙化开发过程中,我们发现最基本常见的功能–用户头像的编辑,实现方式和Android与IOS有极大的不同。 在实际开发和调研的过程中,我们发现并总结了鸿蒙隐私处理与业内Android和IOS的差异性。发现隐私保…...
VTK|结合qt创建通用按钮控制显隐(边框、坐标轴、点线面)
文章目录 增加边框BoundingBox添加addBoundingBox添加BoundingBox控制按钮点击按钮之后的槽函数 添加坐标轴增加点线面显隐控制按钮添加控制点线面显隐的按钮到三维显示界面控制面显示槽函数控制线显示槽函数控制点显示槽函数 增加边框BoundingBox 增加边框BoundingBox并通过按…...
Python Cookbook-7.3 在 Pickling 的时候压缩
任务 你想以一种压缩的方式来 pickle 一般的 Python 对象。 解决方案 标准库模块 cPickle 和 gzip提供了所需的功能;你只需以适当的方式将它们粘合起来即可: import cPickle,gzip def save(filename,*objects):将对象存为压缩过的磁盘文件fil gzip.open(filename,wb)for o…...