DDI0487--A1.7
Introduction
RAS(Reliability,Availability,Serviceability)
RAS是衡量一个系统可靠性的三个方面:
Reliability——持续提供正确服务的能力。
Availability——正确提供服务的准备状态。
Serviceability——能够进行修改和修复的能力。
RAS技术能够减少意外停机情况的发生,原因在于:
短暂性错误能够在它们导致应用程序或系统出现故障之前被检测出并予以纠正。
出现故障的部件能够被识别出来并予以更换。
提前预测出可能出现的故障,以便在计划性维护期间进行更换。
Faults,errors,and failures
当服务实现了系统功能时,即为正确的服务交付。
正确的服务可能包括:
得出正确的结果。
在分配给该任务的时间内完成任务并取得结果。
不泄露机密和安全信息。
为了描述RAS扩展和RAS系统架构,偏离正确服务的情况下使用以下定义:
故障(failure)指的是偏离正确服务状态的情况。这包括数据损坏,数据丢失和服务丢失。
错误(error)即偏离正确服务的表现。存在错误的不正确值是无效的。
错误(error)的根源是故障(fault)。
未被检测到却确实存在的错误被称为潜在错误或未被发现的错误。
在没有错误检测的系统中,所有错误都是潜在错误,它们会通过各个组件默默地传播下去,直到被掩盖住或产生故障。
故障的严重程度可以从轻微到灾难性的范围变化:
一次小失误所带来的后果与正确服务交付所带来的益处相比,其代价是相当的。
灾难性故障所带来的有害后果要比正确服务交付所带来的益处高出好几个数量级,甚至高的无法相提并论。
一个系统中存在诸多故障源,包括软件和硬件故障:
硬件故障源自硬件内部或者影响硬件本身。
软件故障影响的是软件本身,即程序或数据。
RAS扩展和RAS系统架构主要针对有硬件故障引发的错误。这些错误主要分为2个方面:
瞬时性故障。
非暂时性故障或持续性故障。
General taxonomy of errors
错误检测
当一个组件访问内存或其他状态时,可能会在内存或该状态中检测到错误。
该错误可能会由组件自行修正或推迟处理,或被标记为“延迟错误”或“检测错误”传递给另一个组件。
错误传播
当事务的生产者给消费者传递一个值或信号时,就发生了事务处理。
Transactions是生产者给消费者提供的服务的一部分。
在许多协议和服务接口定义中,高级事务由一系列操作组成,例如在Requester和Completer之间。
就本手册而言,生产者和消费者之间单向传输的最基本形式被认为是transaction。
也就是说,操作序列中的每一个都被视为一个单独的事务。
对于某些操作,例如请求,请求者是生产者,完成者是消费者。
对于其他操作,例如响应,完成者是生产者,请求者是消费者。
当服务接口因错误而不正确时,错误将由事务的生产者传播。错误被传播给消费者。
错误是通过偏离正确的服务传播的,包括以下任何一种情况,如果没有激活故障,这些情况是不允许发生的:
损坏的值从生产者传递给消费者。
发生了不该发生的事务或其他操作。
应该发生的事务或其他操作没有发生。
在多处理器一致系统中,可以观察到单处理器语义的丢失或任何其他一致性的丢失。
更改事务或其他操作的时间和/或顺序,使这些事务或操作的时间和/或顺序不正确。
在这种情况下,服务接口为事务和其他操作定义可接受的时间和/或顺序。
如果事务的消费者无法检测到错误,并且由于事务而消耗未检测到的错误,则错误将由事务的生产者静默传播。这可能是由于:
事务中存在错误,但未被生产者检测到。该错误由生成器以静默方式传播。
该错误存在于事务中,但没有作为错误向消费者发出信号。例如,在事务中传递了已损坏的值,但没有任何迹象表明它已损坏。该错误由生成器以静默方式传播。
如果事务导致错误变得无法检测,则潜在的(可能检测到的)错误将由其他正确事务的消费者静默传播。
在系统中,错误可能会被逐级传播,直至一下情况之一发生:
它们被屏蔽,并不会影响到系统的运行结果。
错误可能被掩盖,因为不正确的值被丢弃或覆盖,或错误被检测出并移除。
它们会影响系统的服务接口,并有可能导致故障。如果错误已经悄然而至服务接口,那么:
这是一种无声数据损毁(Silent Data Corruption,SDC)。
此故障(以每十亿太设备运行一小时操作的故障数量衡量)的发生率被称为“无声故障发生率”。简称SDC FIT率。
或者该错误可能已经被检测,从而导致系统调用错误处理和恢复机制。更多信息,请出参阅Arm Reliability,Availability,and Serviceability(RAS)System Architecture,for A-profile architecture(ARM IHI 0100).
Infected and poisoned
当组件收到一个未修正的错误并据此更新其状态时,该组件状态就会受影响变得infected。
如果某个值在组件的状态中被标记为存在错误,则称其处于被污染状态,这样一来,在后续对状态的访问中,会检测到该值已被标记为存在错误,并将其视为已检测到的错误。
poison用于掩饰错误。
可控制和不可控制的
未被发现的错误会在未检测到该错误的组件中不能得到遏制。
一个无声息传播的错误在无声息传播的组件中得不到遏制。
如果组件中检测到未纠正错误,则在该组件中不被控制。
如果在组件上中检测到的未纠正错误不是不可控的,则在组件上是可控的。
如果组件无法确定检测到的未纠正错误是在组件上不可控制还是在组件上可控制,则组件将检测到的未纠正错误视为在组件上不可控。
在组件上不可控的错误可能在系统级别上是可控的。
将错误报告为可控则允许软件遏制该错误。这并不意味着硬件已经遏制了错误。
相关文章:
DDI0487--A1.7
Introduction RAS(Reliability,Availability,Serviceability) RAS是衡量一个系统可靠性的三个方面: Reliability——持续提供正确服务的能力。 Availability——正确提供服务的准备状态。 Serviceability——能够进行修改和修复的能力。 R…...
MySQL事务(transaction)(笔记)
事务(Transaction)(必须掌握必须理解) 1.什么是事务? 一个事务是一个完整的业务逻辑单元(一个业务逻辑单元常常涉及到多条DML语句共同执行完成),不可再分(最小的工作单元) 一个事务就是一个业务,完成一个…...
ADS1299模拟前端(AFE)代替芯片——LHE7909
在现代医疗科技的飞速发展中,精确的生物电势测量设备变得越来越重要。领慧立芯推出的LHE7909,是一款专为心电图(ECG)和其他生物电势测量设计的低噪声24位模数转换器(ADC),为医疗设备制造商提供了…...
(三十二)Android开发中AppCompatActivity和Activity之间的详细区别
在 Android 开发中,AppCompatActivity 和 Activity 是两个核心类,用于创建和管理应用程序的用户界面。尽管它们功能上有重叠,但它们之间存在显著的区别。本文将详细讲解 AppCompatActivity 和 Activity 的区别,并结合代码示例和具…...
Neo4j 的 `SET n += $properties` 语法详解
Neo4j 的 SET n $properties 语法详解 SET n $properties 是 Neo4j Cypher 查询语言中的一个非常有用的语法,用于更新节点或关系的属性。让我详细解释它的含义和工作原理: 基本含义 SET:Cypher 中用于修改属性或标签的关键字n࿱…...
springboot 框架把 resources下的zip压缩包, springboot 项目启动后解压到项目根目录工具类
最近有一个需求,在开发的时候 有一些c的扩展文件 需要放到服务器上,如果手动放上去,给用户部署项目就很麻烦,就根据这个需求,先把项目需要的 扩展文件 打包成zip压缩包 然后项目启动的时候 把resources文件夹下的 zip压…...
指针(5)
1.sizeof 和 strlen 的对比 1.1sizeof sizeof 是操作符,sizeof 计算变量所占内存空间的大小,单位是字节,如果操作数是类型的话,计算的是使用类型创建的变量所占空间的大小。 sizeof 只关注占用内存的空间的大小,不在…...
机器学习day4-Knn+交叉验证api练习(预测facebook签到位置)
数据集:FackebookV : 预测 row id:签⼊事件的id x y:坐标 accuracy: 准确度,定位精度 time: 时间戳 place_id: 签到的位置,需要预测的内容 具体步骤: # 1.获取数据集 # 2.基本数据处理 # 2.1 缩⼩数据…...
AI工具 Trae 创建java项目和配置运行环境完整示例
以下是使用字节跳动 Trae IDE 创建 Java 项目并配置运行环境的完整示例,结合其核心功能和搜索结果的实践案例整理: 一、环境准备与安装 下载与安装 访问 Trae 官网 下载 Windows 或 macOS 版本客户端,安装完成后选择中文界面和主题(推荐 Dark/DeepBlue 主题)。首次启动时支…...
【论文_序列转换模型架构_20230802v7】Attention Is All You Need 【Transformer】
https://arxiv.org/abs/1706.03762 20170612 v1 代码实现_notebook ∗Equal contribution. Listing order is random. Jakob proposed replacing RNNs with self-attention and started the effort to evaluate this idea. 提出用 self-attention 替代 RNNs,并开始…...
清晰易懂的跨域请求知识——拿捏
1. 什么是跨域请求? 简单来说:当你的 前端网页(例如 http://frontend.com)通过 JavaScript 调用 后端接口(例如 http://backend.com/api)时,如果两者的 域名、端口、协议 中任意一项不同&#…...
前端漏洞不扫描理由
漏洞类型豁免理由基于DOM的XSS1.已实施安全加固: 使用encodeURIComponent对URL参数进行编码 对特殊字符(<>“”&)进行HTML实体转义 使用template literal替代字符串拼接 移除了直接操作DOM的不安全写法,二次扫描仍然扫描出来,且修改建议模糊 2…...
论文阅读的三个步骤
论文阅读的三个步骤 方法说明链接:https://www.academia.edu/4907403/How_to_Read_a_Paper 方法框架如下...
Javascript 中的继承?如何实现继承?
一、继承的本质 继承:子对象可以自动拥有父对象的属性和方法,就像孩子继承父母的基因。JavaScript 的继承:通过原型链实现(原型和原型链是底层核心)。 二、4 种常见继承方式 1. 原型链继承(传家宝模式&am…...
深入理解 Linux 权限管理:从基础到进阶
在 Linux 系统中,权限管理是保障系统安全与资源合理分配的核心机制。无论是服务器管理员,还是日常使用 Linux 的开发者,深入掌握权限管理,不仅能避免因权限设置不当导致的数据泄露或系统故障,还能灵活高效地管理各类资…...
第1阶段-前5天-考试题及答案
文章目录 1.1 用户 root 的家目录是哪里?1.2 如何查询 linux 系统 ip 地址?1.3 检查是否可以访问 baidu.com 的命令?1.4 [rootoldboy-c7 /etc/sysconfig/ ]# 说说每一部分含义?1.5 说说 Linux 常见快捷键?(至少 3 个)1.6 Windows 分为 C 盘,D 盘,但是 Linux 一切从 根或/ …...
农村供水智能化远程监控解决方案
农村供水智能化远程监控解决方案 ——基于巨控GRM242Q-4D4I4Q(HE)模块的快速部署方案 一、项目需求与痛点 某西南山区农村供水项目需管理12个分散站点,每个站点包含: 4-20mA模拟量:压力传感器、流量计485通信设备:智能水表&…...
4月29日星期二今日早报简报微语报早读
4月29日星期二,农历四月初二,早报#微语早读。 1、特朗普声称中方领导人打了电话,外交部:近期中美元首没有通话; 2、跳水世界杯总决赛名单出炉,“梦之队”全主力出战; 3、深圳:对年…...
C++日更八股--first
### 内存static和dynamic的区别 static(静态) 和 dynamic(动态)<br> static:内存分配在编译的时候确定,大小和生命周期固定,无需运行时分配开销<br> dynamic:内存分配在运行时动态申请…...
Git操作指令
1.基础操作指令: (1).查看修改的状态(git status): 查看修改的状态(暂存区、工作区) (2).添加工作区到暂存区(git add 单个文件名 | 通配符): 添加工作区一个或多个文件的修改到暂存区 (3).提交暂存区到本地仓库(git commit -m "注释内容"): 提交暂存区内容到本…...
Linux——安装NVM
1. 安装命令 官方地址:https://github.com/nvm-sh/nvm curl -o- https://raw.githubusercontent.com/nvm-sh/nvm/v0.40.3/install.sh | bash2. 安装完成后执行命令 source ~/.bashrc3. 验证 nvm -v...
C++之AVL树
前言 一、AVL的概念 二、AVL树的实现 2.1 AVL的结点结构 2.2 AVL树结点的插入 平衡因子的更新 更新原则: 更新停止的条件: 插入结点以及更新平衡因子的代码实现 旋转 右单旋 左单旋 左右双旋 右左双旋 2.3 AVL树的查找 2.4 AVL树的平衡性检测 总结 前言 …...
解决STM32H743单片机USB_HOST+FATF操作usb文件
前缀 花了两天的时间整理了一下在使用STM32H743单片机开发usb相关功能时遇到的问题及解决方案,具体为以下2种情况: 1.USB插上单片机后,单片机卡死,导致长时间没有喂狗程序重启; 2.USB正常插拔后,使用FAT…...
数据结构|并查集
Hello !朋友们,这是我在学习过程中梳理的笔记,以作以后复习回顾,有时略有潦草,一些话是我用自己的话描述的,可能不够准确,还是感谢大家的阅读! 目录 一、并查集Quickfind 二、两种算…...
从拒绝采样到强化学习,大语言模型推理极简新路径!
大语言模型(LLMs)的推理能力是当下研究热点,强化学习在其复杂推理任务微调中广泛应用。这篇论文深入剖析了相关算法,发现简单的拒绝采样基线方法表现惊人,还提出了新算法。快来一探究竟,看看这些发现如何颠…...
数据中心电能质量问题解决方案及经典案例
行业背景与挑战 数据中心作为互联网的核心枢纽,承载着海量数据存储、计算及通信任务,其内部精密设备(如恒温恒湿空调、高精度开关电源等)对电能质量极为敏感。微小的电压波动或频率偏差可能导致设备损坏,而瞬态过电压…...
【软考-高级】【信息系统项目管理师】【论文基础】沟通管理过程输入输出及工具技术的使用方法
沟通管理概念 沟通是人们分享信息、思想和情感的过程,沟通的主旨在于互动双方建立彼此相互了解的关系,相互回应,并期待能经由沟通的过程相互接纳并达成共识。 沟通失败是很多IT项目失败的重要原因。 与IT项目成功有关的最重要的四个因素是…...
优化PCB Via Stub系列(1):一次学会利用层叠设计降低Via Stub损耗
开路谐振对SI而言真不是个好东西,这种1/4波长谐振会带来讯号的驻波,进而降低整体通道带宽,导致SI不佳! 在高速PCB设计中,最常发生的1/4波长谐振就属过孔的Via stub,这个小小的金属残段可以酿成大大的SI问题…...
STP端口状态变迁及故障拓扑变化
STP端口状态变迁及故障拓扑变化 一、STP 端口状态变迁(以标准 STP 为例,共 5 种状态) 状态功能描述能否收发数据帧能否收发 BPDU持续时间进入条件Disabled端口物理关闭或被管理员手动关闭,不参与 STP 运算。否否-端口物理 down …...
9.idea中创建springboot项目_jdk1.8
9. idea中创建springboot项目_jdk1.8 步骤 1:打开 IntelliJ IDEA 并创建新项目 启动 IntelliJ IDEA。在欢迎界面,点击 New Project(或通过菜单栏 File > New > Project)。 步骤 2:选择 Maven 项目类型 在左侧…...
mysql 事务中如果有sql语句出错,会导致自动回滚吗?
CREATE TABLE name ( id int(11) unsigned NOT NULL AUTO_INCREMENT COMMENT ID, name varchar(32) DEFAULT COMMENT 名称, PRIMARY KEY (id) ) ENGINEInnoDB DEFAULT CHARSETutf8mb4; 情况1.执行下列操作, 会发现新开窗口 去查询name表时,整个事务都…...
考OCM证书前需要有OCP证书
报考OCM认证必须持有有效OCP证书。 从知识体系的构建来看,OCP 和 OCM 认证构成了一个循序渐进的学习和考核体系。OCP 认证侧重于考察数据库管理员和开发人员对 Oracle 数据库的基础架构、日常管理、性能优化、备份恢复等核心技能的掌握。通过 OCP 考试,意…...
动态图表 -- eg1
问题: 前端vue,后端springboot,实现动态表格样式,(表格List<Student>,Student类有年级,班级,文理科分类,姓名,学号,等属性。先根据年级分类…...
echo 1 > /proc/sys/kernel/nmi_watchdog报错
报错内容 /proc/sys/kernel/nmi_watchdog报错,内容如下: [root@localhost log]# echo 1 > /proc/sys/kernel/nmi_watchdog -bash: echo: write error: Unknown error 524 [root@localhost log]#报错原因 内核未配置 NMI 支持 某些自定义内核可能未编译 NMI Watchdog 驱…...
upload-labs PASS 1-5通关
PASS-01 前端javascript检查 1,第一个提示javascript对上传的文件进行审查 2,javascript工作在前端页面,可以直接删除具有审查功能的代码 3,删除之后再上传一句话木马 上传成功,可以使用蚁剑进行连接,控制网…...
大数据测试集群环境部署
Hadoop大数据集群搭建(超详细)_hadoop_小飞飞519-GitCode 开源社区 hadoop集群一之虚拟机安装(mac)_hadoop_皮皮虾不皮呀-华为开发者空间 hadoop集群二之hadoop安装_hadoop_皮皮虾不皮呀-华为开发者空间 虚拟机如何查看gateway | PingCode智库...
BUUCTF——Online Tool
BUUCTF——Online Tool 进入靶场 <?phpif (isset($_SERVER[HTTP_X_FORWARDED_FOR])) {$_SERVER[REMOTE_ADDR] $_SERVER[HTTP_X_FORWARDED_FOR]; }if(!isset($_GET[host])) {highlight_file(__FILE__); } else {$host $_GET[host];$host escapeshellarg($host);$host e…...
人工智能数学基础(三):微积分初步
微积分作为数学的重要分支,为人工智能的发展提供了坚实的理论基础。从理解数据的变化趋势到优化模型参数,微积分的应用贯穿其中。本文将深入探讨微积分的核心概念,并结合 Python 编程实例,助力大家轻松掌握这些关键知识点。资源绑…...
【11408学习记录】考研英语语法核心:倒装句考点全解+真题演练
倒装句 英语语法总结——特殊句式倒装全部倒装介词短语形容词副词There be 部分倒装否定副词或词组位于句首only位于句首虚拟条件句省略if 每日一句词汇第一步:找谓语第二步:断句第三步:简化主句定语从句 英语 语法总结——特殊句式 倒装 …...
云数据中心整体规划方案PPT(113页)
1. 引言 概述:云数据中心整体规划方案旨在构建弹性、高效的云计算基础设施,通过软件定义数据中心(SDDC)实现资源虚拟化与管理自动化。 2. 技术趋势与背景 技术革新:随着云计算、虚拟化及自动化技术的发展,…...
java练习4
创建类对象,要求写一个人的类,内容包括: 值:年龄,姓名,家庭身份 函数:年龄,姓名修改,家庭身份修改,生孩子 package a01_第一次练习.a04_创建类对象;public cl…...
在VMware上创建Ubuntu虚拟机,与Xshell和Xftp的连接和使用
一、在VMware创建Ubuntu虚拟机 1、创建新的虚拟机 2、新建虚拟机安装导向 1)自定义安装 2)稍后安装操作系统 3)选择Linux和Ubuntu64 4)可自定义虚拟机名称和虚拟机位置 5)选择合适的处理器数量 6)虚拟机…...
Java常用注解通俗解释
注解就像是给Java代码贴的"便利贴",它们不会改变代码本身的逻辑,但能给编译器、开发工具或运行时环境提供额外信息。下面我用最通俗的方式解释Java中最常用的注解: 一、基础篇:人人必知的注解 1. Override - "我…...
前端性能优化2:结合HTTPS与最佳实践,全面优化你的网站性能
点亮极速体验:结合HTTPS与最佳实践,为你详解网站性能优化的道与术 在如今这个信息爆炸、用户耐心极其有限的数字时代,网站的性能早已不是一个可选项,而是关乎生存和发展的核心竞争力。一个迟缓的网站,无异于在数字世界…...
小刚说C语言刷题——1032分糖果
1.题目描述 某幼儿园里,有 5 个小朋友编号为 1,2,3,4,5,他们按自己的编号顺序围坐在一张圆桌旁。他们身上都有若干个糖果,现在他们做一个分糖果游戏。 从 1 号小朋友开始,将他的糖…...
socket套接字-UDP(下)
socket套接字-UDP(中)https://blog.csdn.net/Small_entreprene/article/details/147567115?fromshareblogdetail&sharetypeblogdetail&sharerId147567115&sharereferPC&sharesourceSmall_entreprene&sharefromfrom_link在我之前搭建…...
使用Docker操作MySQL
在Docker中操作MySQL可以简化数据库的部署和管理过程。以下是详细的步骤,包括如何拉取MySQL镜像、创建容器以及配置远程访问权限。 拉取MySQL镜像 首先,使用以下命令从Docker Hub拉取MySQL镜像: docker pull mysql你也可以指定版本&#x…...
OpenGL ES 3.0 第二章总结:你好,三角形(Hello Triangle)
—— 从“画出第一个三角形”理解现代图形渲染流程 🔰 写在前面 OpenGL 是一个状态机型的图形 API。第二章《你好,三角形》是整个图形开发的起点,它帮助我们掌握从「准备绘制数据」到「渲染出第一个像素」的完整流程。 这一章最核心的任务是…...
neo4j vs python
1.将库中已经存在的两个节点,创建关系。 查询库中只有2个独立的节点。 方式一,python,使用py2neo库 #coding:utf-8 from py2neo import Graph,Node,Relationship,NodeMatcher##连接neo4j数据库,输入地址、用户名、密码 graph G…...
MIT6.S081-lab7前置
MIT6.S081-lab7前置 这部分包含了设备中断和锁的内容 设备中断 之前系统调用的时候提过 usertrap ,而我们的设备中断,比如计时器中断也会在这里执行,我们可以看看具体的逻辑: void usertrap(void) {int which_dev 0;if((r_sst…...