- 1. SISD - 单指令流单数据流
- 2. SIMD - 单指令流多数据流
- 3. MIMD - 多指令流多数据流
- 总结与对比
- 简单类比
多处理器体系结构中的三个基本概念:SISD、SIMD 和 MIMD,这些概念由迈克尔·弗林(Michael Flynn)于1966年提出,被称为弗林分类法(Flynn's Taxonomy)。它根据指令流(Instruction Stream) 和数据流(Data Stream) 的数量对计算机体系结构进行分类,是理解并行计算的基础。
1. SISD - 单指令流单数据流
这是最传统、最简单的计算机模型,即经典的冯·诺依曼体系结构。
- 单指令流:在任一时刻,CPU只执行一条指令。
- 单数据流:在任一时刻,指令只处理一个数据项。
工作方式:
一个处理单元(PU)从一个内存模块(M)中取指令和数据,然后按顺序一条一条地执行。
现代例子:
- 传统的单核CPU:无论是早期的Intel 8086还是现在的Intel酷睿系列的单核版本,都是典型的SISD。
- 即使有流水线(Pipelining)、超标量(Superscalar)等指令级并行技术(在单个时钟周期内发射多条指令),但从宏观的指令流来看,它仍然属于SISD范畴,因为最终指令是按程序顺序执行的。
示意图:
┌─────────┐│ 控制单元 ││ (CU) │└─────────┘│▼┌─────────┐ 指令/数据 ┌──────┐│ 处理单元 │ ◄─────────► │ 内存 ││ (PU) │ └──────┘└─────────┘
2. SIMD - 单指令流多数据流
这种架构的核心思想是一条指令同时操作多个数据。非常适合处理数据并行性高、计算密集型的问题。
- 单指令流:所有处理单元在同一时刻执行同一条指令。
- 多数据流:但每条指令同时处理多个不同的数据项。
工作方式:
一个控制单元(CU)向多个处理单元(PE)广播同一条指令。每个处理单元有自己的数据内存(或从共享内存中访问不同的数据部分),并同时对不同的数据执行相同的操作。
现代例子:
- GPU:图形处理器是SIMD的典范。当需要对屏幕上的数百万个像素进行相同的着色计算时,GPU的成千上万个核心会同时执行相同的操作(指令),但每个核心处理一个不同的像素(数据)。
- CPU中的向量指令集:
- Intel的SSE、AVX 指令集(如一次对4个单精度浮点数或2个双精度浮点数进行加法)。
- ARM的NEON 指令集。
- 这些指令允许一条指令对一组数据(向量/数组)进行操作,是SIMD在CPU中的实现。
- 经典超级计算机:如Thinking Machines的CM-2。
适用场景:图像/视频处理、科学计算(矩阵运算、模拟)、音频处理、机器学习中的部分计算。
示意图:
┌─────────┐│ 控制单元 ││ (CU) │└─────────┘│┌───────────────────┬───┴───┬───────────────────┐▼ ▼ ▼ ▼┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐│处理单元1 │ │处理单元2 │ │处理单元3 │ ... │处理单元N ││ (PE1) │ │ (PE2) │ │ (PE3) │ │ (PEn) │└─────────┘ └─────────┘ └─────────┘ └─────────┘│ │ │ │▼ ▼ ▼ ▼┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐│ 数据内存1│ │数据内存2 │ │数据内存3 │ ... │数据内存N │└─────────┘ └─────────┘ └─────────┘ └─────────┘
(也可以是所有PE共享一个内存,但访问不同地址)
3. MIMD - 多指令流多数据流
这是目前多处理器系统最常见的形式。系统中的多个处理器可以异步地、独立地执行不同的任务。
- 多指令流:每个处理器核心可以同时执行不同的指令。
- 多数据流:每个指令流操作不同的数据。
工作方式:
系统中有多个处理单元(通常是完整的处理器核心,每个都有自己的控制单元)。每个处理器独立地从内存中取自己的指令和数据,并行地执行不同的程序或同一程序的不同部分。
现代例子:
- 多核CPU:你的笔记本电脑或手机上的双核、四核、八核CPU。每个核心可以同时运行不同应用程序的线程,是典型的MIMD。
- 多处理器服务器:包含多个CPU插槽的服务器。
- 计算机集群:由网络连接的多台独立计算机共同工作,例如超级计算机和云计算数据中心。
MIMD的两种内存架构:
- 共享内存MIMD:所有处理器共享同一物理内存。处理器之间通过读写共享内存来进行通信。例如:多核CPU(UMA/NUMA架构)。
- 分布式内存MIMD:每个处理器拥有自己的本地内存。处理器之间通过消息传递(如MPI库)来进行通信。例如:计算机集群。
适用场景:通用多任务处理(同时运行多个应用程序)、并行处理可以分解为独立子任务的问题(如Web服务器处理多个请求、复杂的科学模拟)。
示意图(共享内存为例):
┌─────────┐ ┌─────────┐ ┌─────────┐│ 处理器1 │ │ 处理器2 │ ... │ 处理器N ││ (CPU1) │ │ (CPU2) │ │ (CPUn) │└─────────┘ └─────────┘ └─────────┘│ │ │└──────────┬───────┴──────────────┬────────┘▼ ▼┌─────────────────────────────────────┐│ 共享内存 │└─────────────────────────────────────┘
总结与对比
类型 |
指令流 |
数据流 |
核心思想 |
现代例子 |
优点 |
缺点 |
SISD |
单 |
单 |
顺序执行 |
单核CPU |
控制简单 |
无并行性,性能受限 |
SIMD |
单 |
多 |
数据级并行 |
GPU, CPU向量指令 |
能效高,吞吐量大 |
灵活性差,不适合条件分支多的任务 |
MIMD |
多 |
多 |
任务级并行 |
多核CPU, 计算机集群 |
灵活性高,通用性强 |
硬件复杂,需要解决缓存一致性、通信同步等问题 |
简单类比
- SISD:像一个厨师,一次只做一道菜的一个步骤。
- SIMD:像一条流水线上的多个工人,每个工人同时执行相同的动作(如都拧螺丝),但每个人拧的是不同产品上的螺丝。
- MIMD:像一个厨房里的多个厨师,每个人独立地做不同的菜(有的切菜,有的炒菜),互相协作完成一桌宴席。
现代计算系统通常是这些模式的混合体。例如,一个多核CPU(MIMD)的每个核心内部又支持SIMD指令集。而一个GPU(本身是SIMD)集群又构成了一个更大规模的MIMD系统。
Do not communicate by sharing memory; instead, share memory by communicating.
相关文章:
目录1. SISD - 单指令流单数据流2. SIMD - 单指令流多数据流3. MIMD - 多指令流多数据流总结与对比简单类比多处理器体系结构中的三个基本概念:SISD、SIMD 和 MIMD,这些概念由迈克尔弗林(Michael Flynn)于1966年提出,被称为弗林分类法(Flynns Taxonomy)。它根据指令流(…...
1.1changeStr(String x):方法内部尝试将传入的字符串参数重新赋值为 "xyz",但该操作仅在方法内部有效,不会影响外部实参
changeArr(String[] strs):遍历传入的字符串数组,对数组中的每个元素进行修改,在原字符串后拼接其索引值(例如将第 0 个元素改为 "原…...
9.15
听 CEO 讲了 sb 树,不知道该写什么,挂个祂博客的链接吧。
https://www.cnblogs.com/Augenstern-/p/18964066...
1讲了关于GAS中的网络之间,Client-Server的网络同步时,需要使用预测...
周六非常荣幸参加了火山引擎官方举办的PromptPilot产品发布会。其实早在8月份,我就有幸参与了该产品的内测阶段,并撰写了一些体验心得和感受。此次发布会当天,不仅深入聆听到了产品负责人以及工程师们对PromptPilot的全新解读和详细介绍,还现场感受到了他们对产品未来发展方…...
下载
下载链接:https://hub.docker.com/?overlay=onboarding 在 Windows 上部署 Docker 的方法都是先安装一个虚拟机,VMware版本17.0以上可以兼容安装docker
另一个可以下载 Hyper-V,Hyper-V 是微软开发的虚拟机,类似于 VMWare 或 VirtualBox 选中Hyper-V 也可以通过命令…...
何为特征值与特征向量
古人云:特征向量,乃方阵与线性变换之特征也。
盖线性变换,千变万化,寻不变其所向之向量,乃特征向量也。注意 0 向量不是特征向量。
何为特征值?线性变换中特征向量的伸长倍数,称该特征向量属于该特征值。
容易知道与一个特征向量共线的向量均为特征…...
docker部署Gitlab社区版,步骤以及外网访问出现502的解决方式 - 实践pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier Ne…...
今日内容大纲介绍约束详解单表约束
多表约束DQL语句详解简单查询
条件查询
聚合查询
分组查询
排序查询
模糊查询
分页查询多表查询交叉连接
连接查询
子查询
自关联(自连接)查询扩展: 多表建表一对多
多对多
一对一1.主键约束详解
/*
约束详解:概述:SQL中的约束分为: 单表约束…...
.zip() 函数在 Python 中是一个非常实用的内置函数,它用于将多个可迭代对象(比如列表、元组等)中的元素打包成一个元组的迭代器。
简单来说,它的作用就是把不同序列中对应位置的元素配对,就像拉链一样把两排牙齿咬合在一起。
zip() 的基本用法
zip(iterable1, iterable2, …...
1. 错误信息
error in ./src/views/forest/forestGateway.vue?vue&type=script&lang=js Module parse failed: Unexpected token (203:39)
File was processed with these loaders: * ./node_modules/.pnpm/**cache-loader**@4.1.0_webpack@4.47.0/node_modules/cach…...
一周三天早八,体验衡中生活:(
早上起来就发现食堂的人巨多,一看原来是崩铁和瑞幸联名了,看来学校崩p还是挺多的,我看到有卖油条和豆浆的,于是浅尝了一下——还是避雷吧,油条油的要死,吃了一根第二根实在是咽不下去了,于是扔了去教室,如图,不愧是知名的电动车帝国,这…...
目录指挥官与士兵:深入理解CPU控制信号的最终使命一、舞台与演员:认识数据通路中的角色二、核心命题:为什么说控制信号“仅”作用在功能部件上?三、澄清误区:那流水线寄存器呢?四、更深层的意义:理解计算机架构的哲学结论指挥官与士兵:深入理解CPU控制信号的最终使命
在…...
比赛链接:https://vjudge.net/contest/748191。
A - 互不侵犯
最最最最最最最板子的状压 DP。
大概就是一行一行去弄。然后的话,DP 维护三个量,当前遍历到第 \(i\) 行,目前总共放了 \(j\) 个国王,以及这一行的放置国王情况为 \(st\)(用二进制状压表示)。判断的时候,有一…...
身边很多朋友问我怎么装 PS 2025,其实步骤不难,先跟大家说下这软件到底好用在哪,再一步步教安装,最后给几个常用的实操案例,新手跟着做就能上手,不管是想做摄影后期、商业设计,还是社交账号配图,看完这篇 Photoshop 2025 v26.0 下载安装教程都能搞定。目录一、先搞懂 P…...
我的学校是全世界最好的学校,不接受反驳!学校太好了
作为学生评判学校自然要说点实际的。
就比如说住宿环境,那是我见过的最优秀的宿舍了。
你们学校会把宿舍改装成水帘洞吗
今天中午回到宿舍就发现学校为了让我们更加凉爽,同时赏心悦目,将宿舍改装成水帘洞,一进宿舍楼就…...
SetWaitingOnRemotePlayerData主要用于控制游戏模式是否等待远程玩家(通常是网络多人游戏中的客户端)的数据加载完成。调用时,可以直接杀死该使用数据的任务...
完成hbase的部署,需要准备虚拟机并部署hadoop与java环境。途中虚拟机磁盘满了还要重新分配一下,但奈何磁盘满了进不去桌面,把之前的docker删了总算顺利进去了。...
目录一、核心挑战:多指令的并行交响曲二、解决方案:提前生成与“随指令流动”1. 产生:在译码阶段(ID)一次性生成所有“说明书”2. 保存与传递:流水段寄存器——控制信号的“护航舰队”三、这种机制的优势与意义总结你是否曾好奇,现代CPU的流水线如同一条高效运转的装配线…...
今日内容大纲介绍数据库的相关概述
环境搭建
SQL语句分类DDL
DML
DCL
DQLDDL语句之操作数据库
DDL语句之操作数据表
DML语句之操作表数据(增删改)
DQL语句之操作表数据(查)1.数据库的相关概述问1: 你知道的存储数据的方式有哪些?
-- 方式1: 变量, 列表, 字典...
只能对数据临时…...
example:const bool bCalledDelegate = AbilitySystemComponent.Get()->CallReplicatedTargetDataDelegatesIfSet(SpecHandle, ActivationPredictionKey);if (!bCalledDelegate){ SetWaitingOnRemotePlayerData();}...
目录一、时钟:流水线的同步心跳二、公共流水段:为何IF和ID无需“特殊关照”1. 取指阶段(IF):无差别的读取2. 译码阶段(ID):标准化的解析三、控制信号的诞生:时机决定一切四、控制信号为谁而生?总结:标准化与个性化的分工在我们深入探索CPU流水线的精妙世界时,一个看…...
test4
不要在意这个诡异的标题。排序sort
快排的过程相当于以 \(a_r\) 为界限,更小的放到左边,更大的放在右边,我们还关心新的 \(a_r\) 是谁,左边是按顺序的填入,右边新的顺序只跟原本的顺序有关系素排列双射下去啦,所以就是唯一特定位置的值成为新的。
那么考虑 dp 一下…...
减少KVCache:从MHA,MQA,GQA到MLA
参考链接
科学空间,苏神的blog
大模型推理加速:看图学KVCache
前言
也是终于到了稍微有一点时间的时候,也需要对看过的东西进行简单的总结了。这里就总结一下论文中最喜欢的attention,以及与KVCache之间的关系。
基础:什么是attention?…...
考研复习-操作系统-第三章-内存管理 - 详解pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", monospace !impo…...
今日内容大纲介绍计算机简介
Linux系统介绍
Linux环境搭建
Linux基础命令1.计算机简介概述
全称叫电子计算机, 英文名叫Computer, 俗称叫: 电脑, 简称叫: PC, 就是有硬件和软件组成的电子设备.组成计算机硬件CPU, 中央处理器, 由 运算器 + 控制器 组成
存储器内存: 内存条, DDR…...
1.1 绪论
1.2 数学基础已知系统的初始状态+速度->未来的变化状态均可知质量弹簧阻尼二阶系统也可以写成微分方程的形式,状态变量为位置,速度2 动力学系统建模2.1 理论力学回顾...
2.1 常见命令
2.1.1 查看当前登录用户信息的基础命令
last # 显示上次登录的用户列表信息
who # 显示当前所有登录到系统的用户信息
whoami # 查看当前登录的用户
who am i # 仅显示当前终端登录系统的用户名+终端+登录时间+来源主机,‘i’可以是任意字符,等同于who -m
[…...
nacos无法启动主要问题是依赖于RocksDBjni没有对应架构的动态链接库
RocksDB JNI 的多平台 native 动态库集合系统 (OS)
架构 (Arch)
libc 类型
对应文件名Linux
x86 (32位)
glibc
librocksdbjni-linux32.somusl
librocksdbjni-linux32-musl.sox86_64 (64位)
glibc
librocksdbj…...
https://www.cnblogs.com/zhipeng-wang/p/14070431.html
测试端口
nc -nvz 127.0.0.1 8000
监听
nc -l 80
连接client
nc 127.0.0.1 8000想要连接到某处: nc [-options] hostname port[s] [ports] …绑定端口等待连接: nc -l port [-options] [hostname] [port]-g<网关>…...
完整教程:【C++】22. 封装哈希表实现unordered_set和unordered_mappre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New…...
前言最近,在研究云迁移,做了个测试如何使用App Service连接SQL MI。正文1.测试项目是Net Framework v4.8,核心代码如下图:1 StringBuilder message = new StringBuilder();2 try3 {4 string sqlstr = "Server=smi-test.c5c92fb776c2.database.windows.net;Databas…...
ServerSetReplicatedTargetData 通常是一个自定义的服务器端 RPC(远程过程调用)函数,用于将目标数据(如瞄准目标、交互目标等)从客户端发送到服务器,并让服务器更新相应的复制变量,以便在多台客户端之间同步该数据。...
PHP不行了,或许只是大家的一个简单的调侃,但这个调侃也代表了PHP语言从巅峰到下滑一个变迁。然而,现如今还是有很多的程序员依靠它在吃饭,语言只是一门工具,赚钱才是王道大家好,我是码农先森。
在微信的水群里,经常有兄弟说:"PHP不行了,PHP是上古时代的语言,PHP…...
SOLUTION FROM WUMIN4
题意
若长度为 \(n\) 的数组 \(a\) 排序后为 \(b\),定义 \(a\) 的权值为 \(\sum_{i=1}^n \lfloor\frac{b_i\cdot i^k}{w}\rfloor \bmod 998244353\)。
有 \(q\) 次操作,每次操作修改一个 \(a_i\),随后输出 \(a\) 的权值。
\(n,a_i\le 10^5,1\le k,w\le…...
Q. 有序表和无序表(Hash表)区别?Key有无序的区别。
Q. map 和 set 区别:有无伴随数据的区别。
有序表:红黑树、AVL树、size-banlance-tree、跳表都是有序表哈希表:基础类型,值传递;非基础类,必须提供比较器,引用传递。【经典题目】反转链表。要求实现单链表、双链表结…...
CAI是一个开源的网络安全AI框架,能够自主执行从侦察到权限提升的完整网络安全攻击链。它集成了多种专业AI智能体,支持红蓝对抗、漏洞评估、数字取证等安全任务,并提供了丰富的基准测试工具和评估体系。项目概述
CAI(Cybersecurity AI)是一个开源的网络安全AI框架,旨在构建…...
example://FGameplayAbilityTargetData_SingleTargetHit 继承自FGameplayAbilityTargetData
FGameplayAbilityTargetData_SingleTargetHit 是用于表示单一目标命中信息的目标数据结构,常用于游戏技能系统(Gameplay Ability System, GAS)中传递目标信息。
它主要包含以下核心…...
详细介绍:Maven入门_简介、安装与配置pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", monospace !importan…...
实用指南:立体校正原理pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", monospace !important; font-size: …...
train-labels.idx1-ubyte 是 MNIST 数据集中的一个文件。它不是一个普通的文本文件,而是一个经过特定格式编码的二进制文件。
简单来说,这个文件里只包含一个东西:MNIST 训练集图像的标签。
文件内容
这个文件的内容是一个字节序列,其中每个字节都代表一个手写数字的标签。…...
题目描述
给你一个整数数组 nums,有一个大小为 k 的滑动窗口从数组的最左侧移动到数组的最右侧。你只可以看到在滑动窗口内的 k 个数字。滑动窗口每次只向右移动一位。
返回 滑动窗口中的最大值 。
示例 1:
输入:nums = [1,3,-1,-3,5,3,6,7], k = 3
输出:[3,3,5,5,6,7]
解释…...
ScopedPredictionWindow 是一个与网络预测(Network Prediction)相关的工具类,主要用于在多人游戏中管理预测窗口的生命周期,确保客户端预测和服务器验证的一致性。
网络预测上下文管理:在客户端预测期间,ScopedPredictionWindow 会创建一个临时的 "预测窗口",…...
题目链接:https://leetcode.cn/problems/unique-binary-search-trees-ii/description/?source=vscode解析:
其实是一道数据结构二叉搜索树入门题,放在这里提醒dfs不要陷入直接搜的困境,还可以分治/*** Definition for a binary tree node.* struct TreeNode {* int va…...
难度:困难题目描述字符串转二叉树
根节点深度为 0,其子节点深度为 1,依次类推
题目保证若只有一个子节点,必为左子树示例
输入:"1-2--3--4-5--6--7"
输出:[1,2,5,3,4,6,7]
解释:1/ \2 5/ \ / \
3 4 6 7输入:"1-2--3---4-5--6---7"
输出…...
Description
有 \(n\) 个英雄和 \(n\) 个怪物。英雄和怪物分别编号为 \(1\) 到 \(n\) 的整数。第 \(i\) 个英雄的战斗力为 \(a_i\),第 \(i\) 个怪物的战斗力为 \(b_i\)。保证所有 \(a_1, a_2, \ldots, a_n, b_1, b_2, \ldots, b_n\) 的值都是两两不同的。
将进行总共 \(n\) 场…...
AbilityTask 是 Gameplay Ability System(GAS)框架的核心组件之一,用于处理能力(Ability)执行过程中的异步操作。它允许开发者在能力激活后创建可中断、可暂停的任务,处理如动画播放、特效生成、输入响应等耗时或需要等待的操作。
example:比如下方的两个不同时态的接口…...
有一个很强的性质是,当两个结束序列相等,当且仅当:割掉的边集相等。
对于每个点,割掉的边的相对顺序一样。设 \(f_{x, i, 0/1}\) 为 \(x\) 相连的边割掉了 \(i\) 条,父亲那条边有没有被割掉(要计算子树里的方案数)。
然后输出显然是 \(\sum_i f_{1, i, 0}\)。...
Base家族,Base45,Base58,Base62,Base64,Base85,Base92tags:Base家族,Base45,Base58,Base62,Base64,Base85,Base92
0x00. 题目
flag.txt
6L;y>cYh?)m->!yBH;/\>Yx9lA8liLp:cjYpb.2E;J8j_B7BjPig.[sV}ojTN!yB01.#bc5@0J}?eix70R+>T,g??Fh={+JJSFWeT]_9lA7&X3…...