window 显示驱动开发-将虚拟地址映射到内存段(二)
在将虚拟地址映射到段的一部分之前,视频内存管理器调用显示微型端口驱动程序的 DxgkDdiAcquireSwizzlingRange 函数,以便驱动程序可以设置用于访问可能重排的分配位的光圈。 驱动程序既不能将偏移量更改为访问分配的 PCI 光圈,也不能更改分配在光圈中占用的空间量。 例如,如果驱动程序无法在给定这些约束 (的情况下使分配 CPU 可访问,则硬件可能耗尽) 不显眼的光圈,则视频内存管理器会将分配逐出到系统内存,并允许应用程序访问其中的位。
如果在用户模式显示驱动程序调用 pfnLockCb 函数以请求直接访问内存时,以前创建的分配的内容位于系统内存中,则视频内存管理器会将系统内存缓冲区返回到用户模式显示驱动程序,并且显示微型端口驱动程序不涉及访问分配。 因此,显示微型端口驱动程序不会修改分配的内容,并且保持为未重排格式。 这意味着,当从视频内存中逐出 CPU 可访问的分配时,显示微型端口驱动程序必须取消重排分配,以便应用程序可以直接访问生成的系统内存位。
如果逐出与当前映射用于直接应用程序访问的分配关联的 GPU 资源,则分配的内容将传输到系统内存,以便应用程序可以继续访问同一虚拟地址但不同的物理介质上的内容。 为了设置传输,视频内存管理器调用显示微型端口驱动程序的 DxgkDdiBuildPagingBuffer 函数来创建分页缓冲区,GPU 计划程序调用驱动程序的 DxgkDdiSubmitCommand 函数将分页缓冲区排队到 GPU 执行单元。 特定于硬件的传输命令位于分页缓冲区中。 有关详细信息,请参阅 提交命令缓冲区。 视频内存管理器可确保视频到系统内存的转换对应用程序不可见。 但是,驱动程序必须确保通过 PCI 光圈对分配的字节排序与逐出分配时分配的字节顺序完全匹配。
对于光圈空间段,分配的基础位已位于系统内存中,因此无需传输 (逐出过程中取消重排) 数据。 因此,如果应用程序直接访问位于光圈空间段中的 CPU 可访问分配,则无法重排该分配。
如果某个表面可由应用程序直接通过 CPU 访问,但将在光圈空间段中重排,则显示驱动程序应将图面实现为两个不同的分配。 当用户模式显示驱动程序创建此类图面时,它可以调用 pfnAllocateCb 函数,并将 D3DDDICB_ALLOCATE 结构的 NumAllocations 成员设置为 2,并将 D3DDDICB_ALLOCATE 的pAllocationInfo 数组中D3DDDI_ALLOCATIONINFO结构的 pPrivateDriverData 成员设置为指向有关分配 (的私有数据,例如其重排格式和未重排格式) 。 GPU 将使用的分配包含重排格式的位,应用程序将访问的分配包含未重排格式的位。 视频内存管理器调用显示微型端口驱动程序的 DxgkDdiCreateAllocation 函数来创建分配。 对于从用户模式显示驱动程序传递的每个分配) ,显示微型端口驱动程序解释DXGK_ALLOCATIONINFO结构的 pPrivateDriverData 成员中的专用数据 (。 视频内存管理器不知道分配的格式;它只是为分配分配分配特定大小和对齐方式的内存块。 调用用户模式显示驱动程序的 Lock 函数以锁定图面进行处理会导致以下操作:
- 用户模式显示驱动程序调用 pfnRenderCb 函数,将命令缓冲区中的取消重排操作提交到 Direct3D 运行时和显示微型端口驱动程序。
- 用户模式显示驱动程序调用 pfnLockCb 函数来锁定未重排的分配。 请注意,用户模式显示驱动程序不得在 D3DDDICB_LOCK 结构的 Flags 成员中设置D3DDDILOCKCB_DONOTWAIT标志。
- pfnLockCb 函数将等待传输 (在分配之间展开) 。
- pfnLockCb 函数请求显示微型端口驱动程序获取未重排分配的虚拟地址,并将虚拟地址返回到 D3DDDICB_LOCKpData 成员中的用户模式显示驱动程序。
- 用户模式显示驱动程序将未重排分配的虚拟地址返回到 D3DDDIARG_LOCK 的 pSurfData 成员中的应用程序。
下图演示了如何将虚拟地址映射到线性光圈空间段的基础页面。
1. 重排分配与 CPU 访问的冲突
问题背景:
某些图形分配(如纹理)可能被硬件“重排”(swizzled)以优化 GPU 访问性能,但这种格式对 CPU 不友好。如果应用程序需要直接通过 CPU 访问这些分配(如 Lock 操作),则需要取消重排(unswizzle)。
约束条件:
- 显示微型端口驱动程序(Display Miniport Driver)在 DxgkDdiAcquireSwizzlingRange 中不能修改 PCI 光圈的偏移或大小。
- 若硬件无法满足 CPU 访问的约束(如光圈空间不足),视频内存管理器(VidMM)会将分配逐出(evict)到系统内存,并取消重排。
2. 系统内存中的分配访问
直接访问系统内存:如果分配已被逐出到系统内存,用户模式显示驱动(UMD)通过 pfnLockCb 直接获取系统内存指针,微型端口驱动不参与,内容保持未重排格式。
关键要求:在逐出时,驱动程序必须确保取消重排,使系统内存中的数据是 CPU 可读的线性格式。
3. GPU 资源逐出与分页机制
动态逐出处理:
若 GPU 正在使用的分配被逐出(如因内存压力),VidMM 会通过以下步骤透明迁移数据:
- 调用 DxgkDdiBuildPagingBuffer 创建分页缓冲区(包含硬件特定的传输命令)。
- 通过 DxgkDdiSubmitCommand 提交到 GPU 执行。
- 确保迁移对应用程序透明(虚拟地址不变,物理介质变化)。
数据一致性:驱动程序必须保证 PCI 光圈中的字节顺序与逐出时的系统内存完全一致。
4. 光圈空间段的特殊处理
无重排需求:光圈空间段(Aperture Segment)的分配本身位于系统内存,无需重排。若应用程序直接访问此类分配,驱动程序必须禁止重排。
5. 双分配策略(重排与非重排共存)
适用场景:
若一个表面需要同时满足:
- GPU 访问(重排格式优化性能)。
- CPU 访问(未重排格式保证兼容性)。
实现方式:
- UMD 调用 pfnAllocateCb 创建 两个分配(NumAllocations=2),分别存储重排和未重排数据。
- 通过 pPrivateDriverData 传递格式信息(如重排参数)。
- 微型端口驱动在 DxgkDdiCreateAllocation 中解析私有数据,管理两种格式。
Lock 操作流程:
- UMD 提交命令缓冲区(pfnRenderCb)取消重排(GPU 执行格式转换)。
- 调用 pfnLockCb 锁定未重排的分配(等待转换完成)。
- 返回未重排分配的虚拟地址给应用程序。
六、关键驱动责任
- 格式转换:在逐出或 Lock 时,确保重排数据转换为线性格式。
- 双分配管理:维护重排/未重排副本的一致性(如通过 GPU 命令同步)。
- 透明性:确保应用程序无感知(虚拟地址不变,物理介质可能变化)。
总结
这段描述揭示了 WDDM 如何平衡 GPU 性能(重排)与 CPU 可访问性,通过动态逐出、分页缓冲区、双分配等机制实现高效内存管理。驱动程序需正确处理重排/取消重排、分页操作及多副本同步,以满足图形和计算应用的多样化需求。
相关文章:
window 显示驱动开发-将虚拟地址映射到内存段(二)
在将虚拟地址映射到段的一部分之前,视频内存管理器调用显示微型端口驱动程序的 DxgkDdiAcquireSwizzlingRange 函数,以便驱动程序可以设置用于访问可能重排的分配位的光圈。 驱动程序既不能将偏移量更改为访问分配的 PCI 光圈,也不能更改分配…...
Linux 软硬连接详解
目录 一、软链接(Symbolic Link) 定义与特性 实现方法使用 ln -s 命令: 二、硬链接(Hard Link) 1、是什么 2、工作机制 3、实现方式 一、软链接(Symbolic Link) 定义与特性 定义…...
虚拟主机与独立服务器:哪个更好?
在选择网站主机提供商时,你可以选择独立服务器或者与其他用户共同使用的虚拟主机。这个决定不仅仅是基于价格,还有很多其他因素需要考虑。接下来,我们就来详细了解一下虚拟主机和独立服务器的区别。 虚拟主机和独立服务器的区别 独立服务器是…...
MiMo-7B-RL调研
结论 MiMo 在数学推理和代码竞赛的评测中表现出色,但是相较于 OpenAI 的 o1-mini 和阿里的 QwQ-32B-Preview 等更大规模的模型,推理耗时更长(4 到 10 倍),花费 Token 更多。 链接 开源地址: https://huggingface.co/…...
vue-i18n 优化
语言包管理优化: 当前语言包文件(en.json 和 zh.json)过大,建议按模块拆分建议的目录结构: src/assets/i18n/ ├── modules/ │ ├── common/ │ ├── dashboard/ │ ├── report/ │ └── system/ …...
全栈工程师实战手册:LuatOS日志系统开发指南!
本文聚焦LuatOS-log库的实战应用场景,通过完整案例演示日志模块集成、格式定制及远程同步方案,帮助全栈开发者构建灵活可靠的日志管理框架。下面,我们一起来认识LuatOS的log库! 一、 log.info() log info()主要打印一些正常的…...
Java知识库网站整理
本文主要推荐一些高质量的Java知识库和学习网站,涵盖了从基础到高级的Java技术,包括JVM底层原理、框架源码分析、面试题集、全栈知识体系等。如果你有其他优秀的Java学习网站推荐,欢迎在评论区分享! 如遇到以下网站不能打开请检查…...
详解 IRC协议 及客户端工具 WeeChat 的使用
本文将详细介绍 Internet Relay Chat(IRC)协议及其历史、基本概念、核心功能,以及流行的 IRC 客户端 WeeChat 的安装、配置和使用方法。内容力求准确、详尽,涵盖 IRC 的技术背景、使用场景,以及 WeeChat 的高级功能和实…...
数据出境的安全合规思考
数据已成为新型国家战略性资产,其经济和战略价值在全球数字经济发展中愈加凸显。跨境数据流动既是重要的经济纽带,又是新兴的经济秩序博弈焦点,对于推动经济全球化发展意义重大。然而,跨境数据流动也面临诸多问题与挑战࿰…...
【技巧】使用frpc点对点安全地内网穿透访问ollama服务
回到目录 【技巧】使用frpc点对点安全地内网穿透访问ollama服务 0. 为什么需要部署内网穿透点对点服务 在家里想访问单位强劲机器,但是单位机器只能单向访问互联网,互联网无法直接访问到这台机器。通过在云服务器、单位内网服务器、源端访问机器上&am…...
Go语言即时通讯系统 开发日志day1
Go语言即时通讯系统开发日志day1,主要模拟实现的一个简单的发送消息和接受消息的小demo,因为也才刚学习go语言的语法,对go的json、net/http库了解不多,所以了解了一下go语言的encoding/json库和net/http库,以及websock…...
多线程访问Servlet如何谨慎处理共享资源
1. 避免共享状态(最佳实践) 核心思想:Servlet 本身应设计为无状态(Stateless),不依赖实例变量存储请求相关数据。 实现方式: 将变量声明在方法内部(局部变量)࿰…...
OpenMCU(六):STM32F103开发板功能介绍
概述 距上一篇关于STM32F103的FreeRTOS博客的发布已经过去很长时间没有更新了。在这段时间内,大家可以看到博主发表了一系列的关于使用qemu 模拟实现STM32F103的博客,博主本来想借助qemu开发stm32F103相关的一些软件功能,博主开发出来并成功运…...
运用数组和矩阵对数据进行存取和运算——NumPy模块 之五
目录 NumPy模块介绍 3.5.1 NumPy 操纵数组元素的逻辑 3.5.2 添加数组元素操作 1. append() 函数 2. insert() 函数 3.5.3 删除数组元素的操作 delete() 函数 3.5.4 数组元素缺失情况的处理 isnan() 函数 3.5.5 处理数组中元素重复情况 unique() 函数 3.5.6 拼接数组操作 1. con…...
AI Agent开发第64课-DIFY和企业现有系统结合实现高可配置的智能零售AI Agent
开篇 我们之前花了将近10个篇章讲Dify的一些基础应用,包括在讲Dify之前我们讲到了几十个AI Agent的开发例子,我不知道大家发觉了没有,在AI Agent开发过程中我们经常会伴随着这样的一些问题: 需要经常改猫娘;需要经常改调用LLM的参数,甚至在一个流程中有3个节点,每个节点…...
日志 Slf4j , Java 中使用
// 示例代码package biz.baijing.controller;import biz.baijing.pojo.Result; import lombok.extern.slf4j.Slf4j; import org.slf4j.Logger; import org.slf4j.LoggerFactory; import org.springframework.web.bind.annotation.RequestMapping; import org.springframework.w…...
Matlab 单机无穷大系统故障
1、内容简介 Matlab 236-单机无穷大系统故障 可以交流、咨询、答疑 2、内容说明 略 摘要:短路是电力系统中最容易发生的故障,每年因短路而引发的电气事故不计其数。本文详细介绍了短路故障产生的原因以及危害等,并重点介绍了Simulink仿真工…...
Hadoop区别
Hadoop • 定义 • Hadoop是一个由Apache基金会开发的分布式计算平台。它主要包括HDFS(Hadoop Distributed File System)和MapReduce编程模型。HDFS用于存储大规模数据,它将文件分割成多个数据块(block),并…...
【软件工程】软件缺陷 基于组合的优化方法
在软件缺陷检测中,基于组合的优化方法主要通过数学和计算策略高效地探索可能的解空间,以解决测试用例生成、缺陷定位和预测等问题。以下是其关键要点和应用场景的整理: 1. 组合优化在软件缺陷检测中的应用场景 测试用例生成 组合测试…...
python opencv 将不同shape尺寸的图片制作video视频
python opencv 将不同shape尺寸的图片制作video视频。 具体代码实现如下: import os import cv2 import time import shutil def resize_img_keep_ratio(img, target_size):old_size img.shape[:2] # 原始图像大小ratio min(target_size[i] / old_size[i] for …...
Open CASCADE学习|由大量Edge构建闭合Wire:有序与无序处理的完整解析
在CAD建模中,构建闭合的Wire(线框)是拓扑结构生成的基础操作。OpenCascade(OCCT)作为强大的几何建模库,支持从离散的Edge(边)构建Wire,但在实际应用中,边的有序性直接影响构建的成功率。本文将详细探讨有序与无序两种场景下的实现方法,并提供完整代码示例。 一、有序…...
在IDEA中导入gitee项目
一、导入前准备工作 1、下载gitee插件 2、下载好之后就能在VCS中找到share Project on gitee。 二、导入 1、回到idea主页面 2、可以授权登录绑定gitee账号,就可以直接打开仓库。(条件是这个是要打开自己仓库里的代码) 3、也可以复制看见的…...
Edge Remover v18.7 绿色版:轻松卸载 Edge 浏览器,彻底清理残留数据
Edge Remover 是一款专门用于卸载 Microsoft Edge 浏览器及其 WebView2 运行时的工具。它能够彻底删除 Edge 浏览器及其相关组件,包括所有文件、注册表项和其他残留数据。此外,Edge Remover 还可以防止 Windows 更新自动重新安装 Edge 浏览器。 软件功能…...
深入理解 iOS 开发中的 `use_frameworks!`
在使用 CocoaPods 管理 iOS 项目依赖时,开发者经常会在 Podfile 文件中看到一个配置选项:use_frameworks!。本文将详细介绍这个配置选项的含义,以及如何决定是否在项目中使用它。 一、什么是 use_frameworks! 在 CocoaPods 中引入第三方库时…...
Vue学习百日计划-Gemini版
核心理念: 基础先行: HTML, CSS, JavaScript 是前端的基石,必须扎实。聚焦 Vue 3: 学习当前主流的 Vue 3 版本,重点掌握 Composition API。实践驱动: 每个阶段都要有项目练习,理论结合实践。生…...
不定长滑动窗口---初阶篇
目录 引言 求最长/最大 3. 无重复字符的最长子串 3090. 每个字符最多出现两次的最长子字符串 1493. 删掉一个元素以后全为 1 的最长子数组 1208. 尽可能使字符串相等 904. 水果成篮 1695. 删除子数组的最大得分 2958. 最多 K 个重复元素的最长子数组 2024. 考试的最大…...
MacOS 上构建 gem5
MacOS 中只存在 python3,但是scons 只认 python,不在 系统中创建 软连接,一个是因为比较难操作;另一个是尽量不要更改系统。所以独立构件python 和scons: 1,安装python 下载源代码: Python S…...
矩阵置零算法讲解
矩阵置零算法讲解 一、问题描述 给定一个 (m \times n) 的矩阵,如果一个元素为 (0) ,则将其所在行和列的所有元素都设为 (0) 。要求使用原地算法,即在不使用额外矩阵空间的情况下完成操作。 二、解题思路 暴力解法 最直观的想法是遍历矩阵,当遇到 (0) 元素时,直接将其…...
HAProxy + Keepalived + Nginx 高可用负载均衡系统
1. 项目背景 在现代Web应用中,高可用性和负载均衡是两个至关重要的需求。本项目旨在通过HAProxy实现流量分发,通过Keepalived实现高可用性,通过Nginx提供后端服务。该架构能够确保在单点故障的情况下,系统仍然能够正常运行&#…...
火山RTC 6 自定义视频
文档: 自定义视频采集--实时音视频-火山引擎 这个点,相关的文档 关于PC上的资料只有寥寥几句,没有代码、没有DEMO,自己琢磨了几天,没走对方向,和客服你来我往拉锯了几天加投诉下,才给了点内部…...
[Java][Leetcode middle] 121. 买卖股票的最佳时机
暴力循环 总是以最低的价格买入,以最高的价格卖出: 例如第一天买入,去找剩下n-1天的最高价格,计算利润 依次计算到n-1天买入; 比较上述利润 // 运行时间超时。 o(n^2)public int maxProfit1(int[] prices) {int profit 0;for (i…...
《数据结构初阶》【堆 + 堆排序 + TOP-K】
【堆 堆排序 TOP-K】目录 前言:什么是堆?堆的实现方式有哪些?我们要选择哪种方式进行实现? ----------------堆的实现----------------什么是向上调整算法,要怎么实现?什么是向下调整算法,要怎…...
sqlilab-Less-18
知识铺垫 User-Agent 首部包含了一个特征字符串,用来让网络协议的对端来识别发起请求的用户代理软件的应用类型、操作系统、软件开发商以及版本号。user-agent的作用。通过识别用户身份,响应合适的web界面,所以更改可以让电脑返回一个手机界…...
mapbox进阶,使用mapbox-plugins插件加载饼状图
👨⚕️ 主页: gis分享者 👨⚕️ 感谢各位大佬 点赞👍 收藏⭐ 留言📝 加关注✅! 👨⚕️ 收录于专栏:mapbox 从入门到精通 文章目录 一、🍀前言1.1 ☘️mapboxgl.Map 地图对象1.1 ☘️mapboxgl.Map style属性二、🍀使用mapbox-plugins插件加载饼状图1. ☘…...
【Java继承】——面向对象编程的基石
🎁个人主页:User_芊芊君子 🎉欢迎大家点赞👍评论📝收藏⭐文章 🔍系列专栏:【Java】内容概括 【前言】 在Java面向对象编程中,继承是一个非常重要的概念。它允许我们创建一个新类&…...
【数据结构】——队列
一、队列的概念和结构 概念: 只允许在⼀端进⾏插⼊数据操作,在另⼀端进⾏删除数据操作的特殊线性表,队列具有先进先 出FIFO(First In First Out)。 入队:进行数据插入的一端叫做队尾 出队:进行删除操作的一端叫做队…...
如何找出所有不重复的三位偶数:详细解法与思考过程
问题描述 给定一个包含数字(0-9)的数组digits,其中可能包含重复元素。我们需要找出所有满足以下条件且互不相同的整数: 该整数由digits中的三个元素按任意顺序依次连接组成 该整数不含前导零(即必须是100-999之间的数…...
每日Prompt:超现实交互场景
提示词 一幅铅笔素描画,描绘了 一个女孩 与 一朵玫瑰 互动的场景,其中 一朵玫瑰 以逼真的全彩风格呈现,与 一个女孩及背景的手绘素描风格形成超现实的对比。...
基于大模型预测的多发性硬化综合诊疗方案研究报告大纲
目录 一、引言二、文献综述三、大模型预测系统构建四、术前预测与手术方案制定五、术中监测与决策支持六、术后护理与并发症预测七、麻醉方案智能优化八、统计分析与技术验证九、实验验证与证据支持十、健康教育与指导系统十一、结论与展望一、引言 (一)研究背景与意义 多发…...
五、Hive表类型、分区及数据加载
在 Hive 中高效构建、管理和查询数据仓库,核心在于精准运用表类型(内部/外部)与分区策略(静态/动态/多重)。这不仅决定数据的生命周期归属,更是优化海量数据查询性能的关键手段。 一、表的身份权责&#x…...
在选择合适的实验室铁地板和铸铁试验平板,帮分析
铸铁测试底板是一种采用铸铁材料经过加工制成的基准测量工具,主要用于工业检测、机械加工和实验室等高精度要求的场合。其核心功能是为各类测量、检验、装配工作提供稳定的水平基准面,确保测量数据的准确性和一致性。 一、铸铁测试底板的基本特性 1.材质…...
阿里云人工智能大模型通义千问Qwen3开发部署
本文主要描述阿里云人工智能大模型开源社区ModelScope提供的通义千问Qwen3开发部署。 与阿里云一起 轻松实现数智化 让算力成为公共服务:用大规模的通用计算,帮助客户做从前不能做的事情,做从前做不到的规模。让数据成为生产资料:…...
网络基础知识梳理和Muduo库使用
文章目录 网络基础知识梳理和Muduo库使用1.知识储备2.阻塞、非阻塞、同步、异步我的总结 3.Unix/Linux上的五种IO模型0.铺垫1.阻塞IO(blocking)2.非阻塞IO(non-blocking)3.IO复用(IO multiplexing)4.信号驱…...
IDEA 插件推荐:提升编程效率
通过安装和使用合适的插件,可以大幅提升开发效率和代码质量。本文将从多个维度推荐实用的 IDEA 插件,并提供安装与使用指南。 一、代码辅助类插件 1. Key Promoter X —— 快捷键学习利器 功能介绍:当你使用鼠标点击某个功能时,…...
001大模型-认识大模型以及大模型应用场景
大模型是一种基于海量数据训练的人工智能系统,具备强大的语言理解和生成能力。其工作原理是通过深度学习算法,分析大量文本数据,学习语言模式和知识,从而能够处理复杂的任务。大模型的应用广泛,包括自然语言处理、机器…...
Qt进阶开发:QTcpServer的的详解
文章目录 一、QTcpServer 简介二、常用成员函数的使用三、信号函数的使用四、虚函数的使用五、连接多客户端-服务端示例一、QTcpServer 简介 QTcpServer 是 Qt 网络模块中的一个核心类,用于实现 基于 TCP 协议的服务端(Server),它负责监听端口、接收客户端连接请求,并通过…...
Spark,集群搭建之Yarn模式
以下是Spark基于Yarn模式的集群搭建关键步骤(需先部署Hadoop Yarn集群): 一、环境准备 1. 确认Hadoop已运行 - 确保HDFS、Yarn ResourceManager和NodeManager正常启动。 2. 安装Java - 所有节点安装JDK 8,配置 JAVA_HOME 环境变量…...
fiddler 配置ios手机代理调试
平时做移动移动端开必的时候经常需要抓包手机,用于接口请求跟踪,但iOS的抓包经常性的配不成功,经过踩过不少坑后终于知道了整个配置流程,此文记录Fiddler抓包iOS手机的配置流程。 Step 1:Fiddler配置 通过工具栏Tool…...
iOS即时通信的技术要点
iOS即时通信开发的关键技术要点总结: 一、通讯协议选择 Socket通信 基础实现:使用原生BSD Socket或CFNetwork框架(复杂),推荐第三方库如CocoaAsyncSocket(封装GCDAsyncSocket),简化T…...
Windows 安装 Milvus
说明 操作系统:Window 中间件:docker desktop Milvus:Milvus Standalone(单机版) 安装 docker desktop 参考:Window、CentOs、Ubuntu 安装 docker-CSDN博客 安装 Milvus 参考链接:Run Mil…...