当前位置: 首页 > news >正文

计算机体系结构期末复习1:分支预测

目录

一、为什么需要分支预测

1.存在分支的指令

2.控制相关的处理方式一:stall(阻塞)流水线

二、分支预测方法

1.预测正确与预测错误的性能损失

2.减少预测错误的惩罚

3.提高分支预测的准确度 

1)编译时(静态方法)

2)运行时(动态方法)

三、动态预测方法

1.Last Time Predictor

2.Last Time Predictor改进:2 bits 饱和计数器

3.Two Level Predictior(两层预测器)

1)局部相关性:

2)全局相关性:

3)全局历史寄存器(GHR):

5)模式历史表(PHT):

6)提高全局预测器准确性的方法


一、为什么需要分支预测

CPU流水线上的指令存在控制相关,即PC值可能不再顺序执行,可能会跳转到另一地址。

1.存在分支的指令

1)条件跳转:比如beq $rs, $rt, offset,在X(执行)阶段确定是否跳转

2)无条件跳转:比如j target,在D(译码)阶段确定是否跳转

3)函数调用:比如jal target,在D(译码)阶段确定是否跳转

4)跳转寄存器:比如JR $ra,在D(译码)阶段确定是否跳转

2.控制相关的处理方式一:stall(阻塞)流水线

这种思路是,既然我在decode阶段(甚至exe阶段)才知道分支的跳转情况(也就是下一条取什么指令),那么流水线阻塞一个周期,等到该条指令运行完decode阶段,再读入下一条指令。

正常五级流水线如下图:

 用stall方法来处理五级流水线如下图:

显然,stall的方式十分低效。与其等待分支结果运算出来,不如尝试分支预测。

二、分支预测方法

1.预测正确与预测错误的性能损失

1)预测正确:假如预测正确,那么我们下一条取的指令就是我们期望中的,不会带来任何延迟。

2)预测错误:假如预测错误,我们需要刷新取进来的错误指令,重新取一条新的指令。

3)性能损失分析:

假设不预测,插入bubble,会阻塞两个周期。

假如预测成功,正常执行就好。

假如预测失败,需要刷新掉decode和exe阶段正在执行的指令(即错误执行的指令)。也会像不预测那样损失掉两个周期的时间。

我们来定量计算一下: 假如五级流水线中,无数据危害引起的stalls,20% 的分支指令,其中70%预测错误,那么:

CPI=(1+0.2x0.7x2)=(1+0.14x2)=1.28 

其中0.14是预测错误的概率,2是预测错误引来的额外阻塞时间。要想降低CPI,我们从这两点入手。

2.减少预测错误的惩罚

1)如果能在decode阶段获取分支跳转结果,那么不预测或者预测错误只需要阻塞一个周期。惩罚从2变成1.

2)如果能在fetch阶段就获取分支结果,那么一定能取进正确的指令,也不会引进额外的阻塞。 

3.提高分支预测的准确度 

1)编译时(静态方法)

  • 一直预测为跳转
  • 一直预测为不跳转
  • 预测后向为跳转,前向为不跳转
  • 基于提前分析(略)
  • 基于程序分析(略)

2)运行时(动态方法)

  • Last time prediction (single-bit)
  • Two-bit counter based prediction
  • Two-level prediction (global vs. local)
  • Hybrid
  • Advanced algorithms (e.g., using perceptrons)

三、动态预测方法

1.Last Time Predictor

 1)思路:每个分支语句采用1bit记录预测结果(T表示跳转,N表示不跳转)。上一条分支语句跳转,这一条分支语句就预测跳转;上一条分支语句不跳转,这一条分支语句就预测不跳转。

2)缺陷:遇到双层循环时,会连续两次预测错误。(跳出内存循环时预测错误一次,跳进外层循环时错误一次)。预测分析器的转换太快。

2.Last Time Predictor改进:2 bits 饱和计数器

3.Two Level Predictior(两层预测器)

1)局部相关性:

一条分支语句的结果可能与过去多次的预测结果有关,而不仅仅与最后一次有关。两层预测器将关注过去两次的分支跳转结果。

2)全局相关性

一条分支语句的结果可能与其他分支语句的结果相关。比如某种pattern会循环多次。(比如for(int i=0;i<4;i++)作为内层循环,TTTTNT可能会循环多次)

3)全局历史寄存器(GHR):

记录过去所有分支的跳转历史。比如0100代表第二条发生了跳转,第一、三、四条没有跳转。

5)模式历史表(PHT):

记录跳转历史。

  • 使用GHR的内容进行索引
  • 每个表项是个2bits饱和计数器,用于预测当出现该表项的pattern时,下一条分支该如何跳转
  • 当需要预测分支跳转时,根据历史分支跳转情况查找PHT

 

6)提高全局预测器准确性的方法

A. 思路:由于不同的分支语句碰到一样的历史pattern时跳转趋势可能不同,因此增加上下文信息让预测器知道当前预测是哪个分支语句。

方法:GHR和分支语句的PC进行哈希,再去索引PHT。

B.思路: 为不同分支维护单独的PHT。即由PC的低位决定访问哪个PHT,再由GHR索引PHT的表项。

相关文章:

计算机体系结构期末复习1:分支预测

目录 一、为什么需要分支预测 1.存在分支的指令 2.控制相关的处理方式一&#xff1a;stall(阻塞&#xff09;流水线 二、分支预测方法 1.预测正确与预测错误的性能损失 2.减少预测错误的惩罚 3.提高分支预测的准确度 1&#xff09;编译时&#xff08;静态方法&#xff…...

获取页面上所有的img,并保存到本地

浏览器的 JavaScript 环境中受限于安全和隐私原因&#xff0c;不允许直接指定下载文件夹或访问本地文件系统。因此&#xff0c;无法通过纯 JavaScript 在浏览器控制台中实现下载图片到指定文件夹的功能。 然而&#xff0c;您可以使用 Web API 提供的文件系统访问 API 进行一定…...

Day56 图论part06

108.冗余连接 并查集应用类题目,关键是如何把题意转化成并查集问题 代码随想录 import java.util.Scanner;public class Main{public static void main (String[] args) {Scanner scanner = new Scanner(System.in);int n = scanner.nextInt();DisJoint disjoint = new DisJo…...

深度学习助力股市预测:LSTM、RNN和CNN模型实战解析

作者&#xff1a;老余捞鱼 原创不易&#xff0c;转载请标明出处及原作者。 写在前面的话&#xff1a;众所周知&#xff0c;传统的股票预测模型有着各种各样的局限性。但在我的最新研究中&#xff0c;探索了一些方法来高效预测股市走势&#xff0c;即CNN、RNN和LSTM这些深度学习…...

.NET能做什么?全面解析.NET的应用领域

.NET 是由微软开发的一个开源、跨平台的开发框架。它不仅支持构建各种应用程序&#xff0c;还能运行在不同的操作系统上&#xff0c;包括 Windows、Linux 和 macOS。自从 .NET Core 的推出&#xff0c;.NET 成为了一个现代化的开发平台&#xff0c;能够满足企业和开发者日益多样…...

分布式事务入门 一

分布式事务入门 一 您好&#xff0c;我是今夜写代码,今天学习下分布式事务相关理论&#xff0c;以及常见的解决方案&#xff0c;为后续掌握Seata分布式事务框奠定基础。 为什么需要分布式事务? 分布式事务主要由于存储资源的分布性&#xff0c;通常涉及多个数据库。 分布式…...

华为,新华三,思科网络设备指令

1. 设备信息查看 华为 display version # 查看设备版本信息 display device # 查看设备硬件信息 新华三&#xff08;H3C&#xff09; display version # 查看设备版本信息 display device # 查看设备硬件信息 锐捷 show version …...

深入理解HTML页面加载解析和渲染过程(一)

一篇老文章&#xff0c;存在草稿有点可惜 HTML页面呈现通常包括三个主要过程&#xff1a;加载、解析和渲染。让我们详细探讨每个过程。 1. 加载过程 加载过程主要涉及获取页面所需的所有资源。这个过程包括以下步骤&#xff1a; 1.1 URL资源加载 缓存读取&#xff1a;浏览器…...

Odoo 免费开源 ERP:通过 JavaScript 创建对话框窗口的技术实践分享

作者 | 老杨 出品 | 上海开源智造软件有限公司&#xff08;OSCG&#xff09; 概述 在本文中&#xff0c;我们将深入研讨如何于 Odoo 18 中构建 JavaScript&#xff08;JS&#xff09;对话框或弹出窗口。对话框乃是展现重要讯息、确认用户操作以及警示用户留意警告或错误的行…...

Word批量更改题注

文章目录 批量更改批量去除空格 在写文章的时候&#xff0c;往往对图片题注有着统一的编码要求&#xff0c;例如以【图 1- xx】。一般会点击【引用】->【插入题注】来插入题注&#xff0c;并且在引用的时候&#xff0c;点击【引用】->【交叉引用】&#xff0c;并且在交叉…...

电脑缺失libcurl.dll怎么解决?详解电脑libcurl.dll文件丢失问题

一、libcurl.dll文件丢失的原因 libcurl.dll是一个用于处理URL传输的库文件&#xff0c;广泛应用于各种基于网络的应用程序。当这个文件丢失时&#xff0c;可能会导致相关应用程序无法正常运行。以下是libcurl.dll文件丢失的一些常见原因&#xff1a; 软件安装或卸载不完整&a…...

OpenCV相机标定与3D重建(36)计算两幅图像之间基本矩阵(Fundamental Matrix)的函数findFundamentalMat()的使用

操作系统&#xff1a;ubuntu22.04 OpenCV版本&#xff1a;OpenCV4.9 IDE:Visual Studio Code 编程语言&#xff1a;C11 算法描述 从两幅图像中的对应点计算基本矩阵。 cv::findFundamentalMat 是 OpenCV 中用于计算两幅图像之间基本矩阵&#xff08;Fundamental Matrix&#…...

JQ中的each()方法与$.each()函数的使用区别

介绍 jquery里的 each() 是一个强大的遍历工具&#xff0c;用于迭代集合中的元素&#xff0c;并为每个元素执行指定的函数‌。它既可以用于遍历 jQuery对象集合&#xff0c;也可以用于遍历普通的数组或对象。 each()对象遍历 语法&#xff1a; $(selector).each(function(in…...

浅谈下雪花算法的原理,及在项目中使用需要注意哪些事项

目录 背景 雪花算法原理 算法特点 注意事项 总结 背景 雪花算法是一种分布式ID生成算法&#xff0c;由Twitter提出&#xff0c;用于在分布式系统中生成全局唯一的ID。该算法通过将64位的长整型数字分为符号位、时间戳、工作机器ID和序列号四个部分&#xff0c;确保了ID的…...

洛谷P1536 村村通(c嘎嘎)

题目链接&#xff1a;P1536 村村通 - 洛谷 | 计算机科学教育新生态 题目难度&#xff1a;普及/提高 解题思路&#xff1a;本题很明显考察是并查集&#xff0c;并查集之前我的博客介绍过可以看看这篇 洛谷P1551 亲戚&#xff08;c嘎嘎&#xff09;-CSDN博客&#xff0c;本题是…...

双指针——查找总价格为目标值的两个商品

一.题目描述 LCR 179. 查找总价格为目标值的两个商品 - 力扣&#xff08;LeetCode&#xff09; 二.题目解析 这个题目非常简单&#xff0c;其实就是判断有没有两个数加起来等于target。 三.算法解析 1.暴力解法 暴力解法的话我们可以枚举出所有的情况&#xff0c;然后判…...

智慧园区小程序开发制作功能介绍

智慧园区小程序开发制作功能介绍 智慧园区小程序系统作为一款面向园区企业的一站式线上服务平台&#xff0c;可为企业提供数智化的园区办公服务。智慧园区小程序功能介绍 1、园区公告、政策信息查看足不出户掌握最新动态&#xff0c;“园区公告、政策信息”等信息。首页点击对应…...

【面经】25届 双非本科 字节跳动 北京 四年的总结

点击“硬核王同学”&#xff0c;选择“关注” 福利干货第一时间送达 大家好&#xff0c;我是硬核王同学&#xff0c;最近在做免费的嵌入式知识分享&#xff0c;帮助对嵌入式感兴趣的同学学习嵌入式、做项目、找工作&#xff01; 给大家分享一个25届本科大佬的面经&#xff0c…...

MySql幻读问题

认识具有反复性。 之前以为理解了幻读&#xff0c;最近看黑马的mysql教程以为再次加深了认识。然而现在认为之前的理解都是错误的&#xff0c;而且网上很多关于幻读的解释&#xff0c;都不太准确。 关于幻读的最佳解释还是要看官网mysql官网幻读解释 脏读和不可重复读比较好理…...

欧拉计划启航篇(一)

目录 1.什么是欧拉计划 2.简单介绍 3.访问不上去怎么办 4.第一题的代码编写 5.代码的优化 1.什么是欧拉计划 欧拉计划是和我们的数学知识相关的一个网站&#xff0c;但是这个网站上面的相关的问题需要我们去使用编程的知识去进行解决&#xff0c;因此这个适合对于想要提升…...

Pandas系列|第二期:Pandas中的数据结构

1.Pandas中的数据结构&#xff1a;Series和DataFrame Pandas 的主要数据结构是 Series &#xff08;一维数据&#xff09;与 DataFrame&#xff08;二维数据&#xff09;&#xff0c;这两种数据结构足以处理金融、统计、社会科学、工程等领域里的大多数典型用例。 Series 是一…...

GitLab 服务变更提醒:中国大陆、澳门和香港用户停止提供服务(GitLab 服务停止)

目录 前言 一. 变更详情 1. 停止服务区域 2. 邮件通知 3. 新的服务提供商 4. 关键日期 5. 行动建议 二. 迁移指南 三. 注意事项 四. 相关推荐 前言 近期&#xff0c;许多位于中国大陆、澳门和香港的 GitLab 用户收到了一封来自 GitLab 官方的重要通知。根据这封邮件…...

基于openEuler22.09部署OpenStack Yoga云平台(一)

OpenStack Yoga部署 安装OpenStack 一、基础准备 基于OpenStack经典的三节点环境进行部署&#xff0c;三个节点分别是控制节点&#xff08;controller&#xff09;、计算节点&#xff08;compute&#xff09;、存储节点&#xff08;storage&#xff09;&#xff0c;其中存储…...

信息安全管理:通用安全管理checklist

通用安全管理checklist是对信息安全管理调查问卷的一个补充&#xff0c;将以前没有包含的检查点纳入进来&#xff0c;算是对这个系列的一个拾遗与结尾。内容包含安全策略与计划、组织和人员安全、安全工程管理、安全产品管理与符合性五部分。 一、安全策略与安全计划 ▼▼安全…...

硬件设计-硬件 EMC 设计规范

目录 引言&#xff1a; 常见原因 总体概念及考虑 布局 屏蔽 滤波 引言&#xff1a; 本规范只简绍 EMC 的主要原则与结论&#xff0c;为硬件工程师们在开发设计中抛砖引玉。 电磁干扰的三要素是干扰源、干扰传输途径、干扰接收器。EMC 就围绕这些 问题进行研究。最基本的…...

【C++】数据结构 单链表的实现(企业存储用户数据的实现)

本篇博客给大家带来的是用C语言来实现数据结构的单链表&#xff08;企业存储用户数据的实现&#xff09; &#x1f41f;&#x1f41f;文章专栏&#xff1a;C &#x1f680;&#x1f680;若有问题评论区下讨论&#xff0c;我会及时回答 ❤❤欢迎大家点赞、收藏、分享 你们的支持…...

【Vue3+ts入门小试牛刀】

Vue 3是一个流行的JavaScript框架&#xff0c;它提供了创建交互式用户界面的工具。Vite是一个现代化的构建工具&#xff0c;用于快速构建Vue应用。TypeScript是一种类型安全的JavaScript的超集&#xff0c;它可以帮助我们在开发过程中减少错误。 下面是一个使用Vue 3、Vite和T…...

AI发展新态势:从技术突破到安全隐忧

AI安全的新挑战 近期AI领域出现了令人担忧的新发现。根据最新研究,AI模型已经开始展现出策略性欺骗的倾向。具体表现在以下几个方面: 策略性欺骗行为的出现 在实验中发现,当研究人员试图让AI执行一些"反Anthropic"的操作时(如获取模型权限和外部服务器访问),模…...

肝功能不正常可以过教师入职体检吗?

如何看肝功能报告单 转氨酶正常等于肝功能正常吗?要想看懂肝功能报告单就要看懂各指标含义。 1、总胆红素TbiL正常值是 1.7-17.1μmol/L 急性黄疸型肝炎活动性肝炎肝坏死、肝癌、胰头癌都异常偏高。 2、直接胆红素 DbiL正常值是 0-6.84μmol/L 结石病、肝癌、胰头癌与这项…...

二百八十二、ClickHouse——删除Linux中的ClickHouse

一、目的 由于ClickHosue的库表发生变化&#xff0c;需要删除原有的表结构数据&#xff0c;才能直接把脚本里文件重新安装 二、删除步骤 1、关闭ClickHouse服务 systemctl stop clickhouse-server 2、卸载ClickHouse软件包 sudo yum remove clickhouse-server clickhouse…...

Disruptor 高性能环形消息框架

官方文档&#xff1a;Disruptor 1. 简介 Disruptor是一个高性能的互进程&#xff08;Inter-process&#xff09;和多线程&#xff08;Multi-threaded&#xff09;消息处理库&#xff0c;由LMAX交易所开发&#xff0c;用于在Java虚拟机&#xff08;JVM&#xff09;上实现高性能…...

青少年编程与数学 02-005 移动Web编程基础 05课题、rem布局与媒体查询

青少年编程与数学 02-005 移动Web编程基础 05课题、rem布局与媒体查询 一、rem单位1. 定义和计算2. 应用场景3. 优点4. 缺点5. 实现响应式布局的方案 二、媒体查询基本语法常用媒体类型常用表达式示例 三、less基本语法主要特性编译和使用总结 四、less嵌套1. 使用媒体查询2. 嵌…...

SuperMap iClient3D for Cesium等高线标注

kele 前言 在三维地形分析中&#xff0c;等高线分析是一种非常重要的分析方法&#xff0c;它能直观的表达出地形的高低起伏特征&#xff0c;在三维系统中受到广泛应用。在SuperMap iClient3D for Cesium中&#xff0c;等高线分析是前端GPU分析&#xff0c;能够分析并渲染出等高…...

HTTP状态码

1xx 信息响应类 表示接收到请求并继续处理。 100 Continue - 客户端应继续发送请求。101 Switching Protocols - 客户端请求服务器切换协议版本。 2xx 成功响应类 表示操作成功被接收、理解并处理。 200 OK - 请求成功&#xff0c;服务器已将所请求的资源返回给客户端。201…...

纯div+css+js弹出窗

目的&#xff1a;实现弹出窗、仅关闭弹窗之后才能操作。自适应宽度与高度、当文本内容太多时、添加滚动条效果。 效果图 源码 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8" /><meta name"viewport"…...

python如何使用RSA加密,避免明文密码

如果在python脚本中出现明文密码&#xff0c;就不符合安全的需求&#xff0c;而md5加密又不够安全&#xff0c;推荐RSA加密&#xff0c;原理不多说&#xff0c;直接说怎么弄 首先执行这个函数&#xff0c;生成公钥和私钥并写入文件 #pip3 install pycryptodome from Crypto i…...

easegen将教材批量生成可控ppt课件方案设计

之前客户提出过一个需求&#xff0c;就是希望可以将一本教材&#xff0c;快速的转换为教学ppt&#xff0c;虽然通过人工程序脚本的方式&#xff0c;已经实现了该功能&#xff0c;但是因为没有做到通用&#xff0c;每次都需要修改脚本&#xff0c;无法让客户自行完成所有流程&am…...

通过远程控制软件实现企业高效协作

在这个信息技术迅猛发展的时代&#xff0c;远程办公已经成为一种趋势&#xff0c;而远程控制软件则是连接分散团队的重要工具。技术的革新不仅推动了远程控制软件的广泛应用&#xff0c;也为现代办公带来了高效的协作体验。本文将探讨远程控制软件的发展&#xff0c;并以RayLin…...

交换机与路由器的区别

交换机和路由器是网络中的两种关键设备&#xff0c;它们各自承担不同的功能&#xff0c;主要区别体现在以下几个方面&#xff1a; 一、工作层次与功能 交换机&#xff1a; 工作层次&#xff1a;交换机主要工作在OSI模型的第二层&#xff0c;即数据链路层。 功能&#xff1a;交…...

每天40分玩转Django:Django国际化

Django国际化 一、今日学习内容概述 学习模块重要程度主要内容国际化基础⭐⭐⭐⭐⭐基本概念、配置设置字符串翻译⭐⭐⭐⭐⭐翻译标记、消息文件模板国际化⭐⭐⭐⭐模板标签、过滤器动态内容翻译⭐⭐⭐⭐模型字段、表单翻译 二、国际化基础配置 # settings.py# 启用国际化 …...

游戏开发-UE4高清虚幻引擎教程

简介 Unreal Engine 4 相关教程&#xff0c;涵盖美术流程、独立游戏制作编程、虚拟现实实战、高级材质系统、蓝图可视化编程及进阶、RPG 游戏与特效开发、VR 交互虚拟漫游等方面。包含大量视频教程、工程文件及源码&#xff0c;如 UE4 零基础美术教程中有火焰材质等案例及模型…...

信号与系统基础知识3:小波变换

信号与系统基础知识3&#xff1a;小波变换 一、本文内容与前置知识点1. 本文内容2. 前置知识点 二、小波变换介绍1. 一个变化忽快忽慢的信号&#xff08;1&#xff09;DFT的频谱数据信息&#xff08;2&#xff09;DFT的漏掉的频谱数据信息 2. 小波变换-时域和频域之间的妥协&am…...

memory泄露分析方法(Binder,Window,View篇)

View泄露&#xff1a;从Hprof找大量重复的view&#xff0c;点击查看text文案如果相同则找产品他们确认是否合理 window泄露&#xff1a;代码或dumpsys window来监测是否有大量同名window&#xff0c;不能用windowtoken来辨别是否重复window&#xff0c;每个window token都不一样…...

如何阻止盗版软件在互联网上传播

阻止公司软件的盗版传播是一项复杂但重要的任务&#xff0c;可以通过技术、法律和管理手段相结合来实现。以下是一些有效的措施&#xff1a; 1. 技术措施 1.1 软件保护 使用软件加密&#xff1a;采用强大的代码混淆、加密技术和反篡改机制。硬件绑定&#xff1a;将软件激活与…...

设计模式--装饰器模式【结构型模式】

设计模式的分类 我们都知道有 23 种设计模式&#xff0c;这 23 种设计模式可分为如下三类&#xff1a; 创建型模式&#xff08;5 种&#xff09;&#xff1a;单例模式、工厂方法模式、抽象工厂模式、建造者模式、原型模式。结构型模式&#xff08;7 种&#xff09;&#xff1…...

CTFHUB-web进阶-php

我们用蚁剑中的这个插件来做这些关卡 一.LD_PRELOAD 发现这里有一句话木马&#xff0c;并且把ant给了我们&#xff0c;我们直接连接蚁剑 右键 选择模式&#xff0c;都可以试一下&#xff0c;这里第一个就可以 点击开始 我们进入到目录&#xff0c;刷新一下&#xff0c;会有一个…...

谷歌开发者工具 - 网络篇

Chrome DevTools - Network网络篇 一、官网二、主要用途三、网络篇1.网络工具栏&#xff08;1&#xff09;网络活动&#xff08;2&#xff09;保留日志&#xff08;3&#xff09;网络状况&#xff08;4&#xff09;网络设置 2.搜索和过滤&#xff08;1&#xff09;搜索&#xf…...

量子退火与机器学习(1):少量数据求解未知QUBO矩阵,以少见多

文章目录 前言ー、复习QUBO&#xff1a;中药配伍的复杂性1.QUBO 的介入&#xff1a;寻找最佳药材组合 二、难题&#xff1a;QUBO矩阵未知的问题1.为什么这么难&#xff1f; 三、稀疏建模(Sparse Modeling)1. 欠定系统中的稀疏解2. L1和L2的选择&#xff1a; 三、压缩感知算法(C…...

JDK高频面试题(包重点)

一、什么是JDK JDK&#xff08;Java Development Kit&#xff09;即 Java 开发工具包&#xff0c;是 Java 编程的基础与核心&#xff0c;由 Sun Microsystems&#xff08;现归属于 Oracle 公司 &#xff09;开发&#xff0c;主要作用如下&#xff1a; 1、提供编译环境 它包含了…...

本地部署 LLaMA-Factory

本地部署 LLaMA-Factory 1. 本地部署 LLaMA-Factory2. 下载模型3. 微调模型3-1. 下载数据集3-2. 配置参数3-3. 启动微调3-4. 模型评估3-5. 模型对话3-6. 导出模型3-7. 使用 vllm 推理 1. 本地部署 LLaMA-Factory 下载代码&#xff0c; git clone https://github.com/hiyouga/…...