当前位置: 首页 > news >正文

【阿里云大模型高级工程师ACP学习笔记】2.9 大模型应用生产实践 (上篇)

特别说明:由于这一章节是2025年3月官方重点更新的部分,新增内容非常多,因此我不得不整理成上、下两篇,方便大家参考。

学习目标

备考阿里云大模型高级工程师ACP认证,旨在全面掌握大模型应用生产实践的专业知识,提升在该领域的实操技能与理论水平,为职业发展增添助力。具体目标如下:

  • 明晰业务需求分析要点:学会区分不同业务场景下大模型的功能性和非功能性需求,能依据需求选择合适模型并制定部署方案,避免模型选择错误、成本失控等问题。
  • 掌握性能与成本优化策略:熟悉提升大模型应用性能的多种方法,包括系统性能提升和用户感知优化;同时学会在保证性能的前提下优化成本,如选择合适的GPU实例规格和计费方式。
  • 理解稳定性保障措施:了解保障大模型应用线上稳定性的关键方法,像降低用户请求资源消耗、自动化扩缩容、建立评测基线管理、实时监控与预警以及容灾性设计等。

知识点汇总

知识点知识内容重要性学习难易度
业务需求分析业务需求分析对大模型部署的重要性:是成功部署大模型的第一步,不同业务场景对模型的功能性和非功能性需求差异大。
业务场景不清晰的危害:可能导致模型选择错误、用户体验下降、成本失控、安全隐患等问题。
应对策略:明确业务场景后,围绕功能性和非功能性需求深入分析,制定具体部署方案
模型功能性需求不同业务场景的模型选择
- 自然语言处理:通用任务可使用通用大语言模型;特定领域任务,如数学、法务、医疗等,需选择经过领域微调的模型。
- 视觉:使用专门的视觉模型,如通义万相、YOLO、Stable Diffusion等。
- 语音:采用专门的语音处理模型,如Qwen - Audio、CosyVoice等。
- 多模态任务:建议使用专门设计的多模态模型,如Qwen - VL。
模型选择的评估方法:确定任务场景后,若有多种功能类似模型,可构建评测数据集或选择公开数据集进行评测,如用MMLU评估语言理解、BBH测试复杂推理等
模型非功能性需求性能:关注业务对响应速度的要求,明确服务化级别目标SLO,常见指标有TTFT和TPOT。
成本:考虑模型运行成本,包括模型推理和硬件资源成本等。
稳定:确保系统能提供稳定可靠的服务。
安全:保障模型应用在数据隐私、内容安全等方面合规
性能优化系统性能提升
- 更快处理请求:选择较小规模模型或通过模型压缩与量化(模型剪枝、量化、知识蒸馏)加速推理,还可优化提示词、微调模型。
- 减少大模型处理请求数和运算量:使用上下文缓存技术,合并或去除重复请求进行批处理。
- 减少Tokens的输入和输出:精简输入内容,通过提示词要求模型生成简洁回答,指定最大输出长度。
- 并行化处理:将任务分解为多个子任务,如数据并行、模型并行或流水线并行,在不同设备上同时执行。
- 不要默认依赖大模型:对于标准化或受限输出,可采用硬编码;提前计算复用内容;利用经典UI组件和传统优化技术提升效率。
用户感知优化
- 流式输出:逐步返回生成内容,减少用户感知延迟。
- 分块处理:将任务分解为多个小块,分别处理并返回结果。
- 展示任务进度:让用户了解系统处理状态。
- 完善错误处理机制:分类错误并提供友好提示,设置重试机制和降级方案。
- 提供用户反馈入口与持续改进:鼓励用户反馈,分析数据持续优化
成本优化优化系统性能节约成本
- 用小模型替换大模型:推理更快且成本更低。
- 上下文缓存高频重复查询结果:降低调用开销。
- 批量推理合并或去重请求:利用空闲资源降低成本。
- 减少token数量:降低计算资源需求。
- 避免大模型处理所有任务:采用硬编码、预先计算等方式。
云上部署成本优化
- 选择合适的GPU实例规格:根据模型参数量、KV Cache占用、精度设置等选择,如在阿里云上选择合适的ECS实例类型。
- 选择合适的计费方式:包括预付费(包年包月)、按量付费、抢占式实例,根据业务场景选择
稳定性降低用户请求的资源消耗:通过模型小型化、异步批处理、缓存高频结果等方式,降低资源消耗,提升高并发场景下的稳定性。
自动化扩缩容
- 水平伸缩计算资源:利用弹性伸缩(ESS)动态调整ECS/GPU实例数量,或使用函数计算(FC)按需分配资源。
- 分散流量压力:通过负载均衡(SLB)提升高并发场景下的处理能力。
评测基线管理
- 建立基线模型:可从简单的基础算法或预设规则开始,也可参考历史版本。
- 定期测试与对比:从时间和场景维度进行,及时发现性能下降问题。
- 动态调整基线:根据数据变化和业务需求重新训练或更换基线模型。
- 融入自动化流程:自动拦截不合格模型,小范围试用新模型。
模型实时监控与预警
- 关键指标看板:监控模型准确率、响应速度、错误率等指标。
- 数据漂移检测:对比当前输入数据与训练数据的分布差异。
- 自动告警与日志追踪:设置阈值,记录请求信息,方便定位问题。
容灾性设计
- 降级与熔断机制:当模型响应异常时,切换至备份模型或启用规则引擎兜底。
- 通用应用容灾方案:跨地域跨可用区部署,创建备用环境或快速创建环境恢复业务。
- 定期演练预测试:模拟故障场景,验证容灾方案有效性

拉重点

1. 业务需求分析的全面性与精准性

业务需求分析在大模型部署中起着决定性作用,想要做到全面且精准难度不小,需要综合考虑功能性需求、非功能性需求,以及不同场景和模型之间的适配关系。

  • 功能性需求:不同业务场景对模型功能要求天差地别。以自然语言处理场景为例,通用任务如开放域问答、新闻摘要生成,使用通用大语言模型(如Qwen、GPT等)就能满足需求;但像数学解题、法务咨询这类特定领域任务,就必须选择经过领域微调的模型,比如数学问题适合用Qwen - Math,法务问题则需要面向法律领域训练的模型,像通义法睿。在实际分析业务需求时,要精准定位业务所属类型,判断是通用任务还是特定领域任务,才能选对适配模型。如果把通用模型用于专业领域,就会出现回答不准确、专业性不足等问题,影响业务开展。
  • 非功能性需求:除了功能适配,非功能性需求同样关键。以对话系统为例,它对响应速度要求极高(通常低于500ms),这就涉及到性能方面的非功能性需求。在这种场景下,选择模型时不仅要考虑功能,还要关注模型推理速度能否满足响应时间要求。从成本角度看,若业务预算有限,就不能选择运行成本高昂的大规模模型,否则会导致成本失控。再如安全合规方面,医疗诊断场景涉及大量患者隐私数据,模型应用必须严格遵循相关法规,保障数据安全和隐私,防止信息泄露带来的法律风险。
  • 综合考量:在复杂业务场景中,往往需要同时兼顾多种需求。例如在智能客服系统中,既需要模型具备自然语言处理的功能,准确理解用户问题并给出合适回答(功能性需求);又要保证快速响应,让用户等待时间尽可能短(性能需求);还要考虑成本因素,不能因为追求高性能而过度投入(成本需求);同时,要确保用户信息安全,遵循相关数据保护法规(安全合规需求)。学习这部分内容时,我发现只有深入了解每个业务场景的独特之处,熟悉各类模型在功能、性能、成本、安全等方面的特点,才能全面且精准地完成业务需求分析,为后续模型选择和部署方案制定打下坚实基础。

2. 模型性能优化综合策略

模型性能优化是一个复杂且关键的部分,不同业务场景对模型性能的要求差异较大,其评估数据集和性能要求也各有不同,具体如下:

业务场景常用性能评估数据集TTFT要求TPOT要求
对话、咨询、搜索类ShareGPT,MMLU
代码补全、编程、网页设计HumanEval
阅读理解/总结/数据处理/信息提取LongBench
通用大模型(DeepSeek R1,通义大模型等)InfoVQA等多模态评估数据集TTFT < 5sec(推荐小于该值)TPOT < 200ms(推荐小于该值)

此外,为降低系统延迟、提升用户体验,有多种实用方法,具体如下:

优化方向具体方法操作要点作用原理
系统性能提升更快地处理请求选择较小规模模型,或采用模型剪枝、量化、知识蒸馏等技术;优化提示词、微调模型较小规模模型参数少,推理速度快;模型压缩与量化技术减少计算量;优化提示词和微调模型可提高模型推理效率
减少大模型处理请求数和运算量使用上下文缓存技术;合并或去除重复请求进行批处理上下文缓存保存公共前缀内容,避免重复运算;批处理合并相似或重复请求,减少请求次数
减少Tokens的输入和输出精简输入内容,去除冗余;通过提示词要求简洁回答,指定最大输出长度在输入端提取关键信息,减少输入量;输出端控制回答长度和复杂度
并行化处理采用数据并行、模型并行或流水线并行方式处理任务将任务分解为子任务,在不同设备上同时执行
不要默认依赖大模型对标准化输出硬编码;提前计算复用内容;利用经典UI组件和传统优化技术减少对大模型动态生成的依赖,直接使用预设内容或经典技术
用户感知优化流式输出将生成内容逐步返回给用户在应用架构中合理配置,避免影响流式输出的功能(如关闭负载均衡中的缓存和数据压缩功能)
分块处理检索任务按主题或数据源分块检索;生成任务按段落或句子分别生成并返回合理划分任务块,确保各块处理和返回的连贯性
展示任务进度通过进度条、加载动画或文字提示展示任务进度在前端界面实时更新任务状态信息
完善错误处理机制分类错误并提供友好提示;设置自动重试和错误降级方案明确错误类型,给出清晰、易懂、友好的错误提示和解决方案;合理设置重试次数和间隔,设计有效的降级方案
提供用户反馈入口与持续改进在界面提供反馈渠道;分析用户反馈和行为数据优化系统确保反馈渠道便捷易用;深入挖掘反馈和行为数据中的问题和优化点

在实际操作中,需根据具体业务场景,综合运用这些方法来优化模型性能。例如构建一个对话系统,既要通过减少Tokens输入输出、采用并行化处理等方式提升系统性能,又要利用流式输出、展示任务进度等手段优化用户感知,全方位提升用户体验。

3. 成本优化与资源合理配置

成本优化与资源合理配置是大模型应用部署中的关键环节,涉及多个复杂因素,其中内存大小计算和并发计算尤为重要。

内存大小计算

在选择GPU实例规格时,模型运行所需的内存大小是重要依据,它主要受模型参数量、KV Cache占用和精度设置等因素影响。

  • 以1.5B参数的模型为例,在FP32精度下通常需要约5.59GB显存。这是因为模型参数在存储和计算时需要占用一定的显存空间,精度不同,每个参数占用的显存大小也不同。
  • 对于DeepSeek - R1(满血版671B)模型,在FP8精度下:
    • 计算模型本身占用显存:每个参数占用4字节(FP8精度),671B模型参数量为 671 × 1 0 9 671×10^9 671×109个参数。
      • 模型本身占用显存 = 671 × 1 0 9 × 4 ÷ ( 1024 × 1024 × 1024 ) 671×10^9×4÷(1024×1024×1024) 671×109×4÷(1024×1024×1024)
      • = 2684 × 1 0 9 ÷ ( 1024 × 1024 × 1024 ) ≈ 625 G

相关文章:

【阿里云大模型高级工程师ACP学习笔记】2.9 大模型应用生产实践 (上篇)

特别说明:由于这一章节是2025年3月官方重点更新的部分,新增内容非常多,因此我不得不整理成上、下两篇,方便大家参考。 学习目标 备考阿里云大模型高级工程师ACP认证,旨在全面掌握大模型应用生产实践的专业知识,提升在该领域的实操技能与理论水平,为职业发展增添助力。具…...

STM32 ZIBEE DL-20 无线串口模块

一.配置方法 二.串口中断 u8 i; u16 buf[20],res; u8 receiving_flag 0; // 新增一个标志&#xff0c;用于标记是否开始接收数组 void USART1_IRQHandler(void) {if(USART_GetITStatus(USART1, USART_IT_RXNE) ! RESET) //接收中断{res USART_ReceiveData(USART1);if(receiv…...

【算法基础】选择排序算法 - JAVA

一、算法基础 1.1 什么是选择排序 选择排序是一种简单直观的排序算法&#xff0c;它的工作原理是&#xff1a;首先在未排序序列中找到最小&#xff08;或最大&#xff09;元素&#xff0c;存放到排序序列的起始位置&#xff0c;然后再从剩余未排序元素中继续寻找最小&#xf…...

FastAPI 与数据库交互示例

目录 安装必要的包完整代码示例运行应用使用说明API 端点说明代码解析 下面将创建一个简单的 FastAPI 应用程序&#xff0c;演示如何与 SQLite 数据库进行交互。这个例子包括创建、读取、更新和删除&#xff08;CRUD&#xff09;操作。 安装必要的包 首先&#xff0c;需要安装…...

(六——下)RestAPI 毛子(Http resilience/Refit/游标分页)

文章目录 项目地址一、Refit1.1 安装需要的包1.2 创建接口IGitHubApi1.3 创建RefitGitHubService1. 实现接口2. 注册服务 1.4 修改使用方法 二、Http resilience2.1 安装所需要的包2.2 创建resilience pipeline简单版2.3 创建全局的resilience处理1. 创建清理全局ResilienceHan…...

Rust 学习笔记:关于枚举与模式匹配的练习题

Rust 学习笔记&#xff1a;关于枚举与模式匹配的练习题 Rust 学习笔记&#xff1a;关于枚举与模式匹配的练习题以下程序能否通过编译&#xff1f;若能&#xff0c;输出是什么&#xff1f;考虑这两种表示结果类型的方式&#xff0c;若计算成功&#xff0c;则包含值 T&#xff1b…...

父子组件双向绑定

v-model 语法糖实现 vue中我们在input中可以直接使用v-model来完成双向绑定,这个时候 v-model 通常会帮我们完成两件事: v-bind:value的数据绑定@input的事件监听如果我们现在封装了一个组件,其他地方在使用这个组件时,是否也可以使用v-model来同时完成这两个功能呢? 当我…...

系统思考与第一性原理

最近一直有客户提到“第一性原理”&#xff0c;希望借此穿透纷繁复杂的现象&#xff0c;看清事情的本质。我第一反应是&#xff1a;这与系统思考中的冰山模型不谋而合。 冰山模型中提到&#xff1a;我们看到的只是表面事件&#xff0c;事件背后有趋势&#xff0c;趋势背后有结…...

基于Redis实现-UV统计

基于Redis实现-UV统计 本文将使用HyperLogLog来实现UV统计。 首先我们搞懂两个概念&#xff1a; UV&#xff1a;全称Unique Visitor&#xff0c;也叫独立访客量&#xff0c;是指通过互联网访问、浏览这个网页的自然人。1天内同一个用户多次访问该网站&#xff0c;只记录一次…...

【iOS】类与对象底层探索

类与对象底层探索 Clang探索对象本质objc_setProperty源码探索cls与类的关联原理isa的类型isa_t原理探索 类&类的结构什么是元类NSObject到底有几个isa走位&继承关系图objc_class&objc_object 类结构分析计算cache类中的内存大小获取bits属性列表&#xff08;prope…...

2025年- H18-Lc126-54.螺旋矩阵(矩阵)---java版

1.题目描述 2.思路* 思路1&#xff1a; 补充2&#xff1a; directions[1][0] // 表示“下”这个方向的行增量&#xff08;1&#xff09; directions[1][1] // 表示“下”这个方向的列增量&#xff08;0&#xff09; int[][] directions {{0, 1}, {1, 0}, {0, -1}, {-…...

Paddle Serving|部署一个自己的OCR识别服务器

前言 之前使用C部署了自己的OCR识别服务器&#xff0c;Socket网络传输部分是自己写的&#xff0c;回过头来一看&#xff0c;自己犯傻了&#xff0c;PaddleOCR本来就有自己的OCR服务器项目&#xff0c;叫PaddleServing&#xff0c;这里记录一下部署过程。 1 下载依赖环境 1.1 …...

yolov5 本地训练

YOLOv5 | Kaggle 直接gitclone他的源码用Vscode看&#xff08;也可以直接把jupyter下下来&#xff09; 他要1.8&#xff0c;我的是2.7&#xff0c;他这个代码可能有点年头了 两年前了 他的环境 我的环境 我就是不懂为什么清华源的torch windows默认下出来是cpu版本 . 在终端…...

同城跑腿小程序帮取帮送接单抢单预约取件智能派单同城配送全开源运营版源码优创

一、源码描述 这是一套同城跑腿小程序&#xff0c;基于FastadminUniapp框架&#xff0c;全开源无加密&#xff0c;可私有化部署&#xff0c;包含用户端、骑手端和运营端&#xff08;后端&#xff09;&#xff0c;支持帮取/帮送模式&#xff0c;支持一键接单/抢单&#xff0c;主…...

基于SpringBoot的药房药品销售管理系统

作者&#xff1a;计算机学姐 开发技术&#xff1a;SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等&#xff0c;“文末源码”。 专栏推荐&#xff1a;前后端分离项目源码、SpringBoot项目源码、Vue项目源码、SSM项目源码、微信小程序源码 精品专栏&#xff1a;…...

机器学习中的学习率及其衰减方法全面解析

摘要&#xff1a; 本文深入解析机器学习中的学习率及其衰减方法&#xff0c;涵盖学习率的作用、常用衰减参数及七种主流衰减策略&#xff08;分段常数、指数、自然指数、多项式、余弦、线性余弦、噪声线性余弦&#xff09;。通过公式推导与图示对比&#xff0c;揭示不同衰减方式…...

硬件性能与能效比竞赛:解码 PC 硬件的 “速度与激情”

引言&#xff1a;当性能遇见能效&#xff0c;一场永不停歇的算力革命 在数字内容爆炸式增长的时代&#xff0c;无论是 4K/8K 游戏的极致画质追求&#xff0c;还是 AI 大模型的本地化部署需求&#xff0c;亦或是内容创作者对实时渲染的效率渴求&#xff0c;都在推动 PC 硬件走向…...

大模型在终末期肾脏病风险预测与临床方案制定中的应用研究

目录 一、引言 1.1 研究背景与意义 1.2 研究目的与创新点 1.3 研究方法与数据来源 二、终末期肾脏病概述 2.1 定义与诊断标准 2.2 发病机制与影响因素 2.3 现状与危害 三、大模型技术原理及应用现状 3.1 大模型基本原理 3.2 在医疗领域应用案例 3.3 在终末期肾脏病…...

【C++11】智能指针

&#x1f4dd;前言&#xff1a; 这篇文章我们来讲讲C11——智能指针&#xff1a; &#x1f3ac;个人简介&#xff1a;努力学习ing &#x1f4cb;个人专栏&#xff1a;C学习笔记 &#x1f380;CSDN主页 愚润求学 &#x1f304;其他专栏&#xff1a;C语言入门基础&#xff0c;pyt…...

华为云Astro轻应用利用自定义连接器调用第三方接口实际操作

样图 说明 华为云Astro轻应用通过自定义连接器调用第三方接口具有多方面的作用,主要体现在以下几点: 扩展功能与集成能力 调用第三方服务:通过配置自定义连接器,Astro轻应用可以调用第三方提供的Rest协议接口,实现第三方提供的业务功能,扩展应用的能力。 集成外部系统:…...

【中间件】brpc_基础_butex.h

butex.h 学习笔记 源码 1 概述 butex.h 提供了一种用户态同步原语 butex&#xff08;类似 Linux 的 futex&#xff09;&#xff0c;专为 bthread 设计&#xff0c;用于高效协调线程的阻塞与唤醒。其核心是通过原子操作结合等待队列管理&#xff0c;减少内核态切换开销&#…...

数字智慧方案5876丨智慧交通枢纽智能化系统建设方案(56页PPT)(文末有下载方式)

篇幅所限&#xff0c;本文只提供部分资料内容&#xff0c;完整资料请看下面链接 https://download.csdn.net/download/2301_78256053/89575493 资料解读&#xff1a;智慧交通枢纽智能化系统建设方案 详细资料请看本解读文章的最后内容。 随着城市化进程的加速&#xff0c;交…...

深度学习笔记40_中文文本分类-Pytorch实现

&#x1f368; 本文为&#x1f517;365天深度学习训练营 中的学习记录博客&#x1f356; 原作者&#xff1a;K同学啊 | 接辅导、项目定制 一、我的环境 1.语言环境&#xff1a;Python 3.8 2.编译器&#xff1a;Pycharm 3.深度学习环境&#xff1a; torch1.12.1cu113torchvision…...

python设置word字体的方法

在Python中&#xff0c;可以使用python-docx库来设置Word文档的字体样式&#xff0c;以下为具体方法和示例代码&#xff1a; 一、设置段落中字体样式 使用python-docx库时&#xff0c;Word文档中的文本通常被组织成段落&#xff08;Paragraph对象&#xff09;&#xff0c;而一…...

golang常用库之-标准库text/template

文章目录 golang常用库之-标准库text/template背景什么是text/templatetext/template库的使用 golang常用库之-标准库text/template 背景 在许多编程场景中&#xff0c;我们经常需要把数据按照某种格式进行输出&#xff0c;比如生成HTML页面&#xff0c;或者生成配置文件。这…...

【JAVA】如何快速阅读一个基于maven构建的springboot项目

一、摘要 在JAVA项目开发过程中&#xff0c;现在比较流行的是springboot机构&#xff0c;特别是在后端开发的项目中&#xff0c;springboot应用的非常普遍。springboot很好将大型的、复杂的项目进行分解&#xff0c;以模块或者服务的表现形式组成项目。那么当我们接手一个陌生的…...

Fedora升级Google Chrome出现GPG check FAILED问题解决办法

https://dl.google.com/linux/linux_signing_key.pub 的 GPG 公钥(0x7FAC5991)已安装 https://dl.google.com/linux/linux_signing_key.pub 的 GPG 公钥(0xD38B4796)已安装 仓库 "google-chrome" 的 GPG 公钥已安装&#xff0c;但是不适用于此软件包。 请检查此仓库的…...

深入解析MapReduce:大数据处理的经典范式

引言 在大数据时代&#xff0c;如何高效处理海量数据成为技术核心挑战之一。Hadoop生态中的MapReduce框架应运而生&#xff0c;以其“分而治之”的思想解决了大规模数据的并行计算问题。本文将从原理、核心组件到实战案例&#xff0c;带你全面理解这一经典计算模型。 一、MapR…...

JVM性能调优的基础知识 | JVM内部优化与运行时优化

目录 JVM内部的优化逻辑 JVM的执行引擎 解释执行器 即时编译器 JVM采用哪种方式&#xff1f; 即时编译器类型 JVM的分层编译5大级别&#xff1a; 分层编译级别&#xff1a; 热点代码&#xff1a; 如何找到热点代码&#xff1f; java两大计数器&#xff1a; OSR 编译…...

云计算-容器云-部署jumpserver 版本2

应用部署&#xff1a;堡垒机部署 # 使用提供的软件包配置Yum源&#xff0c;通过地址将jumpserver.tar.gz软件包下载至Jumpserver节点的/root目录下 [rootjumpserver ~]# tar -zxvf jumpserver.tar.gz -C /opt/ [rootjumpserver ~]# cp /opt/local.repo /etc/yum.repos.d/ [roo…...

MSP430G2553驱动0.96英寸OLED(硬件iic)

1.前言 最近需要用MSP430单片机做一个大作业,需要用到OLED模块&#xff0c;在这里记录一下 本篇文章主要讲解MSP430硬件iic的配置和OLED函数的调用&#xff0c;不会详细讲解OLED显示原理(其实就是江科大的OLED模块如何移植到msp430上).OLED显示原理以及底层函数讲解请参考其他…...

同质化的旅游内核

湘西凤凰古城、北京非常有文艺氛围的方家胡同都在被改造翻新为现代的其他城市范式式的样式。 什么意思呢&#xff1f;很多古城的老房子&#xff0c;从外面看&#xff0c;很古老、很漂亮&#xff0c;但是进去以后&#xff0c;完全不是那么回事&#xff0c;整座房子已经被完全掏…...

2025年五一数学建模A题【支路车流量推测】原创论文讲解(含完整python代码)

大家好呀&#xff0c;从发布赛题一直到现在&#xff0c;总算完成了2025年五一数学建模A题【支路车流量推测】完整的成品论文。 本论文可以保证原创&#xff0c;保证高质量。绝不是随便引用一大堆模型和代码复制粘贴进来完全没有应用糊弄人的垃圾半成品论文。 A题论文共104页&a…...

文章六:《循环神经网络(RNN)与自然语言处理》

文章6&#xff1a;循环神经网络&#xff08;RNN&#xff09;与自然语言处理——让AI学会"说人话" 引言&#xff1a;你的手机为什么能秒懂你&#xff1f; 当你说"我想看科幻片"时&#xff0c;AI助手能立刻推荐《星际穿越》&#xff0c;这背后是RNN在"…...

Redis总结及设置营业状态案例

Redis简介: rRedis服务开启与停止: 服务开启: 在Redis配置文件中输入cmd进入命令行输入redis-server redis-cli.exe -h -p&#xff1a;连接到redis服务 设置密码:在redis.windows.conf中找到requirepass 密码 服务停止&#xff1a; 在服务开启的界面按ctrlc Redis数据类…...

中科大:LLM几何推理数据生成

&#x1f4d6;标题&#xff1a;Enhancing the Geometric Problem-Solving Ability of Multimodal LLMs via Symbolic-Neural Integration &#x1f310;来源&#xff1a;arXiv, 2504.12773 &#x1f31f;摘要 &#x1f538;多模态大语言模型&#xff08;MLLM&#xff09;的最…...

AimRT从入门到精通 - 04RPC客户端和服务器

一、ROS中的service通信机制 服务通信也是ROS中一种极其常用的通信模式&#xff0c;服务通信是基于请求响应模式的&#xff0c;是一种应答机制。也即&#xff1a;一个节点A向另一个节点B发送请求&#xff0c;B接收处理请求并产生响应结果返回给A。比如如下场景&#xff1a; 机器…...

【Android】Intent

目录 一、什么是Intent 二、显式Intent 三、隐式Intent 四、复杂数据传递 五、跨应用权限管理 六、常见问题 一、什么是Intent 1. 跨组件通信桥梁 实现组件间通信&#xff08;Activity/Service/BroadcastReceiver&#xff09;封装操作指令与数据传输逻辑 目标组件启动…...

从0开始建立Github个人博客(hugoPaperMod)

从0开始建立Github个人博客(hugo&PaperMod) github提供给每个用户一个网址&#xff0c;用户可以建立自己的静态网站。 一、Hugo hugo是一个快速搭建网站的工具&#xff0c;由go语言编写。 1.安装hugo 到hugo的github标签页Tags gohugoio/hugo选择一个版本&#xff0c…...

Python集合全解析:从基础到高阶应用实战

一、集合核心特性与创建方法 1.1 集合的本质特征 Python集合&#xff08;Set&#xff09;是一种​​无序且元素唯一​​的容器类型&#xff0c;基于哈希表实现&#xff0c;具有以下核心特性&#xff1a; ​​唯一性​​&#xff1a;自动过滤重复元素​​无序性​​&#xff…...

Matlab自学笔记

一、我下载的是Matlab R2016a软件&#xff0c;打开界面如下&#xff1a; 二、如何调整字体大小&#xff0c;路径为&#xff1a;“主页”->“预设”->“字体”。 三、命令行窗口是直接进行交互式的&#xff0c;如下输入“3 5”&#xff0c;回车&#xff0c;就得到结果“…...

Python爬虫实战:获取好大夫在线各专业全国医院排行榜数据并分析,为患者就医做参考

一、引言 在当今医疗资源丰富但分布不均的背景下,患者在选择合适的心血管内科医院时面临诸多困难。好大夫在线提供的医院排行榜数据包含了医院排名、线上服务得分、患者评价得分等重要信息,对患者选择医院具有重要的参考价值。本研究通过爬取该排行榜数据,并进行深入分析,…...

多模态人工智能研究:视觉语言模型的过去、现在与未来

多模态人工智能研究&#xff1a;视觉语言模型的过去、现在与未来 1. 引言&#xff1a;定义多模态图景 多模态人工智能指的是旨在处理和整合来自多种数据类型或“模态”信息的人工智能系统&#xff0c;这些模态包括文本、图像、音频和视频等。与通常侧重于单一模态&#xff08;…...

DeepSeek+Excel:解锁办公效率新高度

目录 一、引言&#xff1a;Excel 遇上 DeepSeek二、认识 DeepSeek&#xff1a;大模型中的得力助手2.1 DeepSeek 的技术架构与原理2.2 DeepSeek 在办公场景中的独特优势 三、DeepSeek 与 Excel 结合的准备工作3.1 获取 DeepSeek API Key3.2 配置 Excel 环境 四、DeepSeekExcel 实…...

3033. 修改矩阵

​题目来源&#xff1a; leetcode题目&#xff1a;3033. 修改矩阵 - 力扣&#xff08;LeetCode&#xff09; 解题思路&#xff1a; 获取每列的最大值后将-1替换即可。 解题代码&#xff1a; #python3 class Solution:def getMaxRow(matrix:List[List[int]])->List[int]:r…...

Android面试总结之jet pack模块化组件篇

一、ViewModel 深入问题 1. ViewModel 如何实现跨 Fragment 共享数据&#xff1f;其作用域是基于 Activity 还是 Fragment&#xff1f; 问题解析&#xff1a; ViewModel 的作用域由 ViewModelStoreOwner 决定。当 Activity 和其内部 Fragment 共享同一个 ViewModelStoreOwner…...

【无需docker】mac本地部署dify

环境安装准备 #安装 postgresql13 brew install postgresql13 #使用zsh的在全局添加postgresql命令集 echo export PATH"/usr/local/opt/postgresql13/bin:$PATH" >> ~/.zshrc # 使得zsh的配置修改生效 source ~/.zshrc # 启动postgresql brew services star…...

清洗数据集

将label在图片上画出来 按照第一行的属性分类 import os import cv2 import multiprocessing as mp from tqdm import tqdm# ---------- 路径配置 ---------- # IMAGE_DIR = r"C:\Users\31919\Desktop\datasets\13k_100drive_raw_with_hand\images\test" LABEL_DIR =…...

支持向量机(SVM)详解

引言 支持向量机&#xff08;Support Vector Machine, SVM&#xff09;是一种强大的监督学习算法&#xff0c;主要用于分类和回归任务。其核心思想是找到一个最优的决策边界&#xff08;超平面&#xff09;&#xff0c;最大化不同类别之间的间隔&#xff08;Margin&#xff09…...

MIT XV6 - 1.2 Lab: Xv6 and Unix utilities - pingpong

接上文 MIT XV6 - 1.1 Lab: Xv6 and Unix utilities - user/_sleep 是什么&#xff1f;做什么&#xff1f; pingpong 不务正业了那么久(然而并没有&#xff0c;虽然还在探索sleep&#xff0c;但是教材我已经看完了前三章了)&#xff0c;让我们赶紧继续下去 在进行本实验之前请务…...