「AI 加持的高效架构」高并发场景下的服务器成本优化
大家好,我是 展菲,目前在上市企业从事人工智能项目研发管理工作,平时热衷于分享各种编程领域的软硬技能知识以及前沿技术,包括iOS、前端、Harmony OS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。
图书作者:《ESP32-C3 物联网工程开发实战》
图书作者:《SwiftUI 入门,进阶与实战》
超级个体:COC上海社区主理人
特约讲师:大学讲师,谷歌亚马逊分享嘉宾
科技博主:极星会首批签约作者
文章目录
- 摘要
- 引言
- 高并发的挑战
- 实际场景分析
- 场景 1:电商秒杀活动
- 场景 2:短视频/直播平台
- 场景 3:AI 计算服务
- 限流策略
- 令牌桶算法限流
- AI 智能限流
- 缓存优化
- Redis 缓存热点数据
- CDN 缓存静态资源
- 消息队列优化请求处理
- RabbitMQ 任务队列
- AI 调度队列优化
- QA 环节
- Q1: 传统限流与 AI 限流的区别?
- Q2: 消息队列如何优化高并发请求?
- 总结
摘要
在高并发场景下,服务器资源消耗巨大,导致运维成本飙升。本篇文章将探讨 限流、缓存、队列 等技术手段,并结合 AI 技术优化服务器负载,降低计算成本。通过具体案例分析,提供更经济高效的高并发架构解决方案。
引言
高并发的挑战
随着互联网业务增长,系统需要承受 高并发请求,面临以下挑战:
- 瞬时流量激增:秒杀、抢购、热门活动带来的超高流量。
- 资源消耗巨大:数据库、服务器、网络带宽压力大,成本攀升。
- 响应速度下降:延迟增加,用户体验变差,甚至出现系统崩溃。
- 架构复杂度提高:传统水平扩展(加机器)成本高昂,管理复杂。
实际场景分析
场景 1:电商秒杀活动
用户在同一时间大规模访问商品详情页、加入购物车、下单,数据库压力巨大,导致系统崩溃。
场景 2:短视频/直播平台
高并发访问视频内容,CDN 负载剧增,数据库查询压力增大,影响观看体验。
场景 3:AI 计算服务
大量用户请求 AI 预测或推荐服务,导致推理服务器超负荷运行,GPU 资源成本飙升。
本文将从 限流、缓存、队列、AI 调度 等方面提供优化方案,降低服务器成本。
限流策略
令牌桶算法限流
使用 Redis + Lua 实现限流。
-- Redis 令牌桶算法实现
local key = KEYS[1]
local rate = tonumber(ARGV[1]) -- 每秒生成的令牌数
local capacity = tonumber(ARGV[2]) -- 桶容量
local now = tonumber(redis.call('TIME')[1])
local tokens = redis.call('GET', key) or capacity
local last_time = redis.call('GET', key .. ':time') or now
local elapsed = now - last_time
local new_tokens = math.min(capacity, tokens + elapsed * rate)
if new_tokens < 1 thenreturn 0 -- 请求被限流
elseredis.call('SET', key, new_tokens - 1)redis.call('SET', key .. ':time', now)return 1 -- 请求通过
end
AI 智能限流
使用 AI 预测流量高峰,提前扩容或降级服务。
from sklearn.ensemble import RandomForestRegressor
import numpy as np# 模拟请求流量数据
traffic_data = np.array([[10, 100], [15, 150], [20, 200]]) # (时间, 请求数)
labels = np.array([0, 1, 1]) # (0: 正常, 1: 高峰期)model = RandomForestRegressor()
model.fit(traffic_data, labels)# 预测未来流量是否为高峰期
def predict_traffic(time, requests):return model.predict([[time, requests]])
缓存优化
Redis 缓存热点数据
import redis
r = redis.Redis(host='localhost', port=6379, db=0)# 缓存查询结果
def get_product(product_id):cache_key = f'product:{product_id}'if (cached := r.get(cache_key)):return cached # 直接返回缓存结果else:data = query_db(product_id) # 查询数据库r.setex(cache_key, 3600, data) # 缓存 1 小时return data
CDN 缓存静态资源
location /images/ {root /var/www/html;expires 30d;add_header Cache-Control "public, max-age=2592000";
}
消息队列优化请求处理
RabbitMQ 任务队列
import pika
connection = pika.BlockingConnection(pika.ConnectionParameters('localhost'))
channel = connection.channel()
channel.queue_declare(queue='task_queue', durable=True)# 生产者
channel.basic_publish(exchange='', routing_key='task_queue', body='任务数据')
AI 调度队列优化
利用 AI 预测请求优先级,智能调度队列。
def ai_task_priority(task):return model.predict([[task.cpu_usage, task.response_time]])
QA 环节
Q1: 传统限流与 AI 限流的区别?
传统限流基于固定规则,AI 限流可预测流量变化,动态调整。
Q2: 消息队列如何优化高并发请求?
将高并发请求转为异步任务,削峰填谷,减少数据库压力。
总结
- 限流(Redis + AI):有效控制流量,避免服务崩溃。
- 缓存(Redis、CDN):减少数据库查询压力,提升响应速度。
- 消息队列(RabbitMQ、Kafka):异步处理,优化资源利用。
- AI 预测(流量分析 + 调度):动态调整服务器资源,降低成本。
相关文章:
「AI 加持的高效架构」高并发场景下的服务器成本优化
网罗开发 (小红书、快手、视频号同名) 大家好,我是 展菲,目前在上市企业从事人工智能项目研发管理工作,平时热衷于分享各种编程领域的软硬技能知识以及前沿技术,包括iOS、前端、Harmony OS、Java、Python等…...
html css 笔记
01_浏览器相关知识 五大主流浏览器: Chrome Safari IE Firefox Opera (拥有自己的内核) 四大内核: webkit Trident Gecko blink. 02_网页相关知识 构成 网址 网站 网页 网页标准: 结构 表现 行为 分别对应 HTML CSS JavaScript 03_HTML简介 H…...
通义万相 2.1:AIGC 领域的 “王炸” 组合如何颠覆创作生态?
引言 在数字化和人工智能的飞速发展中,AIGC(AI生成内容)技术已经成为推动创作、设计和内容生成领域创新的核心力量。而当通义万相2.1与蓝耘智算平台强强联手,这一“王炸”组合不仅提升了AIGC的效率,还为创作生态带来了…...
Math.NET Numerics 库怎么装
你提到的缺少的库是 Math.NET Numerics。 关于 Math.NET Numerics Math.NET Numerics 是一个用于 .NET 平台的开源数学库,提供了以下功能: 线性代数(矩阵运算、求解线性方程组等)。数值计算(积分、微分、优化等&…...
NPM安装与配置全流程详解(2025最新版)
写目录 一、环境准备与Node.js安装1. 下载Node.js(含NPM)2. 验证安装 二、NPM核心配置优化1. 全局模块与缓存路径设置2. 镜像加速3. 代理配置(企业网络适用) 三、NPM基础操作指南1. 项目初始化2. 包管理命令3. 依赖锁定与版本管理…...
python-52-基于Langchain和Faiss实现向量存储和检索的技术原理
文章目录 1 文本加载与预处理1.1 计算文本的MD5哈希值1.2 加载文本并计算哈希2 初始化向量存储2.1 基于Ollama的嵌入模型2.2 获取code和id的对应关系2.3 清空索引向量2.4 基于HuggingFaceEmbeddings的嵌入模型2.4.1 将模型下载到本地2.4.2 使用方式3 添加新文本3.1 处理新文本并…...
游戏引擎学习第140天
回顾并为今天的内容做准备 目前代码的进展到了声音混音的部分。昨天我详细解释了声音的处理方式,声音在技术上是一个非常特别的存在,但在游戏中进行声音混音的需求其实相对简单明了,所以今天的任务应该不会太具挑战性。 今天我们会编写一个…...
Jetpack Navigation 实战:Fragment 和 Activity 的交互与导航
在 Android 开发中,使用 Jetpack Navigation 组件可以方便地管理 Fragment 和 Activity 之间的导航。以下是如何使用 Jetpack Navigation 实现 Fragment 之间、Activity 之间以及 Activity 与 Fragment 之间跳转的实战示例。 1. 添加依赖 首先,在 build.…...
Linux中的基本指令(上)
目录 ls指令 判断linux中文件 pwd指令 认识路径 编辑 绝对路径/相对路径 cd指令 简要理解用户 理解家目录 echo指令和printf指令 touch指令 mkdir指令 cat指令 tree指令 rmdir指令和rm指令 man指令 cp指令 which指令 alias 指令 date指令 cal指令 理解…...
多用户网页在线聊天室(测试报告)
文章目录 多用户网页在线聊天室一,项目概括1.1 项目名称1.2 测试时间1.3 项目背景1.3 编写目的 二,测试计划2.1 测试环境与配置2.2 测试用例2.3实际执行用例2.3.1登录2.3.2聊天消息列表展示2.3.3聊天消息详情页展示2.3.4联系人页展示2.3.5信息的编辑与发…...
字节青训营后端方向的个人总结(2025年3月4日)
字节青训营的结营总结(25寒假) ——致青训营队友的一封信 明天就是大项目结项的日子了,不知道大家在这方面学习、精进了多少,也许有的朋友收获颇多并且已经完成了项目,我个人对此表示由衷的恭喜和祝贺。 当初自告奋…...
VX iOS分析随记
断SVC的时候看调用栈,发现里面一个特别大的ollvm函数。vx版本8054 * thread #36, queue com.apple.root.default-qos, stop reason breakpoint 4.1 frame #0: 0x0000000111ad6124 WeChat___lldb_unnamed_symbol1315083 20 WeChat___lldb_unnamed_symbol13150…...
docker 小记
一、卸载 查看当前版本 docker -v2. 如果有,先停止docker systemctl stop docker如果是yum安装,卸载方式为 #已防版本冲突,直接卸载 yum remove docker \docker-client \docker-client-latest \docker-common \docker-latest \docker-lat…...
AI代码编程辅助工具
现在AI火的一塌糊涂,作为技术应该更应该关注当前AI对编程行业的影响。 分享下当前网络上最火的网络编程辅助工具。 以下是个人搜集到的可以对编程起辅助作用的工具: 2025年最佳AI编程辅助工具 1. GitHub Copilot 这个工具也许你已经在使用了࿰…...
使用 kubectl cp 命令可以在 Kubernetes Pod 和本地主机之间拷贝文件或文件夹
使用 kubectl cp 命令可以在 Kubernetes Pod 和本地主机之间拷贝文件或文件夹 kubectl cp <namespace>/<pod-name>:<pod-path> <local-path> # 从 Pod 拷贝到本地 kubectl cp <local-path> <namespace>/<pod-name>:<pod-path&g…...
【eNSP实战】交换机配置端口隔离
交换机端口隔离可以实现在同一个VLAN内对端口进行逻辑隔离,端口隔离分为L2层隔离和L3层隔离,这里只进行L2层隔离演示。 拓扑图 路由器AR1配置GE 0/0/1配置IP,其余PC主机各自配置IP和网关。 现将PC1到PC4四个主机全部进行L2层隔离,…...
动态规划-第2篇
前言:在上一篇文章中,我们了解了动态规划的基本概念和解决问题的基本思路。通过分解问题、存储子问题的解,动态规划为我们提供了高效的解决方案。然而,动态规划并不是一成不变的,它有很多不同的技巧和变种,…...
数据库查问题常用OS命令汇总
1、内存使用情况查看 top //查看活跃进程占用情况 free -mh //查看操作系统当前可用内存 2、cpu使用情况 lscpu //查看os cpu情况 sar -u -f sar文件名 -s hh:mm:ss -e hh:mm:ss //查看对应日期的历史cpu情况 top //查看当前活跃进程使用cpu情况 3、io情况 iostat …...
基于springboot住院管理系统(源码+lw+部署文档+讲解),源码可白嫖!
摘要 随着世界经济信息化、全球化的到来和电子商务的飞速发展,推动了很多行业的改革。若想达到安全,快捷的目的,就需要拥有信息化的组织和管理模式,建立一套合理、畅通、高效的线上管理系统。当前的住院管理存在管理效率低下&…...
《用Python+PyGame开发双人生存游戏!源码解析+完整开发思路分享》
导语 "你是否想过用Python开发一款可玩性高的双人合作游戏?本文将分享如何从零开始实现一款类《吸血鬼幸存者》的生存射击游戏!包含完整源码解析、角色系统设计、敌人AI逻辑等核心技术点,文末提供完整代码包下载!" 哈…...
【ES6】在ES6中自定义数组
在ES6中是允许自定义类扩展基础类型的,因为这些基础类型是有构造函数的,在JS中类就是函数。 // 自定义数组 class myArray extends Array {constructor() {super();} }let arr new myArray();arr.push(1);console.log(arr);重写Array的原生方法 ES6的…...
软件开发项目有哪些风险
软件开发项目风险主要包括 需求不明确、技术实现难度大、进度延误、成本超支、质量问题。其中,需求不明确可能导致功能设计反复修改;技术实现难度大会使开发过程中不断遇到未知挑战;进度延误常常因资源配置不足或变更频繁而发生;成…...
47.HarmonyOS NEXT 登录模块开发教程(二):一键登录页面实现
温馨提示:本篇博客的详细代码已发布到 git : https://gitcode.com/nutpi/HarmonyosNext 可以下载运行哦! HarmonyOS NEXT 登录模块开发教程(二):一键登录页面实现 文章目录 HarmonyOS NEXT 登录模块开发教程࿰…...
RAGFlow版本升级-Win10系统Docker
下载源码压缩包 https://github.com/infiniflow/ragflow.git 删除旧版本代码文件夹,把下载的代码解压到原先目录 更新一下env文件:ragflow/docker/.env 把值改为最新版本即可 RAGFLOW_IMAGEinfiniflow/ragflow:v0.17.1 更新一下docker docker compose -…...
dns劫持是什么?常见的劫持类型有哪些?如何预防?
DNS劫持的定义 DNS劫持(Domain Name System Hijacking)是一种网络攻击手段,攻击者通过篡改域名解析的过程,将用户对某个域名的访问请求重定向到错误或恶意的IP地址。这种攻击可能导致用户访问到钓鱼网站、恶意广告页面࿰…...
Python精进系列: isinstance 函数
Python isinstance函数:类型检查的得力助手 目录 Python isinstance函数:类型检查的得力助手引言一、isinstance函数基础语法结构简单示例 二、isinstance函数的应用场景函数参数类型检查数据处理与类型转换面向对象编程中的类型判断 三、isinstance函数…...
【基础知识】回头看Maven基础
版本日期修订人描述V1.02025/3/7nick huang创建文档 背景 项目过程中,对于Maven的pom.xml文件,很多时候,我通过各种参考、仿写,最终做出想要的效果。 但实际心里有些迷糊,不清楚具体哪个基础的配置所实现的效果。 今…...
练习题:81
目录 Python题目 题目 题目分析 需求理解 关键知识点 实现思路分析 代码实现 代码解释 运行思路 结束语 Python题目 题目 使用字典推导式创建一个字典,键为 1 到 10 的整数,值为键的平方。 题目分析 需求理解 本题要求使用 Python 的字典…...
三角函数:从宇宙法则到AI革命的数学密钥
——跨越三千年的数学语言与现代科技全景透视 一、数学本质:宇宙的波动密码 1.1 拓扑学视角下的三角函数 三角函数本质是单位圆上点的坐标参数化,其数学表达可抽象为: { x cos θ ℜ ( e i θ ) y sin θ ℑ ( e i θ ) \begin…...
【论文笔记】Best Practices and Lessons Learned on Synthetic Data for Language Models
论文信息 论文标题:Best Practices and Lessons Learned on Synthetic Data for Language Models 作者信息: Ruibo Liu, Jerry Wei, Fangyu Liu, Chenglei Si, Yanzhe Zhang, Jinmeng Rao, Steven Zheng, Daiyi Peng, Diyi Yang, Denny Zhou1 and Andre…...
Java高频面试之集合-10
hello啊,各位观众姥爷们!!!本baby今天来报道了!哈哈哈哈哈嗝🐶 面试官:详解红黑树?HashMap为什么不用二叉树/平衡树呢? 一、红黑树(Red-Black Treeÿ…...
Keil 5 环境下STM32F4 HAL库版本MDK工程创建详细步骤(适合小白,附工程源码)
一、前期准备 1.安装好keil Keil(MDK) 5 软件安装教程-CSDN博客https://blog.csdn.net/qq_42748213/article/details/90485750 2.安装好STM32F4的芯片包 Keil5中STM32F4xx芯片包下载安装_stm32f4芯片包-CSDN博客https://blog.csdn.net/weixin_45783141/article/details/131…...
【微服务】Nacos 配置动态刷新(简易版)(附配置)
文章目录 1、实现方法2、配置依赖 yaml3、验证效果 1、实现方法 环境:Nacos、Java、SpringBoot等 主要是在boostrap.yaml中的data-id属性下配置refresh:true来实现动态更新 2、配置依赖 yaml 具体的版本参考官方的说明:官方版本说明 <!--读取boo…...
LabVIEW cRIO中CSV文件的读取
在LabVIEW cRIO中读取CSV文件,需通过文件传输、路径配置、数据解析等步骤实现。本文详细说明如何通过代码读取本地存储的CSV文件,并探讨直接通过对话框选择文件的可行性及替代方案。 一、CSV文件传输至cRIO本地存储 1. 使用NI MAX文件管理 步骤…...
双周报Vol.67: 模式匹配支持守卫、LLVM 后端发布、支持 Attribute 语法...多项核心技术更新!
2025-03-10 语言更新 模式匹配支持守卫(Pattern Guard) 模式守卫可以通过在模式后追加 if ... 的语法结构来指定。有模式守卫的分支只有在被模式匹配的值满足对应模式,并且模式守卫为真的情况下才会执行。如果模式守卫为假,则会…...
从青铜到王者:六大排序算法实战解析
前言 在编程的世界里,排序算法如同一颗璀璨的明珠,闪耀着智慧的光芒。它不仅是计算机科学的基础知识点,更是每一位程序员必备的技能。今天,就让我们一同走进排序算法的世界,深入探究冒泡排序、选择排序、插入排序、快速排序、归并排序、堆排序这六大经典算法的精髓所在,…...
011-base64
base64 编码 以下是C实现的Base64字符串加密算法及其原理说明,综合了多个技术文档的核心要点: 一、Base64编码原理 Base64是一种将二进制数据转换为ASCII字符的编码方式,核心原理基于 3字节转4字符 的转换规则: 分组规则&…...
汽车NVH诊断案例 | 纯电车急加速过大弯底盘异响
引言 失去发动机的掩蔽效应后,新能源电车的NVH问题,成为了困扰维修技师新难点。风噪、胎噪、电机高频啸叫等问题更容易车主识别,根源却难以被有效分辨。如何更精准且高效地识别电车NVH问题根源?今天分享的这个案例,内…...
springcloud gateway通过数据库获取路由信息
在 Spring Cloud Gateway 中结合 MyBatis 动态从数据库加载路由配置,可以实现灵活的路由管理。以下是详细实现步骤: 1. 数据库表设计 创建路由配置表 gateway_route: CREATE TABLE gateway_route (id varchar(50) NOT NULL COMMENT 路由唯一…...
QtDataVisualization使用
Qt Data Visualization 是一个开源的第三方库,它为Qt框架提供了高级的数据可视化功能。这个库允许开发者创建复杂的3D和2D图表,包括但不限于散点图、曲面图、条形图等。它基于Qt 3D模块,因此可以充分利用Qt 3D引擎的强大功能来呈现三维数据。…...
【Go每日一练】实现简单的控制台计算器
👻创作者:丶重明 👻创作时间:2025年3月7日 👻擅长领域:运维 目录 1.😶🌫️题目:简单的控制台计算器2.😶🌫️代码输出3.😶&#…...
TDengine 数据对接 EXCEL
简介 通过配置使用 ODBC 连接器,Excel 可以快速访问 TDengine 的数据。用户可以将标签数据、原始时序数据或按时间聚合后的时序数据从 TDengine 导入到 Excel,用以制作报表整个过程不需要任何代码编写过程。 前置条件 准备以下环境: TDen…...
1.8 双指针专题:四数之和
1.题目链接 18. 四数之和 - 力扣(LeetCode)18. 四数之和 - 给你一个由 n 个整数组成的数组 nums ,和一个目标值 target 。请你找出并返回满足下述全部条件且不重复的四元组 [nums[a], nums[b], nums[c], nums[d]] (若两个四元组元…...
基于用户标签和协同过滤混合算法的商城推荐系统设计与实现
一、研究背景 随着电子商务的快速发展,用户面对海量商品时往往面临“信息过载”问题。传统的推荐算法(如协同过滤)在用户行为数据稀疏或新用户场景下存在冷启动、推荐多样性不足等缺陷。 现状与挑战: 协同过滤:依赖用…...
软件版本号设计
软件版本号的设计是软件开发中的重要环节,它不仅帮助开发团队管理代码,还能让用户清楚地了解软件的更新状态。以下是常见的版本号设计方法和最佳实践,供你参考: 1. 常见的版本号设计规范 语义化版本控制(Semantic Ver…...
ESMFold对决AlphaFold:蛋白质-肽相互作用预测的新进展
今天向大家介绍的这篇文章题目为:“Protein−Peptide Docking with ESMFold Language Model”,近期发表在JCTC上。 本文主要研究 ESMFold 语言模型在蛋白质-肽对接中的应用。通过探索多种对接策略,评估其在预测蛋白质-肽相互作用方面的性能&a…...
【项目】负载均衡式在线OJ
负载均衡式在线OJ 目录 负载均衡式在线OJ 1.项目介绍: 2.comm 2.1 log.hpp 日志等级 开放式日志 时间戳工具 2.2 util.hpp TimeUtil类 PathUtil类 FileUtil类 StringUtil类 3.Compile_server 3.1compile_run.hpp RemoveTempFile CodeToDesc Start 3.…...
Android启动速度优化
Android启动速度优化 一、应用启动基础知识 1.1 启动类型 Android应用的启动类型主要分为三种: 冷启动(Cold Start):应用进程不存在,系统需要创建新的进程,加载并启动应用。这是最耗时的启动方式。 温启动(Warm Start):应用进程存在,但Activity可能被销毁,需要重新创…...
python爬虫碰到IP被封的情况,如何解决?
在数据抓取和爬虫开发的实践中,Python作为一种功能强大且易于上手的编程语言,被广泛应用于网络数据的采集。然而,随着网络环境的日益复杂,爬虫活动也面临着越来越多的挑战,其中IP被封便是常见且棘手的问题。IP被封不仅…...
Web网页制作(静态网页):千年之恋
一、是用的PyCharm来写的代码 二、代码中所用到的知识点(无 js) 这段HTML代码展示了一个简单的注册页面,包含了多个HTML元素和CSS样式的应用。 这段HTML代码展示了一个典型的注册页面,包含了常见的HTML元素和表单控件。通过CSS样…...