ElasticSearch性能优化
ES基础概念介绍:
- 索引:类似于MySQL中的表,它是具有相同特征的一个数据集。
- 文档:格式为JSON格式,类似于MySQL中的一条数据,它是数据存储的基本数据单元,每一条文档都有一个唯一的ID。
- 查询:用户向ES发起的ResultFul格式的请求,以JSON格式编写。
性能优化的原因:
- 提高查询的效率,降低用户的响应时间。
- 降低对资源的消耗(CPU、IO、内存、网络)
- 支持大量的并发。
性能优化正文
硬件角度
从底层出发,优先考虑硬件对性能的影响。
电脑的硬件一般就是:CPU、内存、硬盘、网卡。
在木桶效应的影响下,我们需要确保这些硬件方面不会出现短板。
CPU
要考虑性能,肯定要考虑并发、并行。并发和并行对CPU的核数有要求。CPU要选取8核以上的,以便提高并发和并行度。
内存
ES对内存的操作主要体现在:
- 将热点数据的索引片段和查询结果缓存到内存。
- 在写数据的时候也会先将数据存放在内存的buffer缓冲区。
- 在内存中对查询的语句进行解析和预处理。
- 在内存中进行文档相关性分析和得分的计算。
上述是ES对内存的使用情况,可以得知对查询的响应速度影响很大。而且ES是基于Java编写的,所以这些对内存的操作大多是以在JVM中的堆区域中实现的。
众所周知JVM的堆是垃圾回收的主要对象,而当堆内存超过32G的时候,垃圾回收的开销会明显上升,影响系统新能,所以堆内存一般小于32G为最佳。
JVM又需要与操作系统做交互,对于硬盘中数据的读取一般需要操作系统来操作内存对硬盘数据进行缓存,以提高读写性能,通常情况下一般剩下内存的50%给操作系统来进性数据缓存操作。
硬盘
所有数据不可能都缓存到内存中,大部分数据还是要存在于硬盘中的。这个时候硬盘的读写速度也很关键。一般选取固态硬盘,并且预留25%左右的存储空间用于合并和其它操作。
网卡
网络就不必多说了,更低的延迟和更高的带宽,不论是在集群之间交互还是在给用户的反馈方面都更优。
集群
在ES的集群搭建中有两个重要的点:
- 分片:单个分片的大小一般不超过50G,在20-30G最佳
- 副本数:副本是用于保证数据安全以及读性能的,节点少的时候一个副本即可,节点大于50的时候副本数一般大于2
定义优化
分词器(analyzer)
- 标准分词器(ES默认):按照unicode文本分割算法,将文本按照单词边界分割,同时去除标点符号。
- 基础分词器:根据非字母字符拆分词项,并将词项转换成小写,但是不会进行符号的过滤。
- 空格分词器:根据空格分词。
- 字符串类型分词器:根据字符串类型进行分组,比如根据字母、数字、标点划分为不同的词项。
- 正则表达式分词器
- 汉语分词器(IK分词器、智能中文smartcn分词器)
- 英语分词器
- 关键字分词器:不进行分词处理
- 路径分词器:按照路径中的’/'分割符,将路径分解为不同的层次部分。
字段类型(type)
- 字符串类型(keyword、text)
- 地理空间索引(geo_point、geo_shape):处理地理位置相关的索引。
- 数值类型(integer、long、float、double):对数值类型进行范围查询,聚合计算等。
- 布尔类型(boolean)
- 二进制类型(binary)
- 日期类型(date)
- 复杂类型(object、nested):object是以json格式定义的对象、nested与object类似,但它用于存储嵌套对象。
- IP地址类型(ip)
- 范围类型(integer_range、float_range、date_range、long_range)
- 合并数据类型(join):实现父子关系数据建模,通常表示父子文档和子文档的关系。
- 文本多字段:在同一字段定义多个类型,以支持更多的匹配方式。
- 标识符类型(completion):用于实现高效的建议功能,通常用于自动补全和提示框。
查询优化
通配符查询
原因:ES支持使用通配符(*
或?
)进行查询,通配符出现在开头会走全表扫描。
解决方案:避免在开头使用通配符,非要用的话建议使用前缀查询或更高效的分词器(ngram 或 edge ngram),
深度分页
原因:避免深度分页,因为深度分页的时候会从相关节点上取到from+size数量的数据,在协调节点中进行合并排序,最后再返回size条数据。当分页量巨大的时候不但会导致查询缓慢,更严重会内存溢出。
解决方案:可以**使用 Scroll API 或 Search After **来替代传统的 “from + size” 分页方式。Scroll API 通过在初始查询时返回一个 scroll_id,后续查询使用该 scroll_id 来获取下一页数据,它适用于需要一次性获取大量数据的场景,但不适合实时交互场景,因为它会占用一定的资源。例如,在进行数据导出时,可以使用 Scroll API 分批次获取大量数据。Search After 则是基于游标的分页方式,它使用上一页最后一条记录的排序字段值作为游标,来获取下一页的数据,这种方式更适合实时交互场景,性能也更好。例如,在一个新闻列表页面,用户不断点击 “下一页” 查看更多新闻时,使用 Search After 可以快速响应用户请求,提高用户体验。
过滤器
原因:通常情况下的查询还需要计算相关得分,之后根据得分进行排序,此举是为了优化用户体验。但对于一些简单情况下的字段,就没必要计算得分,只需要筛选条件是否满足就行了。
解决方案:使用过滤器进行筛选,过滤器筛选只判断是否满足条件,不会进行得分计算。并且过滤器筛选出的数据会被缓存,下次如果还是同样的过滤条件,结果就能被直接返回了。
精确匹配
使用精确匹配能够快速定位到数据,避免对字段进行不必要的扫描匹配,例如根据id或者订单号进行查询。
缓存与索引生命周期
缓存的好处毋庸置疑,能够降低查找速度,提高吞吐量。
ES提供了多种缓存机制,包括节点查询缓存和分片请求缓存。
节点查询缓存
节点查询缓存主要用于缓存过滤器查询的结果,当缓存满的时候会淘汰使用频率最低的数据。
可以使用indices.queries.cache.size来调整节点查询缓存的大小,默认值为10%。
分片请求缓存
分片请求缓存的作用是缓存整个请求的结果,当缓存满的时候会淘汰使用频率最低的数据。index.requests.cache.size参数控制其占用内存大小,默认值为 1%。
索引生命周期管理
索引生命周期管理(Index Lifecycle Management,ILM)是根据数据的冷热程度对索引进行管理的过程,它能有效提升系统性能并降低存储成本。在实际应用中,数据的访问频率和重要性会随着时间的推移而发生变化。例如,在日志分析场景中,最近几天的日志数据通常会被频繁查询和分析,属于热数据;而几个月前的日志数据访问频率较低,属于冷数据。
通过 ILM,可以将热数据存储在高性能的存储介质上,并保持较高的索引性能;将冷数据迁移到成本较低的存储介质上,如大容量的机械硬盘。ILM 还可以根据设定的策略对索引进行诸如关闭、删除等操作,以释放系统资源。例如,可以设置一个策略,当索引中的数据超过 30 天未被访问时,将其从热节点迁移到冷节点,并将索引状态设置为只读;当数据超过 90 天时,直接删除该索引。这样可以确保系统始终保持高效运行,同时合理利用存储资源 。
监控与调优
监控
- ES自带监控工具:ES内置监控工具
- _cluster/stats API 可以获取集群级别的统计信息,包括文档数量、存储大小、索引操作次数等。通过这些信息,可以了解集群整体的负载情况和数据规模。
- _nodes/stats API 则用于获取节点级别的统计信息,如 CPU 使用率、内存使用量、磁盘 I/O 等。这对于定位单个节点的性能问题非常有帮助。比如,当发现某个节点的 CPU 使用率持续过高时,可以通过该 API 进一步查看是哪些操作导致了 CPU 资源的大量消耗。
- _indices/stats API 能获取索引级别的统计信息,如索引的分片数量、文档数量、搜索耗时等。通过分析这些指标,可以对索引的性能进行评估和优化。例如,通过查看索引的搜索耗时指标,可以发现哪些索引的查询性能较差,进而针对性地进行优化。
- 第三方监控工具:除了 Elasticsearch 自带的监控工具外,还有许多第三方监控工具可以与 Elasticsearch 集成,实现更全面、更直观的监控。Prometheus 和 Grafana 是两款非常流行的开源监控工具,它们可以与 Elasticsearch 无缝集成,提供强大的数据收集、分析和可视化功能。Prometheus 通过elasticsearch - exporter从 Elasticsearch 中获取监控指标,如查询响应时间、吞吐量、缓存命中率等。这些指标被收集后,存储在 Prometheus 的时间序列数据库中。Grafana 则使用 Prometheus 上的指标数据进行绘图展示,用户可以创建各种监控图表和告警规则。例如,可以创建一个查询响应时间的折线图,实时监控查询性能的变化;还可以设置阈值告警,当查询响应时间超过某个阈值时,通过邮件、短信等方式发送告警通知。Zabbix 也是一款常用的监控工具,它可以对 Elasticsearch 集群进行全面的监控,包括集群状态、节点性能、索引健康等。Zabbix 通过自定义脚本或插件与 Elasticsearch 进行交互,获取监控数据,并提供丰富的告警功能,确保在集群出现问题时能够及时通知管理员。
性能指标
ES(Elasticsearch)常见的性能指标如下:
索引相关指标
- 索引速度:指每秒能索引的文档数量,反映了ES摄入数据的能力,若索引速度慢可能影响数据实时性。
- 索引大小:即索引占用的磁盘空间,可评估存储需求和规划硬件资源,索引过大可能导致查询性能下降。
- 文档数:索引中存储的文档数量,有助于了解数据规模和评估对性能的影响。
查询相关指标
- 查询响应时间:指从客户端发送查询请求到收到响应的时间,是衡量查询性能的关键指标,直接影响用户体验。
- 查询吞吐量:即每秒能处理的查询数量,体现系统处理查询的能力,高吞吐量意味着能应对大量并发查询。
- 缓存命中率:查询结果在缓存中命中的比例,高命中率可减少磁盘I/O,提高查询性能。
集群健康指标
- 集群状态:分为绿色、黄色、红色。绿色表示所有分片都正常;黄色表示主分片正常,但部分副本分片未分配;红色表示有主分片不可用,会影响数据完整性和查询性能。
- 节点数:集群中的节点数量,合理的节点数可保证性能和高可用,过多或过少都可能有问题。
- 分片数:索引被拆分成的分片数量,影响数据分布和查询并行度,分片过多会增加管理开销,过少则影响性能。
资源指标
- CPU使用率:节点CPU的使用情况,过高可能导致进程阻塞,影响ES性能。
- 内存使用率:ES进程占用的内存量,内存不足可能导致数据缓存不充分,增加磁盘I/O。
- 磁盘I/O:包括读写速度和I/O等待时间,磁盘I/O性能影响索引和查询速度,I/O瓶颈会导致性能下降。
- 网络带宽:节点间数据传输和客户端与集群通信使用的网络带宽,带宽不足会影响数据传输和集群性能。
持续调优
- 定期性能测试:定期对 Elasticsearch 集群进行性能测试是持续优化查询性能的重要手段。可以使用专门的性能测试工具,如 Rally,它是 Elastic 官方提供的基准测试工具,能够模拟各种真实场景下的查询请求,对集群的性能进行全面评估。通过定期运行性能测试,可以及时发现随着数据量增长、业务变化等因素导致的性能问题。例如,每隔一段时间对电商搜索集群进行一次性能测试,模拟不同的搜索关键词、查询条件和并发用户数,记录查询的响应时间、吞吐量等指标。如果发现性能指标下降,就需要深入分析原因,可能是数据量增加导致索引性能下降,或者是新的业务需求引入了复杂的查询逻辑。针对这些问题,可以采取相应的优化措施,如重新设计索引、优化查询语句等。
- 实时监控与告警:建立实时监控与告警机制,能够及时发现集群性能的异常变化,并采取相应的措施进行处理。通过使用第三方监控工具,如 Prometheus 和 Grafana,可以实时收集和展示 Elasticsearch 的各种性能指标,并设置合理的阈值告警。当指标超出阈值时,系统会自动发送告警通知,如邮件、短信或即时通讯工具提醒。例如,设置查询响应时间的阈值为 500 毫秒,当某个查询的平均响应时间超过这个阈值时,立即触发告警,通知管理员进行排查和优化。这样可以在性能问题影响业务之前及时发现并解决,保障系统的稳定运行。
- 根据业务变化调整策略:随着业务的发展和变化,数据量、查询模式和用户需求都会发生改变,因此需要根据实际情况及时调整 Elasticsearch 的优化策略。例如,当业务规模扩大,数据量急剧增加时,可能需要增加集群节点数量,调整分片和副本配置,以提高系统的存储和处理能力;如果业务中引入了新的查询需求,如复杂的聚合查询或地理位置查询,就需要对索引进行相应的优化,选择合适的索引类型和字段映射,以满足新的查询要求。定期评估业务需求的变化,对 Elasticsearch 的配置和查询策略进行调整,能够确保系统始终保持良好的性能表现,满足业务的发展需求。
未更完[待续]…
相关文章:
ElasticSearch性能优化
ES基础概念介绍: 索引:类似于MySQL中的表,它是具有相同特征的一个数据集。文档:格式为JSON格式,类似于MySQL中的一条数据,它是数据存储的基本数据单元,每一条文档都有一个唯一的ID。查询&#x…...
pom.xml中的runtime
在 Maven 的 pom.xml 文件中,<scope> 元素可以指定依赖项的作用范围,而 runtime 是其中的一个作用范围值。以下是 runtime 作用范围的含义: 定义:runtime 作用范围表示该依赖项在编译时不需要,但在运行时需要。…...
第一章走进java世界
第一章 走进 java 世界 1.1 java 语言的特点(小面经) 使用简单、高效 去掉了 C 和 C++中的指针和多重继承技术通过垃圾自动回收机制简化了程序内存管理对于数据类型在不同字长的计算机上实现统一字节数占用完全面向对象 抽象、封装、继承、多态自动内存管理(Auto Garbage C…...
tigase源码学习笔记-事件总线EventBus
前言 最近看到了一些tigase关于异步事件解耦的地方的设计,做一个笔记记录一下。什么是事件总线,我自己对于事件总线的理解是,事件总线是一个对事件(Event)进行集中处理的基于发布订阅模式的一种处理机制。个人拙见&am…...
GO语言学习(六)
GO语言学习(六) 各位支持我的友友们我们现在不知不觉的已经进入第六期了,在上一期我们学习了一些简单的HTTP相关知识,还带大家基本的了解了web的深层原理及实现过程,相信大家应该都有自己的收获了,现在我就带领大家学习一下本期的…...
25.5.20学习总结
做题思路 数列分段 Section IIhttps://www.luogu.com.cn/problem/P1182正如题目所说,我们需要得到一个最小的最大段的值,可能有人将注意力放在分段上,事实上,我们更多的应该关注结果。这是一道二分答案的题,你可以先确…...
山东大学软件学院项目实训-基于大模型的模拟面试系统-Vditor编辑器上传图片
Vditor编辑器图片上传功能 使用Vditor进行图片上传时,会返回图片在后端的相对路径,这在前端是无法进行显示的(如下图) 于是为了将图片正常显示,我采取了和头像上传一样的解决方案,使用阿里云图床进行存储…...
在 Kotlin 中,什么是内联函数?有什么作用?
在 Kotlin 中,内联函数是一种通过 inline 关键字声明的函数,其主要目的是优化高阶函数(即以函数作为参数或返回值的函数)的性能。 内联函数的函数体会在编译时直接插入到调用处,从而避免函数调用的开销,并…...
leetcode hot100:四、解题思路大全:滑动窗口(无重复字符的最长子串、找到字符串中所有字母异位词)、子串(和为k的子数组、)
滑动窗口 无重复字符的最长子串 给定一个字符串 s ,请你找出其中不含有重复字符的 最长 子串 的长度。 思路 滑动窗口哈希表。 从左到右遍历字符串,以当前字符的下标为右边界,并不断试图往左扩宽左边界。滑动窗口内维护的就是当前字符下标…...
JAVA EE(进阶)_HTML
思如云烟,行若磐石。 ——陳長生. ❀主页:陳長生.-CSDN博客❀ 📕上一篇:JAVA EE(进阶)_进阶的开端-CSDN博客 1.HTML HTML(HyperText Mark…...
【[特殊字符] Vue 3 实现动态加载子组件并缓存状态完整指南】
文章目录 🧩 Vue 3 实现动态加载子组件并缓存状态完整指南💡 需求背景🎯 最终实现效果效果图 🛠️ 技术栈🧱 文件结构示例🔧 实现流程详解1. 定义组件映射关系2. 子组件定义并暴露方法3. 父组件逻辑处理✅ …...
从零开始的抽奖系统创作(2)
我们接着进行抽奖系统的完善。 前面我们完成了 1.结构初始化(统一结果返回之类的,还有包的分类) 2.加密(基于Hutool进行的对称与非对称加密) 3.用户注册 接下来我们先完善一下结构(统一异常处理&#…...
【计算机方向海外优质会议推荐】第二届图像处理、机器学习与模式识别国际学术会议(IPMLP 2025)
重要信息 大会官网:www.ipmlp.net 会议主页【点击参会/投稿/了解会议详情】:第二届图像处理、机器学习与模式识别国际学术会议(IPMLP 2025)_艾思科蓝_学术一站式服务平台 截稿时间:详见官网 接受/拒稿通知:投稿后1…...
进程之IPC通信二
4.共享内存 共享内存是进程间通信一种方式,多个进程共享一段内存,“ 共享内存 ”。由于多个进程共享了同一段内 存,这个段内存既是你的也是我的。也就是你往这个内存里面写入数据,实际上就相当于往我的内存里 面写入数据。比起其…...
打造高效数据处理利器:用Python实现Excel文件智能合并工具
有时候,我们需要将多个Excel文件按照特定顺序合并成一个文件,这样可以更方便地进行后续的数据处理和分析。今天,我想分享一个使用Python开发的小工具,它可以帮助我们轻松实现Excel文件的智能合并。C:\pythoncode\new\xlsx_merger.…...
使用注解动态映射:根据实体List列表动态生成Excel文件
我们一般通过POI来生成对应的Excel文件,绝大多数情况是需要手动编写单元格内容,然后顺序填充值,今天我们将动态根据实体来生成Excel表头,同时自动填充内容。 文章目录 1. 定义注解2. 实体类应用注解3. 动态导出工具类 1. 定义注解…...
【ISP算法精粹】什么是global tone mapping和local tone mapping?
1. 简介 全局色调映射(Global Tone Mapping)和局部色调映射(Local Tone Mapping)是高动态范围(HDR)图像处理中的两种关键技术,用于将高动态范围图像的亮度值映射到标准动态范围(LDR…...
uniapp生成的app,关于跟其他设备通信的支持和限制
以下内容通过AI生成,这里做一下记录。 蓝牙 移动应用(App)通过蓝牙与其他设备通信,是通过分层协作实现的。 一、通信架构分层 应用层(App) 调用操作系统提供的蓝牙API(如Android的BluetoothA…...
C++ Pimpl(Pointer to Implementation)设计思想
一、C Pimpl(Pointer to Implementation)设计思想 1. 核心思想 Pimpl(Pointer to Implementation)是一种通过将类的实现细节隐藏在一个私有指针背后的设计模式,旨在实现接口与实现的解耦。其核心思想是: …...
便捷的Office批量转PDF工具
软件介绍 本文介绍的软件是一款能实现Office批量转换的工具,名为五五Excel word批量转PDF。 软件小巧 这款五五Excel word批量转PDF软件大小不到2M。 操作步骤一 使用该软件时,只需把软件和需要转换的Word或Excel文件放在同一个文件夹里。 操作步骤…...
2025年渗透测试面试题总结-华顺信安[实习]安全服务工程师(题目+回答)
网络安全领域各种资源,学习文档,以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具,欢迎关注。 目录 华顺信安[实习]安全服务工程师 1. 自我介绍 2. 红蓝队经验 3. Shiro漏洞知识体系 4. APP渗透测试方法…...
Mermaid 使用快速入门
使用AI 生成Mermaid 代码,导入Vscode, 安装Mermaid Preview 插件 --- title: config:theme: forest --- graph TDA[开始] --> B{条件判断}B -->|是| C[执行操作1]B -->|否| D[执行操作2] theme可改变主题,可选主题: default - 这是…...
Windows系统下MySQL 8.4.5压缩包安装详细教程
一、MySQL 8.4.5新特性概览 相较于旧版本,MySQL 8.4.5在性能与功能上实现了显著提升: 性能优化:官方测试显示,在高并发场景下,其读写性能较5.7版本提升近2倍,尤其在处理热点数据竞争问题时表现更为出色。…...
机器学习10-随机森林
随机森林学习笔记 一、随机森林简介 随机森林(Random Forest)是一种集成学习算法,基于决策树构建模型。它通过组合多个决策树的结果来提高模型的准确性和稳定性。随机森林的核心思想是利用“集成”的方式,将多个弱学习器组合成一…...
【缺陷】GaN和AlN中的掺杂特性
1997 年 5 月 9 日,北卡罗来纳州立大学的 P. Bogusławski 和 J. Bernholc 等人在《Physical Review B》期刊发表了题为《Doping properties of C, Si, and Ge impurities in GaN and AlN》的文章,基于量子分子动力学方法,研究了碳(C)、硅(Si)和锗(Ge)杂质在氮化镓(G…...
游戏引擎学习第298天:改进排序键 - 第1部分
关于向玩家展示多个房间层所需的两种 Z 值 我们在前一天基本完成了为渲染系统引入分层 Z 值的工作,但还没有完全完成所有细节。我们开始引入图形渲染中的分层概念,即在 Z 轴方向上拥有多个独立图层,每个图层内部再使用一个单独的 Z 值来实现…...
AI大模型从0到1记录学习 大模型技术之数学基础 day26
高等数学 导数 导数的概念 导数(derivative)是微积分中的一个概念。函数在某一点的导数是指这个函数在这一点附近的变化率(即函数在这一点的切线斜率)。导数的本质是通过极限的概念对函数进行局部的线性逼近。 当函数f的自变量在…...
计算机视觉与深度学习 | matlab实现ARIMA-WOA-CNN-LSTM时间序列预测(完整源码和数据)
以下是一个基于MATLAB的ARIMA-WOA-CNN-LSTM时间序列预测框架。由于完整代码较长,此处提供核心模块和实现思路,完整源码和数据可通过文末方式获取。 1. 数据准备(示例数据) 使用MATLAB内置的航空乘客数据集: % 加载数据 data = readtable(airline-passengers.csv); data …...
【C++】vector模拟实现
实现以下功能: 构造函数:a.无参默认构造 b.n个val构造 c.迭代器区间构造 d.initializer_list构造,类似于数组 e.拷贝构造 赋值重载 [ ]重载 实现reserve接口 实现size(),capacity()接口 实现push_bakc接口&#…...
门店管理五大痛点解析:如何用数字化系统实现高效运营
实体店竞争白热化,五大管理痛点正悄悄吞噬利润:客户资源流失、数据决策滞后、员工效率模糊、合同风险暗藏、利润核算混乱。本文直击核心问题,拆解数字化系统如何精准破局。 一、传统管理模式的五大核心痛点 1. 客户资源管理粗放化 老…...
双指针法高效解决「移除元素」问题
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 双指针法高效解决「移除元素」问题 双指针法高效解决「移除元素」问题一、问题描述二、解法解析:双指针法1. 核心思想2. 算法步骤3. 执行过程示例 三、关键点分析…...
【Linux笔记】——线程同步信号量与环形队列生产者消费者模型的实现(PV操作)
🔥个人主页🔥:孤寂大仙V 🌈收录专栏🌈:Linux 🌹往期回顾🌹:【Linux笔记】——线程同步条件变量与生产者消费者模型的实现 🔖流水不争,争的是滔滔不…...
武汉科技大学人工智能与演化计算实验室许志伟课题组参加第八届智能优化与调度学术会议
武汉科技大学人工智能与演化计算实验室许志伟课题组参加第八届智能优化与调度学术会议 2025年5月15日至18日,第八届智能优化与调度学术会议在青岛金沙滩希尔顿酒店隆重召开。本次会议由青岛科技大学、湖南省系统仿真学会联合主办,中国仿真学会智能仿真优…...
SparkContext介绍
目录 1. 集群管理接口2. RDD操作中枢3. 任务分发引擎4. 执行环境配置5. 性能监控枢纽 SparkContext是Apache Spark的核心组件,其作用可概括为以下五个关键维度: 1. 集群管理接口 作为与集群管理器(YARN/Mesos/Standalone)通信的唯…...
海外盲盒系统开发:重构全球消费体验的科技引擎
当盲盒文化席卷全球,海外盲盒系统开发已成为重构消费体验的核心赛道。数据显示,2025年全球盲盒市场规模突破120亿,东南亚市场年增长率达4540。我们开发的海外盲盒系统,以技术创新为驱动,打造覆盖全链路的全球化解决方案…...
IP风险画像技术:如何用20+维度数据构建网络安全护城河?
IP风险画像技术作为一种先进的网络安全手段,正逐步成为构建网络安全护城河的重要工具。通过多维度数据的分析和挖掘,IP风险画像技术能够精准识别网络中的潜在威胁,为企业和组织提供更加全面的安全保障。 IP风险画像技术基于IP地址的行为分析…...
Vitest下一代前端单元测试框架
什么是Vitest? Vitest是有vue官方主导开发的下一代测试框架,一个原生支持Vite的测试框架。非常快速。 Vitest 与 Jest 兼容,具有开箱即用的 ESM、Typescript 和 JSX 支持,并且由 esbuild 提供支持。它在测试过程中使用 Vite 开发…...
车道线检测:自动驾驶的“眼睛”
在自动驾驶技术的庞大体系中,车道线检测扮演着至关重要的角色,它就像是自动驾驶汽车的“眼睛”,帮助车辆感知道路边界,从而实现安全、准确的行驶。今天,我们就来深入探讨一下车道线检测的奥秘,看看它是如何…...
基于NLP技术的客户投诉与需求文本分类方法研究
目录 摘要 1. 引言 2. 文本分类基础 2.1 文本分类的定义与类型 2.2 文本分类的评价指标 3. 传统文本分类方法 3.1 基于TF-IDF和SVM的方法 3.2 基于主题模型和词向量的改进方法 4. 深度学习文本分类方法 4.1 TextCNN模型 4.2 BiLSTM模型 4.3 注意力机制与Transformer…...
HarmonyOS5云服务技术分享--自有账号对接AGC认证
✨ 手把手教你:用自有账号玩转华为AGC认证服务 ✨ Hi 各位开发者朋友~👋 今天咱们来聊聊如何将自家已有的账号系统与华为的AppGallery Connect(AGC)认证服务无缝对接。不用重复造轮子,还能享受AGC…...
算法与数据结构:位运算与快速幂
文章目录 位运算快速幂 位运算 在计算机的世界中,一切数字都是二进制的。类比于现实世界中我们所使用的十进制,二进制即为「逢二进一」的运算体系。 我们以 B、D 来分别标记二进制与十进制,例如 10D 表示十进制中的 10,而 10B 则…...
基于R语言的空间异质性数据分析技术
在自然和社会科学领域,存在大量与地理或空间相关的数据,这些数据通常具有显著的空间异质性。传统的统计学方法在处理这类数据时往往力不从心。基于R语言的一系列空间异质性数据分析方法,如地理加权回归(GWR)、地理加权…...
数据分析预备篇---Pandas的DataFrame的更多操作
DataFrame的统计方法 之前学习Series的时候接触了一些很实用的统计相关方法,包括max求最大值,min求最小值,sum求和,mean求平均值等。DataFrame有类似的方法,由于它是二维的,我们可以指定到底是沿着索引纵向操作,相当于沿着轴0(计算每列的统计量);还是说沿着列名横向操…...
精益数据分析(73/126):黏性阶段的功能优先级法则——七问决策模型与风险控制
精益数据分析(73/126):黏性阶段的功能优先级法则——七问决策模型与风险控制 在创业的黏性阶段,如何从海量的功能创意中筛选出真正能提升用户留存的关键改动?今天,我们结合《精益数据分析》中的“开发功能…...
Linux系统之traceroute命令详解:追踪网络路径的核心工具
Linux系统之traceroute命令详解:追踪网络路径的核心工具 一、traceroute介绍1. 基本介绍2. 核心原理 二、安装与基本使用1. 安装traceroute2. 基础语法 三、基本使用四、常用参数与场景五、典型应用场景1. 定位网络延迟问题2. 检测防火墙拦截3. 绕过DNS解析问题4. 对…...
通义灵码2.5智能体模式联合MCP:打造自动化菜品推荐平台,实现从需求到部署的全流程创新
一、项目背景与目标 随着人工智能技术的快速发展,AI 辅助开发工具正在改变传统的软件开发模式。通义灵码 2.5 版本的发布,通过 Qwen3 模型 和 编程智能体模式 的结合,实现了从需求描述到代码生成的全流程自动化。同时,其对 魔搭M…...
Spring的AOP在什么场景下会失效?
SpringAOP是通过动态代理实现的,所以想要AOP生效就是需要动态代理生效,并且可以提前调用到代理对象的方法。 什么情况下会不走动态代理呢? 首先就是类内部的调用,比如一些私有方法的调用,内部类调用,以及同…...
基于规则引擎与机器学习的智能Web应用防火墙设计与实现
基于规则引擎与机器学习的智能Web应用防火墙设计与实现 引言:智能防御的必然选择 在2023年OWASP最新报告中,传统Web应用防火墙(WAF)对新型API攻击的漏报率高达67%,而误报导致的正常业务拦截损失每年超过2.3亿美元。面…...
NODE-I916 I721模块化电脑发布,AI算力与超低功耗的完美平衡
在智能工业与边缘计算蓬勃发展的今天,企业对计算设备的性能与能效需求日益严苛。全新推出NODE-I916与NODE-I721模块化电脑,分别搭载英特尔 酷睿™ Ultra 平台与Alder Lake-N平台,以差异化CPU配置为核心,为AI推理、工业自动化及嵌入…...