一场由 ES 分片 routing 引发的问题
一场由 ES 分片 routing 引发的问题
ES 结构
{"poroperties": {"joinType": {"type": "join","eager_global_ordinals": true,"relations": {"spu": "sku"}},"id":{"type": "keyword"},"spuGuid": {"type": "keyword"},"skuGuid": {"type": "keyword"},"sellCount": {"type": "long"}}
}
我们使用 ES 存储商品数据,我们使用父子文档,字段为 joinType,其值为 sku 时则为子文档,id 为 skuGuid,其值为 spu 时则为父文档,id 为 spuGuid。使用父子文档是为了通过 sku 参数查询条件去查询 spu。
ES 在多分片多的情况下,必须将父子文档放在同一分片中,所以我们以 spuGuid 作为routing id。
问题描述
一段更新销量的代码执行完以后,查询发现销量未变化。
问题排查
查看 ES 数据
用 GET goods_index/_doc/7277857079027761152 直接查询该id的文档
用 POST goods_index/_search 条件为 skuGuid = 7277857079027761152
用 POST goods_index/_search 条件为 id = 7277857079027761152
这时候我还在怀疑是不是因为我们代码最近把主键都改为 long 数值类型,在序列化时变成了字符串类型,是否 es 对这个敏感。所以我又进行了一次查询,这次使用 id 字段,因为每个文档都会内置一个 id,然后就发现问题了。
这里居然出现了两个文档!,而且他们一个有 routing,一个没有 routing,我恍然大悟。我们的 ES 设置了分片数为 3,也就是每个文档都会根据 id 得到不同的 routing 值,从而存入不同的分片中。由于我们为了确保父子文档能正确查询,按照官方文档要求的将 spuGuid 设为 routing,但是在更新销量的代码中并没有指定 routing,没有指定的话,就会默认使用 id 作为 routing 依据,那就不知道会存入哪个分片了,运气好就是对的,运气差就是错的。这就解释了为什么一些商品的销量是正确的,一些是错误的问题。而且用 GET _doc 的方式查询时,它会默认用 id routing 一次再查询,所以查不到真正的文档,而查询到的那个只有一个销量的文档是代码中 upsert 插入的,upsert 是先如果没有找到对应文档就会插入文档,所以就只有一个字段。而在用 _search skuGuid = 7277857079027761152 查询时查不到是因为本来就没 skuGuid 这个字段。最后用 _search id = 7277857079027761152 查询到了,是因为用了文档本来的 id 查到了。
解决办法
ES更新的时候因为有分片存在,UpdateRequest 不设置 routing 时默认用 id 路由,如果用了父子文档(父子文档现在用的 spuGuid 作为routing id),就会路由错误,更新失败。
所以更新的时候如果用UpdateRequest,就必须指定routing;否则就用UpdateByQueryRequest,无需指定routing。
相关文章:
一场由 ES 分片 routing 引发的问题
一场由 ES 分片 routing 引发的问题 ES 结构 {"poroperties": {"joinType": {"type": "join","eager_global_ordinals": true,"relations": {"spu": "sku"}},"id":{"type&q…...
搭建Python量化开发环境:从零开始的完整指南
搭建Python量化开发环境:从零开始的完整指南 在量化投资领域,一个稳定且高效的开发环境是成功的关键。本文将引导你一步步搭建起自己的Python量化开发环境,确保你能够顺利开始编写和运行量化策略。 🚀量化软件开通 Ὠ…...
JavaScript日期区间计算:精准解析年月日差异
一、应用场景与功能概述 在日常的制作项目或者是练习,我们经常需要计算两个日期之间的精确时间差。本文将通过一个JavaScript日期计算函数,详细解析如何实现精准的年/月/日差异计算,并探讨实际开发中的常见问题和解决方案。 二、核心功能解…...
大数据学习(71)-三范式构成
🍋🍋大数据学习🍋🍋 🔥系列专栏: 👑哲学语录: 用力所能及,改变世界。 💖如果觉得博主的文章还不错的话,请点赞👍收藏⭐️留言📝支持一…...
el-table 插槽踩过的坑 :slot-scope 和#default的区别
slot-scope和#default是Vue中用于定义插槽的两种不同语法,它们在Vue 2和Vue 3中有不同的应用场景和语法规则。 slot-scope 在Vue 2.x中,slot-scope是用于声明具名插槽并获取父组件传递过来的数据的主要方式。通过slot-scope可以定义一个变量scop…...
Linux一键安装node.js【脚本】
node.js一般不用系统的apt安装,而是用nvm这个前端的应用商店安装 node.js是js环境,nvm是安装nodejs管理器。npm是nodejs里的包管理器,安装模块的,类似于python的pip 把以下代码复制保存在一个文件里 比如nano install_nodejs.sh …...
vue3:pinia安装及其使用
一、安装 Pinia 的步骤 1、安装 Pinia npm install pinia 2、在 Vue 应用中引入 Pinia 在 main.js 中引入并注册 Pinia: import { createApp } from vue; import { createPinia } from pinia; import App from ./App.vue;const app createApp(App); app…...
vue2升级Vue3--native、对inheritAttrs作用做以解释、声明的prop属性和未声明prop的属性
native取消 在 Vue 3 中,v-on 的 .native 修饰符已经被移除。在 Vue 2 中,.native 修饰符用于在组件的根元素上监听原生 DOM 事件,但在 Vue 3 中,这一行为发生了变化。 在 Vue 3 中,所有未在子组件的 emits 选项中定…...
【漫话机器学习系列】146.Softmax 激活函数(Softmax Activation Function)
Softmax 激活函数详解 1. Softmax 函数概述 Softmax 函数(Softmax Activation Function)是一种常用于多分类任务的激活函数,广泛应用于机器学习和深度学习模型,特别是在神经网络的输出层。它的主要作用是将输入的多个实数值转换…...
解决:ModuleNotFoundError: No module named ‘_sqlite3‘
报错: from _sqlite3 import * ModuleNotFoundError: No module named _sqlite3安装sqlite3支持组件: sudo apt-get install libsqlite3-dev进入之前下载的python包下,重新编译和安装Python ./configure --enable-loadable-sqlite-extensions make &a…...
C++差分风暴:区间修改终极模板
目录 🔥 差分核心价值 🌟 一维差分模板 1. 核心思想 2. 代码实现 3. 动态图示 📦 二维差分模板 1. 核心公式 2. 代码实现 3. 二维修改示意图 🚨 六大避坑指南 💡 复杂度对比 🌈 LeetCode实战 &…...
easypoi导入Excel兼容日期和字符串格式的日期和时间
问题场景 在使用easypoi导入Excel时,涉及到的常用日期会有yyyy-MM-dd HH:mm:ss、yyyy-MM-dd和HH:mm:ss,但是Excel上面的格式可不止这些,用户总会输入一些其他格式,如 如果在定义verify时用下面这种格式定义,那么总会…...
《保险科技》
自己在保险行业工作很多年,只是接触了一些数据的内容,对于保险业务的知识了解的很少,想通过这本书补充一下,但是发现这本书就是一些知识的拼接。 先将保险的历史,后讲保险的定义,然后就是吹嘘保险行业和互联…...
QT编程之HTTP服务端与客户端技术
一、HTTP 服务器实现方案 QtWebApp 集成 将QtWebApp源码的 httpserver 目录导入项目,并在 .pro 文件中添加 include ($$PWD/httpserver/httpserver.pri)。配置 WebApp.ini 文件定义服务参数(IP、端口、线程池等),通过 HttpL…...
每日一题--计算机网络
一、基础概念类问题 1. TCP 和 UDP 的区别是什么? 回答示例: TCP:面向连接、可靠传输(通过三次握手建立连接,丢包重传)、保证数据顺序(如文件传输、网页访问)。 UDP:无…...
IIS 服务器日志和性能监控
Internet Information Services (IIS) 是 Microsoft 提供的一款功能强大、灵活且可扩展的 Web 服务器,用于托管网站、服务和应用程序。IIS 支持 HTTP、HTTPS、FTP、SMTP 和更多用于提供网页的协议,因此广泛用于企业环境。 IIS 的…...
Unity学习之Shader总结(一)
一、Lesson1 1、渲染流水线 (1)应用阶段 模型->模型处理(应用阶段)–>输入结构 应用阶段主要操作:粗粒度剔除、进行渲染设置、准备基本数据、输出到几何阶段 (2)几何阶段 输入结构-&…...
java,poi,提取ppt文件中的文字内容
注意,不涉及图片处理。 先上pom依赖: <!-- 处理PPTX文件 --><dependency><groupId>org.apache.poi</groupId><artifactId>poi-ooxml</artifactId><version>5.2.3</version></dependency><!--…...
matlab R2024b下载教程及安装教程(附安装包)
文章目录 前言一、matlab R2024b 安装包下载二、matlab R2024b安装教程 前言 为帮助大家顺利安装该版本软件,特准备matlab R2024b下载教程及安装教程,它将以简洁明了的步骤,指导你轻松完成安装,开启 MATLAB R2024 的强大功能之旅…...
设计模式之外观模式:原理、实现与应用
引言 外观模式(Facade Pattern)是一种结构型设计模式,它通过提供一个统一的接口来简化复杂系统的使用。外观模式隐藏了系统的复杂性,使得客户端可以通过一个简单的接口与系统交互。本文将深入探讨外观模式的原理、实现方式以及实…...
移远QuecPython模组中的看门狗技术:如何提升设备可靠性
概述 对蜂窝通信模组而言,看门狗(Watchdog)是一种硬件或软件的监控机制,用于监测模组的运行状态。当模组因为外界干扰或程序错误陷入死循环时,看门狗会自动触发模组重启,从而恢复模组的运行状态。 对看门…...
汽车感性负载-智能高边钳位能量计算
随着汽车电子技术的发展,新的电子电气架构下,越来越多的执行部件在车身出现,比如电磁阀、风机、水泵、油泵、雨刮继电器等常用的执行器, 它们一般都表现为感性特点。驱动这些负载的最简单和最常见的方法是将它们连接到高边侧开关(…...
Kubernetes之ETCD
ETCD 是 Kubernetes 的核心组件之一,它是一个分布式键值对存储数据库,专为高可用性和一致性设计。它在 Kubernetes 中的主要作用是存储所有集群数据,包括配置数据和状态信息。ETCD 是 Kubernetes 的“大脑”,其稳定性对整个集群至…...
通过Geopandas进行地理空间数据可视化
目录 引言 安装与导入 数据加载与探索 数据预处理 基本地图可视化 添加其他数据到地图上 空间分析与查询 地图叠加与分组 空间缓冲区 交互式地图可视化 实际应用案例 城市规划 环境监测 结论 引言 在数据科学领域,地理空间数据可视化扮演着至关重要的角色。它不…...
堆(heap)
堆?对于初学者来说,或许是一个陌生十足的概念。 但!堆不可怕。 什么是堆? 学术上,常常是这样说的(一个完全二叉树)。 没毛病,要想更好的理解堆(heap),确实需要好好掌…...
Leetcode-回溯-组合型
22. 括号生成 - 力扣(LeetCode) 这题并没有才有恢复现场的做法 而是直接覆盖 题目核心是看穿本质 在代码执行过程中左括号必须大于等于右括号 以及回溯最底层的递归条件是递归长度已经达到2n 还有做括号要小于n 又因为i左右 因此右等于i-左 ope…...
Modbus通信协议基础知识总结
1. 数据类型与存储区分类 Modbus协议将数据分为四类存储区,通过存储区代号区分: 输出线圈(0x):可读写,对应二进制开关量(如继电器状态),地址范围000001-065536ÿ…...
python pip 最最开始新手教程/pip安装jupyter
pip 安装 直接安排了python即安装了pip,一般找pip的是安装了python之后用不了的,出现问题的,我也是因为这个所以写了这篇文章。 一、找不到pip,在C盘的cmd 输入pip -- version显示没有的是因为pip不能直接使用,需要额外配置环境变量 在系统…...
MATLAB 控制系统设计与仿真 - 28
MATLAB状态空间控制系统分析 - 极点配置 就受控系统的控制律的设计而言,由状态反馈极点配置和输出反馈极点配置。 状态反馈极点配置问题就是:通过状态反馈矩阵K的选取,使闭环系统的极点,即(A-BK)的特征值恰好处于所希望的一组给定闭环极点的位置。 另外,线性定常系统可…...
[leetcode] 面试经典 150 题——篇3:滑动窗口
[leetcode] 面试经典 150 题——篇3:滑动窗口 方法概述基本原理适用场景示例说明 1. [中等] 长度最小的子数组(leetcode 209题)题目描述解题思路python代码 2. [中等] 无重复字符的最长子串(leetcode 5题)题目描述解题思路python代码 方法概述 滑动窗口是一种常用的…...
华为云虚拟化技术
华为云底层的虚拟化技术是一种将物理资源(如服务器、存储设备和网络)抽象成虚拟资源的技术。通过这种技术,用户可以将物理资源划分为多个虚拟资源,从而提高资源利用率和灵活性1。 华为云底层虚拟化的定义和作用 华为云底层…...
在Pycharm配置conda虚拟环境的Python解释器
〇、前言 今天在配置python解释器时遇到了这样的问题 经过一下午自行摸索、上网搜寻后,终于找到的解决的方案,遂将该方法简要的记录下来,以备后用,并希望能帮助到有同样问题或需求的朋友:) 我所使用的软件的版本如下,假…...
【AI】在AWS AI芯片服务上部署运行Qwen 2.5模型
推荐超级课程: 本地离线DeepSeek AI方案部署实战教程【完全版】Docker快速入门到精通Kubernetes入门到大师通关课AWS云服务快速入门实战目录 准备选项 1:在 Amazon EC2 Inf2 上部署 TGI选项 2:在 SageMaker 上部署 TGI清理Qwen 2.5 多语言大型语言模型(LLMs) 是一系列预先…...
如何用日事清做研发目标、需求、规划、迭代、Bug、效能、复盘、绩效一站式管理
近年来,受监管环境趋严、盈利模式转型、市场竞争加剧等影响,互联网行业逐步进入深度变革与持续创新阶段。在此过程中,项目进度延期、需求频繁变更、开发流程混乱等痛点问题频发,导致部分互联网企业创新升级的步伐停滞不前。 企业…...
手搓智能音箱——语音识别及调用大模型回应
一、代码概述 此 Python 代码实现了一个语音交互系统,主要功能为监听唤醒词,在唤醒后接收用户语音问题,利用百度语音识别将语音转换为文本,再调用 DeepSeek API 获取智能回复,最后使用文本转语音功能将回复朗读出来。 …...
Docker安装mysql——Linux系统
拉取mysql镜像 docker pull mysql 查看镜像 docker images 运行镜像(这一步的作用:数据持久化,通过挂载卷将日志、数据和配置文件存储在主机上,避免容器删除导致数据丢失) docker run -p 3306:3306 --name mysql …...
Redis 面试思路
分布式redis面试思路俩点 高性能 高并发 高性能 1.存储在内存 所以速度快 2. 线程模型 io多路复用 监控多个客户端socket 放入队列里面 只是文件分发机制是单线程的 处理队列中的数据 根据不同类型 分发给不同处理器 后面处理的过程 也是多线程的 3. 内存回收机制 定期懒惰 …...
Oracle GoldenGate 全面解析
Oracle GoldenGate 全面解析 Oracle GoldenGate 是一种实时数据集成和复制解决方案,广泛应用于数据同步、数据库迁移、高可用性和灾难恢复等场景。以下将详细解答您提出的关于 Oracle GoldenGate 的一系列问题。 1. Oracle GoldenGate 的架构组成及其核心组件的作用 架构组成…...
【QT:控件】
目录 控件状态:编辑 geometry : window frame windowlcon: qrc机制 qrc的使用方式: window opacity cursor font: ToolTip focusPolicy: styleSheet: 按钮类控件: PushButton: 给按钮添加图标: 给按钮添加快捷键…...
掌握xtquant:实时行情订阅与数据处理的实战指南
掌握xtquant:实时行情订阅与数据处理的实战指南 🚀量化软件开通 🚀量化实战教程 在量化交易领域,实时行情的获取和处理是构建有效交易策略的关键。本文将深入探讨如何使用xtquant库进行实时行情的订阅与数据处理,帮…...
解决 Nginx 访问 /root/下 403 Forbidden 问题
文章目录 解决 Nginx 访问 /root/test/1.html 403 Forbidden 问题问题复现Nginx 配置 可能的原因/root 目录权限问题SELinux 限制 解决方案方案 1:移动文件到 /data/或 /var/www/(推荐方案)方案 2:修改 /root 目录权限(不推荐)方案…...
免费实用工具,wps/office/永中通吃!
很多小伙伴在使用办公套件的过程中,往往会选择安装一些插件来提高工作效率。在众多的插件中,Excel和Word的插件非常常见,能够帮助用户进行数据分析、文档处理、格式美化等操作。然而,支持PPT(PowerPoint)的…...
Bash环境定制git分支提示符暨JDK版本切换脚本
一、在Bash提示符中显示Git分支 实现方法 编辑Bash配置文件 打开 ~/.bashrc 文件,添加以下代码: # 显示当前 Git 分支 parse_git_branch() {git branch 2>/dev/null | sed -e /^[^*]/d -e s/* \(.*\)/(\1)/ } export PS1\[\033[01;35m\]$PPX\[\033[0…...
使用fasterwhisper加速
背景 最近申请到一张8卡的gpu 机器用来验证音频转文本,发现whisper的处理速度很慢,于是有了下面的几种验证方法 配置信息 8张A30 第一次尝试 使用whisper对一个95M 的mp4文件进行解码 import time import whisperdef transcribe_audio(audio_path…...
IntelliJ IDEA 调试技巧指南
在日常开发中,调试是不可或缺的一部分。掌握调试工具的使用可以让我们更高效地定位和解决问题。本文将介绍一些在 IntelliJ IDEA 中常用的调试技巧,希望能帮助你在开发过程中更顺畅地解决问题。 1. 方法断点:快速定位实现类 方法断点可以帮…...
蓝桥杯Python赛道备赛——Day5:算术(一)(数学问题)
笔者计划用两期博客对蓝桥杯中所涉及的算术(数学问题)进行解释,本期博客包括:GCD(最大公约数)、LCM(最小公倍数)、质数判断、埃氏筛法、线性筛法(欧拉筛)和质…...
Android的消息机制
Android的消息机制-从入门到精通 前言Android消息机制概述Android 的消息机制分析ThreadLocal 的工作原理消息队列的工作原理Looper的工作原理Handler的工作原理 主线程的消息循环 前言 作为开发者,提及Android的消息机制,必然绕不开Handler,…...
Three.js 阴影 (Shadow) 知识点整理
阴影主要由 castShadow 和 receiveShadow 控制,并通过不同类型的光源 (DirectionalLight、SpotLight、PointLight) 生成。我们将系统地整理与阴影相关的知识点。 1️⃣ 基础概念 castShadow 🎭:物体是否投射阴影。receiveShadow Ἵ…...
从C语言开始的C++编程生活(1)
前言 本系列文章承接C语言的学习,需要有C语言的基础才能学会哦。 第1篇主要讲的是有关于C的命名空间、输入和输出。 C才起步,都很简单呢! 目录 前言 命名空间namespace 基本语法 作用 使用命名空间 域作用限定符 :: 基本语法 using n…...
【数据库】如何用索引优化查询性能
引言 在数据库查询中,索引是提升性能的关键工具。合理使用索引可以显著减少数据扫描量,加快查询速度。然而,索引的使用也需要谨慎,错误的索引策略可能导致性能下降甚至系统崩溃。本文将深入探讨如何通过索引优化查询性能…...