当前位置: 首页 > news >正文

ElasticSearch安装

ElasticSearch


脑图知识图谱地址:ProcessOn Mindmap|思维导图

简介

ES是一个开源的分布式搜索和分析引擎,基于 Apache Lucene 构建,专为处理海量数据设计,支持实时搜索、分析和可视化。

排行第一的搜索引擎

官网地址:Elasticsearch:官方分布式搜索和分析引擎 | Elastic

应用场景

全文检索

日志分析

架构与生态

竞品分析

优势与特点

安装ES

这里我只写一下windows上如何安装ES其步骤简单。如果想要Linux安装的步骤就前往文章头部的脑图地址,在知识图谱里面有更加详细的安装过程与对应的说明

ES的目录结构

①下载ES的安装包

在文章首行的知识图谱脑图里面就有安装包的下载地址,点击下载在本地进行解压缩就可以了

②配置JDK环境变量

③修改ES的配置文件

④启动ES服务

最终的访问结果为

浏览器插件

简介:最经典的Elasticsearch浏览器插件,最初以Chrome插件形式存在,后逐渐演变为独立Web应用。提供基础的集群管理、索引查看和文档查询功能。

在文章首行知识图谱里面给了Head插件的下载地址,直接下载在本地解压缩就行了。

分词器插件

简介:在全文搜索和自然语言处理中,分词器(Tokenizer)将文本拆分成独立词汇或标记(Token)的关键组件。

IK分词器下载:Index of: analysis-ik/stable/

注意:分词器的版本一定要与ES的版本保持一致,否则就会出现服务启动就闪退的现象。下载好对应的插件之后就可以将压缩包解压缩之后放入Es的plugins目录下这样就算是配置好了插件应用

作用

  • 文本切分将连续文本拆分成有意义的词语或词元(Token)。

    • 英文示例:"Hello world"["Hello", "world"](按空格切分)。

    • 中文示例:"我爱自然语言处理"["我", "爱", "自然语言", "处理"]

  • 标准化处理:如去除标点、统一大小写、处理停用词(如“的”“是”)等。

  • 支持搜索优化:通过分词后的词汇建立倒排索引,提升搜索效率。

中文分词器

中文没有显式的词语分隔符(如空格),且存在大量歧义组合和多义词,因此需要专门的分词算法。如:

  • 歧义句子"结婚的和尚未结婚的" → 可能被错误切分为 "结婚/的/和/尚未/结婚/的"(正确应为 "结婚/的/和尚/未/结婚/的")。

  • 未登录词问题:新词、专业术语(如“元宇宙”“奥密克戎”)未被词典收录时可能无法正确切分。

中文分词插件

Elasticsearch默认不支持中文分词,需通过插件集成第三方分词器。

(1) IK Analyzer
  • 特点

    • 支持两种模式:ik_smart(粗粒度,适合搜索)、ik_max_word(细粒度,适合索引)。

    • 可扩展自定义词典(如专业术语、品牌名)

(2) HanLP
  • 特点

    • 支持多任务(分词、词性标注、命名实体识别)。

    • 提供预训练模型和词典。

(3)icu_anallyzerer
  • 特点:

    • icu_analyzer 是基于 ICU(International Components for Unicode) 库开发的多语言分词插件,专为国际化文本处理设计。它支持 Unicode 标准的文本分割规则,尤其适合处理包含多语言混合的复杂场景(如中日韩、阿拉伯语等)。

特性icu_analyzerik_analyzer
语言支持多语言专注中文
中文分词精度低(单字切分)高(支持复合词识别)
配置复杂度中等(需自定义规则)简单(内置词典,易扩展)
性能较慢(Unicode 规则计算开销)快(词典匹配)

场景示例

场景推荐分词器原因
通用搜索(电商、内容平台)IK Analyzer平衡速度与准确性,支持自定义词典
专业领域(法律、医学)HanLP / 自定义模型识别专业术语和新词
高实时性要求结巴分词(Jieba)轻量级,速度快

测试分词效果

总结

中文分词器是处理中文文本搜索和分析的核心工具,其准确性直接影响搜索效果。选择合适的分词器(如IK Analyzer、HanLP)并配合自定义词典,能显著提升搜索相关性和用户体验。

Kibana

Kibana 是 Elastic Stack(原 ELK Stack)中的核心数据可视化工具专为 Elasticsearch 设计,提供直观的交互式界面,帮助用户探索、分析和展示存储在 Elasticsearch 中的数据。

核心功能

  • 数据可视化:通过图表(柱状图、折线图、饼图等)、地图、仪表盘展示数据趋势。

  • 数据探索:使用 Discover 模块直接查询和过滤 Elasticsearch 中的原始数据。

  • 交互式分析:支持复杂聚合(Aggregation)、时间序列分析(TSVB)及机器学习结果可视化。

  • 运维与监控:集成 APM(应用性能监控)、日志分析(与 Logstash/Beats 配合)、警报(Alerting)功能。

  • 管理 Elastic Stack:配置索引生命周期(ILM)、安全管理(角色/权限)、监测集群健康状态

主要模块

模块功能
Discover原始数据搜索与过滤,支持 Lucene 语法和 KQL(Kibana Query Language)。
Visualize创建图表(如柱状图、热力图),支持从聚合数据生成可视化。
Dashboard组合多个可视化图表,构建交互式仪表盘,支持实时刷新和共享。
Canvas生成动态数据报告,结合文本、图片和实时数据(适合制作 PPT 或运营报表)。
Machine Learning异常检测、预测分析(如流量趋势预测),集成 Elasticsearch 机器学习功能。
Maps地理空间数据可视化(如用户分布热力图)。
Dev Tools提供 Elasticsearch REST API 调试控制台,支持直接发送查询请求。

安装使用

下载地址:Past Releases of Elastic Stack Software | Elastic

修改配置文件

可以跟据具体的需求修改上述配置文件的参数,比如说ES与Kibana不在同一个机器上运行时就需要相应的参数进行适当的修改

注意:在启动Kibana的程序时一定要先启动ES程序(一般可以在控制台或者双击bin目录下的.bat文件启动服务)

访问地址:http://localhost:5601

效果图如下图所示,在其开发者工具端还可以进行相关ES的数据操作

相关文章:

ElasticSearch安装

ElasticSearch 脑图知识图谱地址:ProcessOn Mindmap|思维导图 简介 ES是一个开源的分布式搜索和分析引擎,基于 Apache Lucene 构建,专为处理海量数据设计,支持实时搜索、分析和可视化。 排行第一的搜索引擎 官网地址&#xff1…...

c#中添加visionpro控件(联合编程)

vs添加vp控件 创建窗体应用 右键选择项 点击确定 加载CogAcqfifoTool工具拍照 设置参数保存.vpp 保存为QuickBuild或者job, ToolBlock 加载保存的acq工具 实例化相机工具类 //引入命名空间 using Cognex.VisionPro; //实例化一个相机工具类 CogAcqFifoTool cogAcqFifoTool n…...

MySQL主键与外键详解:数据关系的基石与守护者

引言 在数据库设计中,主键(Primary Key)和外键(Foreign Key)是构建数据关系模型的核心工具。它们不仅保障了数据的唯一性和完整性,还实现了跨表数据关联的逻辑闭环。本文将通过实例解析这两大关键概念&…...

Go语言打造:超高性能分布式唯一ID生成工具

一、简介 这是一个超高性能唯一ID生成工具,支持docker一键部署,提供API接入功能支持高性能生成Snowflake ID、Sonyflake ID、UUID v1、UUID v4、XID、KSUID以及自定义ID的服务可以用来生成订单编号、学号、高标准唯一标识、有序ID等等开源地址参考&#…...

列表计量单位显示

列表计量单位显示 E:\javaDev\tender-project-vben5\apps\web-antd\src\views\tender\material\data.ts import type { FormSchemaGetter } from #/adapter/form; import type { VxeGridProps } from #/adapter/vxe-table;import { getDictOptions } from #/utils/dict; impor…...

RAG系统的现实困境与突破:数据泥潭到知识自由

一、当前RAG系统的核心痛点 1. 数据处理的阿喀琉斯之踵 知识形态的暴力归一化:将PDF、视频、数据库等异构数据强行转化为统一文本,导致: 纸质文献中的数学公式OCR错误率高达37%(ICDAR2023数据)流程图/思维导图等非连续…...

项目执行中缺乏问题记录和总结,如何改进?

要有效改进项目执行中的问题记录与总结机制,应采取建立标准化问题记录流程、引入专业管理工具、定期开展问题复盘、设立知识库系统、强化团队总结意识等措施。其中,建立标准化问题记录流程是核心。没有统一流程,问题易被忽视、重复发生&#…...

docker中使用openresty

1.为什么要使用openresty 我这边是因为要使用1Panel,第一个最大的原因,就是图方便,比较可以一键安装。但以前一直都是直接安装nginx。所以需要一个过度。 2.如何查看openResty使用了nginx哪个版本 /usr/local/openresty/nginx/sbin/nginx …...

红杉资本2025 AI 峰会之Cybersecurity

红杉资本2025年AI峰会中,三位合伙人分享中与security相关的观点。 1、Pat Grady认为需要在AI 时代的价值累积将主要发生在应用层,在举例当前的空白领域时,展示了在security领域目前还没产生巨头; 2、Sonia 认为垂直领域agent将是创业者的重大机遇,通过强化学习、合成数据…...

高并发架构设计之限流

一、引言 再强大的系统,也怕流量短事件内集中爆发,就像银行怕挤兑一样,所以,高并发另一个必不可少的模块就是限流。限流是一种通过控制请求的速率或数量来保护系统免受过载的技术。流控的精髓是限制单位时间内的请求量&#xff0…...

PostgreSQL中通过查询数据插入到表的几种方法( SELECT INTO和INSERT INTO ... SELECT)

使用 SELECT INTO 创建新表 在PostgreSQL中,SELECT INTO语法有两种主要用途:创建新表和将查询结果存储到变量中(在PL/pgSQL函数或存储过程中)。以下是详细介绍: 1. 创建新表并复制数据(类似SQL标准) SELECT * INTO new_table FROM existing_table WHERE condition;说…...

大语言模型 16 - Manus 超强智能体 Prompt分析 原理分析 包含工具列表分析

写在前面 Manus 是由中国初创公司 Monica.im 于 2025 年 3 月推出的全球首款通用型 AI 智能体(AI Agent),旨在实现“知行合一”,即不仅具备强大的语言理解和推理能力,还能自主执行复杂任务,直接交付完整成…...

Windows逆向工程提升之IMAGE_FILE_HEADER

公开视频 -> 链接点击跳转公开课程博客首页 -> ​​​链接点击跳转博客主页 目录 IMAGE_FILE_HEADER 介绍 IMAGE_FILE_HEADER 结构 核心字段解析 Machine(目标平台架构) NumberOfSections(节数目) TimeDateStamp&…...

基于Matlab建立不同信道模型

在MATLAB中建立不同的信道模型是无线通信系统仿真的重要组成部分。信道模型用于模拟信号在传输过程中受到的各种影响,如衰减、多径效应、噪声等。以下是一些常见的信道模型及其在MATLAB中的实现方法: 1. 理想信道模型 理想信道假设信号在传输过程中不受…...

苍穹外卖05 Redis常用命令在Java中操作Redis_Spring Data Redis使用方式店铺营业状态设置

2-8 Redis常用命令 02 02-Redis入门 ctrlc :快捷结束进程 配置密码: 以后再启动客户端的时候就需要进行密码的配置了。使用-a 在图形化界面中创建链接: 启动成功了。 03 03-Redis常用数据类型 04 04-Redis常用命令_字符串操作命令 05 05-Redis常用命令…...

JS 应用安全案例泄漏云配置接口调试代码逻辑框架漏洞自检

在 Javascript 中也存在变量和函数,当存在可控变量及函数调用即可参数漏洞。 JS 开发应用和 PHP , JAVA 等区别在于即没源代码,也可通过浏览器查看源代码。 获取 URL ,获取 JS 敏感信息,获取代码传参等&…...

嵌入式八股,空闲任务

空闲任务是FreeRTOS内核创建的一个默认任务,其优先级是系统中最低的。它在系统初始化时自动创建,并且始终处于就绪状态。当系统中没有任何其他任务可以运行时,调度器会选择空闲任务运行。 一句话总结,为了让系统不重启&#xff0…...

wd软件安装

* wd软件安装 * 磁盘读取数据的基本原理 * 分区软件使用 * 磁盘格式化/挂载的方式任务背景某天接到短信报警提示,显示某主机的根分区空间使用率超过85%,该主机用于影评(MySQL)和报表数据库(Oracle)。经查看…...

Redis数据库-消息队列

一、消息队列介绍 二、基于List结构模拟消息队列 总结: 三、基于PubSub实现消息队列 (1)PubSub介绍 PubSub是publish与subscribe两个单词的缩写,见明知意,PubSub就是发布与订阅的意思。 可以到Redis官网查看通配符的书写规则: …...

使用脚本备份和还原Windows环境变量

使用脚本备份和还原Windows环境变量 你是否遇到过这样的场景?为什么环境变量如此脆弱?全量备份及还原全量备份系统环境变量全量恢复系统环境变量PATH变量份及还原备份PATH变量精准还原PATH变量环境变量实时刷新器必看注意事项Windows环境变量误删别抓狂!用好 脚本 免重启「时…...

卫星互联网:构建全球无缝通信网络的未来

随着全球数字化进程的加速,人们对通信网络的需求越来越高。传统的地面通信网络虽然在城市和发达地区表现良好,但在偏远地区、海洋和空中等场景中仍存在覆盖不足的问题。卫星互联网作为一种新兴的通信技术,正在逐渐成为解决全球通信覆盖问题的…...

VS2022离线安装包

这是VS2022离线安装包下载链接 ▶ 夸克网盘 下载解压后,双击vs_setup.exe即可安装...

PDF 文档结构化工具对比:Marker 与 MinerU

模型训练数据-MinerU一款Pdf转Markdown软件 https://codeyuan.blog.csdn.net/article/details/144315141 在当前大模型(LLM)和自然语言处理(NLP)应用快速发展的背景下,如何高效地将 PDF 等非结构化文档转换为结构化数…...

【优秀三方库研读】在 quill 开源库 LogMarcos.h 中知识点汇总及讲解

以下是LogMarcos.h中的主要知识点汇总及详细讲解: 大纲目录 编译时日志级别过滤预处理宏与条件编译可变参数处理技巧格式化字符串生成日志宏的分发机制线程本地存储(TLS)零成本抽象设计动态日志级别支持结构化日志标签日志频率限制机制1. 编译时日志级别过滤 核心宏:QUILL…...

第14天-Matplotlib实现数据可视化

一、Matplotlib简介 Matplotlib是Python最基础的数据可视化库,提供类似MATLAB的绘图接口,支持2D/3D图形绘制。其核心特点: 丰富的图表类型(折线图/柱状图/饼图/散点图等) 高度可定制化(颜色/字体/刻度/标注) 矢量图输出(PDF/SVG)支持 与Jupyter无缝集成 二、环境准备…...

快速刷机Android10+Root

说明:仅供学习使用,请勿用于非法用途,若有侵权,请联系博主删除 作者:zhu6201976 一、下载android10源码 1.确认手机可刷机范围 比如我的Piexel3机型,支持刷android9-android12 Android源码。 https://de…...

文章相似度对比

from transformers import AutoTokenizer, AutoModel import torch import torch.nn.functional as F # 加载中文句向量模型(BGE) model_name "BAAI/bge-large-zh-v1.5" tokenizer AutoTokenizer.from_pretrained(model_name) model AutoM…...

认知计算:迈向人类级智能的 AI 新范式

一、认知计算:定义与核心技术架构 1.1 超越传统 AI 的 “类人智能” 新维度 认知计算的本质是构建具备感知、推理、学习和交互能力的智能系统,其核心特征包括: 多模态理解:处理文本、图像、语音等非结构化数据(如分…...

数据被泄露了怎么办?

数据泄露是严重的网络安全事件,需立即采取行动以降低风险。以下是关键应对步骤: 1. 确认泄露范围 核实泄露内容:确定泄露的是密码、财务信息、身份证号还是其他敏感数据。 评估来源:检查是个人设备被入侵、某平台漏洞&#xff0c…...

从 CANopen到 PROFINET:网关助力物流中心实现复杂的自动化升级

使用 CANopen PLC 扩展改造物流中心的传送带 倍讯科技profinet转CANopen网关BX-601-EIP将新的 PROFINET PLC 系统与旧的基于 CANopen 的传送带连接起来,简化了物流中心的自动化升级。 新建还是升级?这些问题通常出现在复杂的内部物流设施中,…...

关于收集 Android Telephony 网络信息的设计思考2

需求: 目标1: Android Telephony data(数据模块)侧收集多源(ServiceStateTracker/ImsService/其他)网络状态信息。目标2: 收集的数据需统一上报/存储到外部App的Provider。字段分散,不方便只在ServiceStateTracker中收集和插入。多触发点/多场景,需要统一插入。一、架构…...

android RecyclerView列表DiffCallback说明

一 代码 private class DiffCallback : DiffUtil.ItemCallback<xxxVolumeInfo>() {override fun areItemsTheSame(oldItem: xxxVolumeInfo,newItem: xxxVolumeInfo): Boolean {return oldItem.uuid newItem.uuid}override fun areContentsTheSame(oldItem: xxxVolumeIn…...

Day123 | 灵神 | 二叉树 | 找树左下角的值

Day123 | 灵神 | 二叉树 | 找树左下角的值 513.找树左下角的值 513. 找树左下角的值 - 力扣&#xff08;LeetCode&#xff09; 思路&#xff1a; 初学者可以看灵神视频二叉树的层序遍历【基础算法精讲 13】_哔哩哔哩_bilibili 我的思路就是在每层的循环前加个判断&#xf…...

流式优先架构:彻底改变实时数据处理

近年来&#xff0c;随着现代组织的数据环境日趋复杂且高速流动&#xff0c;传统数据库系统已难以满足实时分析、物联网应用以及即时决策的需求。围绕批处理和静态数据模型设计的 RDBMS&#xff08;关系型数据库管理系统&#xff09;在架构层面缺乏实时处理能力&#xff0c;而流…...

5月21日星期三今日早报简报微语报早读

5月21日星期三&#xff0c;农历四月廿四&#xff0c;早报#微语早读。 1、中国首次当选联合国教科文组织1970年《公约》缔约国大会主席国&#xff1b; 2、上海普陀&#xff1a;探索1岁以下托育服务的保育内容、人员配备等关键要素&#xff1b; 3、浙江&#xff1a;将智能家居…...

一文详解并查集:从基础原理到高级应用

一文详解并查集:从基础原理到高级应用 前言一、基本概念1.1 定义与作用1.2 直观理解 二、并查集的基本实现2.1 数据结构定义2.2 查找操作实现2.3 合并操作实现 三、经典优化策略3.1 路径压缩&#xff08;Path Compression&#xff09;3.2 按秩合并&#xff08;Union by Rank&am…...

二叉树的半线性

二叉树的半线性结构体现在以下方面&#xff1a; 非线性拓扑与线性次序的结合 二叉树的节点通过父子关系形成分叉结构&#xff08;非线性&#xff09;&#xff0c;但通过遍历规则&#xff08;如先序、中序、后序、层次遍历&#xff09;可将其映射为线性序列。例如&#xff1a;…...

深入浅出理解时间复杂度和空间复杂度

目录 一、基本概念 时间复杂度 空间复杂度 二、常见复杂度分类 时间复杂度常见情况 空间复杂度常见情况 三、如何分析复杂度 时间复杂度分析步骤 空间复杂度分析步骤 四、复杂度对比图表 时间复杂度增长趋势 常见算法复杂度汇总 五、实际应用中的注意事项 一、基本…...

【Java基础笔记vlog】Java中常见的几种数组排序算法汇总详解

Java中常见的几种排序算法&#xff1a; 冒泡排序&#xff08;Bubble Sort&#xff09;选择排序&#xff08;Selection Sort&#xff09;插入排序&#xff08;Insertion Sort&#xff09;希尔排序&#xff08;Shell Sort&#xff09;归并排序&#xff08;Merge Sort&#xff09…...

flink 提交流程

flink 提交流程 基础架构并行度算子链任务槽 基础架构 上图是普通的 standalone 架构&#xff0c;就是独立模式&#xff0c;会话模式部署&#xff0c;客户端在接受 job 时&#xff0c;会生成逻辑流图&#xff0c;这里只是按照业务生成对应的执行图&#xff0c;到了 JobManager …...

使用Pandoc实现Markdown和Word文档的双向转换

前言 Word文档是老牌的文档工具&#xff0c;Markdown是新兴的势力。Csdn发文章就是支持Markdown文件的导入&#xff0c;而并不支持Word文件的导入。相反的&#xff0c;今日头天发文章就是支持Word文件的导入&#xff0c;而不支持Markdown文件的导入。 所以&#xff0c;这两种…...

【Python零基础入门系列】第3篇:什么是 Python 的变量、数据类型和输入输出?

欢迎来到【Python 零基础入门系列】第3篇! 前两篇我们已经学会了如何安装 Python 使用编程工具 IDE,并写出了人生第一个程序 print("Hello, world!"),是不是有点成就感了?今天我们就继续深入一点点,来聊聊编程的“灵魂三问”: 什么是变量?什么是数据类型?如…...

破解充电安全难题:智能终端的多重防护体系构建

随着智能终端的普及&#xff0c;充电安全问题日益凸显。从电池过热到短路起火&#xff0c;充电过程中的安全隐患不仅威胁用户的生命财产安全&#xff0c;也制约了行业的发展。如何构建一套高效、可靠的多重防护体系&#xff0c;成为破解充电安全难题的关键。通过技术创新和系统…...

无人机桥梁巡检

无人机桥梁巡检 防护墙巡查 路面巡查 主梁巡查 桥墩路基巡查 支座巡查 周边环境检查...

Android Binder线程池饥饿与TransactionException:从零到企业级解决方案(含实战代码+调试技巧)

简介 在Android系统中,Binder作为进程间通信(IPC)的核心机制,承载着大量跨进程调用任务。然而,当Binder线程池资源耗尽时,可能导致严重的线程饥饿问题,最终引发TransactionException异常,甚至导致应用崩溃或系统卡顿。本文将从零开始,系统讲解Binder线程池的工作原理…...

138. Copy List with Random Pointer

目录 题目描述 方法一、使用哈希表 方法二、不使用哈希表 题目描述 问题的关键是&#xff0c;random指针指向的是原链表的结点&#xff0c;这个原链表的结点对应哪一个新链表的结点呢&#xff1f;有两种办法。一是用哈希表。另一种是复制原链表的每一个结点&#xff0c;并将…...

Java面试问题基础篇

面向对象 面向对象编程&#xff1a;拿东西过来做对应的事情 特征&#xff1a; 封装&#xff1a;对象代表什么&#xff0c;就要封装对应的数据&#xff0c;并提供数据对应的行为 继承&#xff1a;Java中提供一个关键字extends&#xff0c;用这个关键字可以让一个类和另一个类…...

ILRuntime中实现OSA

什么是ILRuntime? ILRuntime项⽬为基于C#的平台(例如Unity)提供了⼀个 纯 C# 实现 , 快速 、 ⽅便 且 可靠 的IL 运⾏时,使得能够在不⽀持JIT的硬件环境(如iOS)能够实现代码的热更新。具体可以学习: http://http s://ourpalm.github.io/ILRuntime/public/v1/guide/ind…...

总结一个编程的学习方式~

目录 学习开发 一切从简 代码风格 学习工具 总结 学习开发 一切从简 在学习写代码的时候&#xff0c;一定要快速的写起来&#xff0c;不要在开发工具上浪费太多的时间。比如说萌新学习C/C&#xff0c;上来直接使用Visual Studio 2019开始把代码写起来&#xff0c;不要追…...

ABC 353

目录 C. Sigma Problem D. Another Sigma Problem C. Sigma Problem 容斥。所有都先不取模&#xff0c;每个数出现 n - 1次&#xff0c;先算出不取模的答案。 接下来找出哪些对之和超出了 1e8&#xff0c;统计这样的对的个数&#xff0c;再拿之前的答案减掉 个数 * 1e8 只需要…...