当前位置: 首页 > news >正文

【SQL技术】不同数据库引擎 SQL 优化方案剖析

一、引言

在数据处理和分析的世界里,SQL 是不可或缺的工具。不同的数据库系统,如 MySQL、PostgreSQL(PG)、Doris 和 Hive,在架构和性能特点上存在差异,因此针对它们的 SQL 优化策略也各有不同。这些数据库中常见和不常见 SQL 语句的优化方法,涵盖排序、聚合函数、条件查询、分组等操作,同时还会涉及 Hive 和 Doris 中 UDF 函数的优化。

SQL解析器:

二、MySQL 优化策略

存储引擎介绍

  • InnoDB:支持事务、行级锁、外键约束,具有良好的并发性能和数据一致性,是MySQL 5.5及以后版本的默认存储引擎。
  • MyISAM:不支持事务和外键约束,具有较高的插入和查询速度,适用于以读为主的应用场景。
  • Memory:数据存储在内存中,访问速度极快,但数据在服务器重启时会丢失,适用于临时数据存储。
  • Archive:用于存储大量的历史数据,只支持插入和查询操作,不支持更新和删除。
  • CSV:以CSV格式存储数据,适用于数据交换和导入导出。
  • BlackHole:所有写入的数据都会被丢弃,适用于测试和数据过滤。

SQL执行流程:

(一)条件查询优化
  • 索引使用:确保在经常用于WHERE子句的列上创建索引。例如,如果经常根据user_id进行查询:

    CREATE INDEX idx_user_id ON users (user_id);

  • 避免函数索引:在WHERE子句中避免对索引列使用函数,因为这会导致索引失效。例如,以下查询会使索引失效:

    SELECT * FROM users WHERE YEAR(created_at) = 2024;

可以改为:

SELECT * FROM users WHERE created_at >= '2024-01-01' AND created_at < '2025-01-01';
(二)排序优化
  • 覆盖索引:如果排序的列和查询的列可以使用同一个索引,即覆盖索引,能显著提高排序性能。例如:

    CREATE INDEX idx_name_age ON users (name, age);
    SELECT name, age FROM users ORDER BY name, age;

  • 控制排序数据量:尽量在WHERE子句中过滤掉不必要的数据,减少排序的数据量。

(三)聚合函数优化
  • 分组索引:在GROUP BY列上创建索引,有助于提高分组聚合的性能。例如:

    CREATE INDEX idx_dept_salary ON employees (department_id, salary);
    SELECT department_id, AVG(salary) FROM employees GROUP BY department_id;

三、PostgreSQL 优化策略

存储引擎介绍

  • Heap存储引擎:是PostgreSQL的默认存储引擎,支持MVCC(多版本并发控制),适用于大多数应用场景。
  • B-Tree存储引擎:适用于需要高效的范围查询和排序的场景,如索引和排序操作。
  • Hash存储引擎:适用于需要快速查找的场景,如哈希表和索引。
  • GiST存储引擎:适用于处理几何数据和全文搜索的场景。
  • SP-GiST存储引擎:是GiST的一种变体,适用于处理空间数据的场景。
  • GIN存储引擎:适用于处理数组和JSON数据的场景。
  • BRIN存储引擎:适用于处理大数据集的场景,如数据仓库和日志分析。
  • Bitmap存储引擎:适用于处理位图数据的场景。
  • Partial存储引擎:适用于处理部分索引的场景。
  • Unique存储引擎:适用于处理唯一约束的场景。

SQL执行流程:

(一)条件查询优化
  • 统计信息更新:定期更新表的统计信息,确保查询优化器能够做出更准确的查询计划。使用ANALYZE命令:

    ANALYZE users;

  • 范围查询优化:对于范围查询,使用BRIN(块范围索引)可以提高性能。例如:

    CREATE INDEX idx_created_at ON users USING BRIN (created_at);

(二)排序优化
  • 并行排序:PostgreSQL 支持并行排序,可以通过调整max_parallel_workers_per_gather参数来启用并行排序。

    SET max_parallel_workers_per_gather = 4;

(三)聚合函数优化
  • 聚合索引:与 MySQL 类似,在GROUP BY列上创建索引可以提高聚合性能。同时,使用GROUPING SETSROLLUPCUBE等高级聚合功能时,要确保数据分布均匀。

四、Doris 优化策略

Doris SQL引擎种类

  • Heap存储引擎:是Doris的默认存储引擎,支持MVCC(多版本并发控制),适用于大多数应用场景。
  • B-Tree存储引擎:适用于需要高效的范围查询和排序的场景,如索引和排序操作。
  • Hash存储引擎:适用于需要快速查找的场景,如哈希表和索引。
  • GiST存储引擎:适用于处理几何数据和全文搜索的场景。
  • SP-GiST存储引擎:是GiST的一种变体,适用于处理空间数据的场景。
  • GIN存储引擎:适用于处理数组和JSON数据的场景。
  • BRIN存储引擎:适用于处理大数据集的场景,如数据仓库和日志分析。
  • Bitmap存储引擎:适用于处理位图数据的场景。
  • Partial存储引擎:适用于处理部分索引的场景。
  • Unique存储引擎:适用于处理唯一约束的场景。

SQL执行流程:

(一)条件查询优化
  • 分区和分桶:合理使用分区和分桶可以减少数据扫描量。例如,按日期分区,按用户 ID 分桶:

    CREATE TABLE sales (
    sale_date DATE,
    user_id INT,
    amount DECIMAL(10, 2)
    )
    PARTITION BY RANGE(sale_date) (
    PARTITION p202401 VALUES LESS THAN (‘2024-02-01’),

    )
    DISTRIBUTED BY HASH(user_id) BUCKETS 32;

  • 物化视图:对于频繁查询的复杂子查询,可以创建物化视图来提高查询性能。

    CREATE MATERIALIZED VIEW mv_sales_summary AS
    SELECT sale_date, SUM(amount) FROM sales GROUP BY sale_date;

(二)排序优化
  • 预排序:在创建表时指定预排序键,Doris 会按照预排序键对数据进行排序存储,提高排序查询的性能。

    CREATE TABLE orders (
    order_date DATE,
    order_id INT,
    amount DECIMAL(10, 2)
    )
    ORDER BY order_date;

(三)UDF 函数优化
  • 减少 UDF 调用次数:尽量将 UDF 函数的逻辑合并到 SQL 语句中,减少 UDF 调用的开销。
  • 使用向量化 UDF:Doris 支持向量化 UDF,使用向量化 UDF 可以显著提高计算性能。

五、Hive 优化策略

Hive SQL引擎种类
  • MapReduce引擎:这是Hive最初使用的执行引擎,它将SQL查询转换为一系列的MapReduce任务来执行。这种方式在处理大规模数据时非常有效,但由于MapReduce的启动开销较大,对于小数据量或实时性要求高的查询可能效率较低。
  • Tez引擎:Tez是一种基于有向无环图(DAG)的执行引擎,它可以将多个MapReduce任务组合成一个更高效的执行计划,减少了任务的启动和调度开销,提高了查询性能。Tez特别适合处理复杂的查询和数据挖掘任务。
  • Spark引擎:Spark是一种快速的、通用的大数据处理引擎,它提供了比MapReduce更高效的内存计算能力。Hive可以使用Spark作为执行引擎,通过将SQL查询转换为Spark任务来执行,从而提高查询的执行速度。
  • Flink引擎:Flink是一种流处理和批处理统一的计算引擎,它提供了高效的分布式计算能力和低延迟的处理能力。Hive可以使用Flink作为执行引擎,通过将SQL查询转换为Flink任务来执行,从而提高查询的执行速度和实时性。

SQL执行流程:

(一)条件查询优化
  • 分区裁剪:在WHERE子句中使用分区列进行过滤,避免全量数据扫描。例如:

    SELECT * FROM logs WHERE dt = ‘2024-01-01’;

  • 谓词下推:启用谓词下推功能,让 Hive 在数据读取阶段就过滤掉不必要的数据。

    SET hive.optimize.ppd=true;

(二)排序优化
  • 使用DISTRIBUTE BYSORT BYDISTRIBUTE BY用于将数据分发到不同的 reducer,SORT BY用于在每个 reducer 内部进行排序。例如:

    SELECT * FROM sales DISTRIBUTE BY user_id SORT BY amount DESC;

(三)聚合函数优化
  • Map 端聚合:启用 Map 端聚合可以减少数据传输量。

    SET hive.map.aggr=true;

(四)UDF 函数优化
  • 缓存中间结果:如果 UDF 函数的计算结果可以复用,在 UDF 内部实现缓存机制,避免重复计算。
  • 使用 Hive 内置函数替代 UDF:优先使用 Hive 内置函数,因为它们经过了优化,性能通常比自定义 UDF 高。

六、SQL调优技巧

(一)慎重使用COUNT(DISTINCT col)
  • 问题原因:在各个数据库中,DISTINCT操作会将所有数据保存在内存中以进行去重操作,在数据量较大时,这可能导致内存溢出(OOM)情况的发生。
  • 解决方案
    • MySQL、PG:考虑使用GROUP BY和COUNT组合来代替COUNT(DISTINCT col)。例如,如果要统计某列的不同值数量,可以通过SELECT col, COUNT(*) FROM table GROUP BY col,然后在应用层进行进一步处理得到去重后的数量。
    • Doris、Hive:除了GROUP BY替代法,还可以使用ROW_NUMBER() OVER(PARTITION BY col)函数。例如在Hive中,SELECT COUNT(*) FROM (SELECT col, ROW_NUMBER() OVER(PARTITION BY col ORDER BY col) AS row_num FROM table) WHERE row_num = 1。这种方式通过窗口函数为每个不同值分配一个序号,然后只计算序号为1的记录数量。
(二)小文件问题
  • 问题原因:小文件会在数据库存储和查询过程中占用过多内存,因为每个小文件都需要一定的元数据管理开销,从而导致查询效率下降。
  • 解决方案
    • Hive
      • 控制小文件产生数量,可以通过调整写入数据时的参数来实现。例如,在使用INSERT语句写入数据时,可以调整mapreduce.output.fileoutputformat.split.maxsizemapreduce.output.fileoutputformat.split.minsize参数,使数据写入更大的文件块中。
      • 使用SequenceFile格式存储数据,这种格式对于小文件处理有较好的优化效果。例如,在创建表时指定STORED AS SEQUENCEFILE
      • 减少Reducer数量,避免动态分区生成过多小文件。可以通过设置hive.exec.reducers.max参数来限制Reducer的最大数量。
    • Doris:在数据导入阶段,可以通过调整导入参数来控制小文件的生成。例如,设置合适的批处理大小,确保每次导入的数据量足够大,避免生成过多小文件。
(三)慎重使用SELECT *
  • 问题原因:查询所有字段意味着数据库需要处理可能存在的无效数据,这无疑是对资源的浪费,特别是在大表查询时,会增加不必要的I/O开销。
  • 解决方案:无论是MySQL、PG还是Doris、Hive(*一般限制数量,不走mr会稍快),都应该指定所需字段名进行查询。例如,将SELECT * FROM table改为SELECT col1, col2, col3 FROM table,只获取实际需要的列数据。
(四)不要在表关联后加WHERE条件
  • 解决方案
    • MySQL、PG、Doris、Hive通用:采用谓词下推技术,将过滤条件尽可能放在表连接之前,提前过滤数据,减少中间结果集的数据量,从而减少数据传输和处理的开销。例如,将SELECT * FROM table1 JOIN table2 ON table1.id = table2.id WHERE table1.col > 10改为SELECT * FROM (SELECT * FROM table1 WHERE table1.col > 10) AS sub_table1 JOIN table2 ON sub_table1.id = table2.id
(五)处理空值数据
  • 问题原因:空值在数据库处理过程中可能会导致一些问题,如在MapReduce过程(特别是在Hive等基于MapReduce架构的数据库中)中的内存不足。
  • 解决方案
    • MySQL、PG:在查询时过滤掉NULL数据,可以使用IS NOT NULLIS NULL条件进行筛选。例如,SELECT col FROM table WHERE col IS NOT NULL
    • Doris、Hive:除了过滤空值,还可以为空值赋随机数(在某些特定场景下,如避免数据倾斜)。在Hive中,可以使用COALESCE函数来处理空值,例如SELECT COALESCE(col, 0) FROM table,这里如果col列为空,则将其替换为0。
(六)设置并行执行任务数
  • 解决方案
    • Hive:通过设置hive.exec.paralleltrue开启并发执行,增加并行度。这在有多个子查询或者多个任务可以同时进行的情况下非常有效,可以提高整体查询效率。
(七)设置合理的Reducer数量
  • 问题原因:过多的Reducer启动会消耗大量的时间和资源,因为每个Reducer都需要初始化和分配资源。
  • 解决方案
    • Hive:根据输入数据量和每个Reducer处理的数据量设置合理的

七、总结

不同的数据库系统有其独特的架构和性能特点,因此 SQL 优化策略也需要因地制宜。在实际应用中,需要根据具体的业务需求和数据特点,选择合适的优化方法。同时,定期监控数据库的性能指标,不断调整优化策略,才能确保数据库系统始终保持高效稳定的运行。希望本文介绍的优化方案能为你在数据库性能优化方面提供一些有益的参考。

相关文章:

【SQL技术】不同数据库引擎 SQL 优化方案剖析

一、引言 在数据处理和分析的世界里&#xff0c;SQL 是不可或缺的工具。不同的数据库系统&#xff0c;如 MySQL、PostgreSQL&#xff08;PG&#xff09;、Doris 和 Hive&#xff0c;在架构和性能特点上存在差异&#xff0c;因此针对它们的 SQL 优化策略也各有不同。这些数据库…...

什么是原型?

在 JavaScript 中&#xff0c;原型&#xff08;Prototype&#xff09;是每个 JavaScript 对象都有的一个属性&#xff0c;用来实现对象之间的继承。原型是 JavaScript 面向对象编程的核心概念之一&#xff0c;通过原型链&#xff08;prototype chain&#xff09;&#xff0c;一…...

【第10章:自然语言处理高级应用—10.4 NLP领域的前沿技术与未来趋势】

各位技术探险家们,今天我们要开启一场穿越语言智能奇点的时空之旅。从正在改写物理定律的万亿参数大模型,到能看懂《星际穿越》剧本的跨模态AI,再到正在颠覆编程方式的神经-符号混合系统……这篇万字长文将带你摸清NLP技术进化的七块关键拼图。(建议边读边做笔记,文末有技…...

41.日常算法

1.面试题 02.04. 分割链表 题目来源 给你一个链表的头节点 head 和一个特定值 x &#xff0c;请你对链表进行分隔&#xff0c;使得所有 小于 x 的节点都出现在 大于或等于 x 的节点之前。你不需要 保留 每个分区中各节点的初始相对位置。 示例 1&#xff1a; 输入&#xff1a…...

CPP集群聊天服务器开发实践(五):nginx负载均衡配置

1 负载均衡器的原理与功能 单台Chatserver可以容纳大约两万台客户端同时在线聊天&#xff0c;为了提升并发量最直观的办法需要水平扩展服务器的数量&#xff0c;三台服务器可以容纳六万左右的客户端。 负载均衡器的作用&#xff1a; 把client的请求按照负载均衡算法分发到具体…...

Java 中的 HashSet 和 HashMap 有什么区别?

一、核心概念与用途 特性HashSetHashMap接口实现实现 Set 接口&#xff08;存储唯一元素&#xff09;实现 Map 接口&#xff08;存储键值对&#xff09;数据存储存储单个对象&#xff08;元素唯一&#xff09;存储键值对&#xff08;键唯一&#xff0c;值可重复&#xff09;典…...

AI大模型的技术突破与传媒行业变革

性能与成本&#xff1a;AI大模型的“双轮驱动” 过去几年&#xff0c;AI大模型的发展经历了从实验室到产业化的关键转折。2025年初&#xff0c;以DeepSeek R1为代表的模型在数学推理、代码生成等任务中表现超越国际头部产品&#xff0c;而训练成本仅为传统模型的几十分之一。这…...

Golang学习01:Go安装和配置+Vscode、GoLand安装激活+Go环境变量避坑的超详细教程

&#x1fa81;&#x1f341; 希望本文能给您带来帮助&#xff0c;如果有任何问题&#xff0c;欢迎批评指正&#xff01;&#x1f405;&#x1f43e;&#x1f341;&#x1f425; 文章目录 一、背景二、Go语言安装2.1 Go语言环境安装2.2 Go语言环境验证2.3 其他配置 三、开发环境…...

案例-06.部门管理-根据ID查询

一.根据ID查询-接口文档 二.根据ID查询-Controller层 package com.gjw.controller;/*** 部门管理Controller*/import com.gjw.anno.Log; import com.gjw.pojo.Dept; import com.gjw.pojo.Result; import com.gjw.service.DeptService; import com.gjw.service.impl.DeptServi…...

解决No matching client found for package name xxx编译报错的问题

如果Android工程编译报错&#xff0c;并且信息如下&#xff1a; Execution failed for task :app:processDebugGoogleServices. > No matching client found for package name com.demo.test可能的原因为google-services.json中定义的package_name属性跟app当前的包名不符&…...

基于deepseek api和openweather 天气API实现Function Calling技术讲解

以下是一个结合DeepSeek API和OpenWeather API的完整Function Calling示例&#xff0c;包含意图识别、API调用和结果整合&#xff1a; import requests import json import os# 配置API密钥&#xff08;从环境变量获取&#xff09; DEEPSEEK_API_KEY os.getenv("DEEPSEE…...

什么是全局污染,怎么避免全局污染?

具体表现&#xff1a; 全局变量&#xff1a;当变量在全局作用域&#xff08;通常是 window 对象&#xff09;中定义时&#xff0c;它会在整个应用程序中都可访问。这个变量可能会被其他部分的代码意外修改或覆盖&#xff0c;导致难以追踪和调试错误。 命名冲突&#xff1a;全局…...

机器视觉--switch语句

引言 在 Halcon 这个强大的机器视觉软件里&#xff0c;编程控制结构对于高效处理图像任务至关重要。其中&#xff0c;Switch 语句作为一种多分支选择结构&#xff0c;能够根据不同的条件值执行不同的代码块&#xff0c;让程序的逻辑更加清晰和简洁。本文将全面深入地介绍 Halc…...

C++ std::atomic可以使用复杂类型(类和结构体)吗

目录 1.引言 2.std::atomic 支持的复杂类型 3.std::atomic与无锁 4.如何使用 std::atomic 保护复杂类型 4.1.使用互斥锁&#xff08;Mutex&#xff09; 4.2.使用 std::atomic_flag 和自旋锁 4.3.原子共享指针&#xff08;Atomic Shared Pointers&#xff09; 4.4.使用高…...

音乐随想、日语认识

Rapport的日文歌词&#xff08;初&#xff09; Rapport - キタニタツヤ 词&#xff1a;キタニタツヤ 《《 ki ta ni ta tsu ya 歌手的名字&#xff0c;全是片假名&#xff0c;不是本土的平假名(为了国外市场的做法&#xff1f;) 》》 曲&#xff1a;キタニタツヤ 编曲&am…...

SpringBoot速成(11)更新用户头像,密码P13-P14

更新头像&#xff1a; 1.代码展示: 1.RequestParam 是 Spring MVC 中非常实用的注解&#xff0c;用于从 HTTP 请求中提取参数并绑定到控制器方法的参数上。 2.PatchMapping 是 Spring MVC 中的一个注解&#xff0c;用于处理 HTTP 的 PATCH 请求。PATCH 请求通常用于对资源的部…...

自动化测试面试会问哪些?

自动化测试面试1&#xff1a; 1、使用什么测试框架做的上一个项目的自动化测试。 2、自己最熟悉哪个库&#xff0c;如何使用这些库的&#xff0c;是否做了基于复用的封装&#xff0c;怎么考虑的这些封装 3、如何定位app上的元素 4、//*[contains(text,"登录")] 是…...

SQL Server 导入Excel数据

1、选中指定要导入到哪个数据库&#xff0c;右键选择 》任务 》导入数据 2、数据源 选择Excel&#xff0c;点击 下一步(Next) 3、目前 选择OLE DB Provider &#xff0c;点击 下一步&#xff08;Next&#xff09; 4、默认 &#xff0c;点击 下一步&#xff08;Next&#xff09;…...

车载音频架构图详解(精简)

目录 上图是车载音频架构图,对这个图我们进行详细的分析 左边第一层 是 app 常用的类有MediaPlayer和MediaRecorder, AudioTrack和AudioRecorder 第二层 是framework提供给应用的多媒体功能的API类,封装在android.media.* API包中。编译后,在framework.jar中。...

基于SpringBoot+Vue的智慧校园管理系统设计和实现(源码+文档+部署讲解)

&#x1f3ac; 秋野酱&#xff1a;《个人主页》 &#x1f525; 个人专栏:《Java专栏》《Python专栏》 ⛺️心若有所向往,何惧道阻且长 文章目录 .&#x1f680; 技术架构技术栈全景 &#x1f3af; 功能模块功能矩阵表&#x1f4ca; 数据库设计核心ER关系图 &#x1f4bb; 核心…...

浏览器打印局部网页,设置页眉

占位的页眉 重点部分 1.样式间隙 page { margin-top: 60px; /* 为页眉留出空间&#xff0c;页眉的高度要和他一样 */ top-right { height: 60px; 同时右侧&#xff0c;内容布局右上角要留出60px的 2.背景图片 如果页眉…...

腿足机器人之六- 前向运动学

腿足机器人之六- 前向运动学 刚体运动学基础坐标系定义旋转矩阵与欧拉角齐次变换矩阵&#xff08;平移旋转的统一表示&#xff09; 运动链建模串联运动链结构&#xff08;从基座到末端的关节连接&#xff09;标准Denavit-Hartenberg&#xff08;D-H&#xff09;参数法改进D-H参…...

对openharmony HDF驱动框架的C/S设计模式和单例类的说明

在分析openharmony的HDF驱动框架时我们会发现用了很多面向对象的思想&#xff0c;例如类继承、接口、单例类等&#xff0c;本来应该是好事情&#xff0c;**但使用时对象之间的关系交错复杂&#xff0c;不太符合linux内核分层分模块的思路&#xff0c;导致整体理解起来比较困难&…...

kamailio中Core Cookbook 核心配置手册

Core Cookbook 核心配置手册 版本: Kamailio SIP 服务器 v6.0.x (稳定版) 概述 本教程收集了 Kamailio 核心导出到配置文件的功能和参数。 注意: 本页参数未按字母顺序排列。 结构 kamailio.cfg 的结构可分为三部分: 全局参数模块设置路由块 建议按此顺序排列以保持清晰…...

AI 编程工具—Cursor 进阶篇 数据分析

AI 编程工具—Cursor 进阶篇 数据分析 上一节课我们使用Cursor 生成了北京房产的销售数据,这一节我们使用Cursor对这些数据进行分析,也是我们尝试使用Cursor 去帮我们做数据分析,从而进一步发挥Cursor的能力,来帮助我们完成更多的事情 案例一 房产销售数据分析 @北京202…...

HTML、Vue和PHP文件的区别与联系

一、核心区别 类型性质执行环境功能特点.html静态标记语言浏览器直接解析定义页面结构和内容&#xff0c;无逻辑处理能力.vue前端框架组件文件浏览器/构建工具整合HTML模板JS逻辑CSS样式&#xff0c;支持动态数据绑定和组件化开发.php服务器端脚本语言文件Web服务器执行动态生…...

Map 和 Set

目录 一、搜索 概念&#xff1a; 模型&#xff1a; 二、Map ​编辑 1.Map 实例化&#xff1a; 2. Map的常见方法&#xff1a; 3.Map的常见方法演示&#xff1a; 1. put(K key, V value)&#xff1a;添加键值对 3. containsKey(Object key)&#xff1a;检查键是否存在 4.…...

白话大模型LLM-通用基础入门知识-适合给纯小白的入门!

文章目录 什么是大模型大模型训练预训练监督微调SFTRLHF基于人类反馈的强化学习 大模型分类大语言模型-LLM多模态模型-VLM视觉模型音频模型 大模型工作流程分词化与词表映射大模型回答过程 & 基于token的概率预测 Agent导论子任务拆分 什么是大模型 大模型就是训练的一个能…...

线程进入WAITING的N种方式

目录 一、调用 Object 的 wait 方法 二、调用 Thread.join 方法 三、调用LockSupport.park()方法 一、调用 Object 的 wait 方法 public static void main(String[] args) throws InterruptedException {// 创建一个锁对象Object lock new Object();Thread thread new Thr…...

智能车摄像头开源—8 元素处理

目录 一、前言 二、无元素状态 三、直线与弯道 四、十字与环岛 1、十字识别处理 2、环岛识别处理 五、坡道 六、障碍物 七、斑马线 八、入库 九、出界停车 一、前言 在写这篇文章之前&#xff0c;考虑了很久到底该写到什么程度&#xff0c;但思来想去&#xff0c;不同…...

【从0做项目】Java搜索引擎(4)——性能优化~烧脑~~~

本篇文章将对项目搜索引擎&#xff08;1&#xff09;~&#xff08;3&#xff09;进行性能优化&#xff0c;包括测试&#xff0c;优化思路&#xff0c;优化前后对比 目录 一&#xff1a;文件读取 二&#xff1a;实现多线程制作索引 1&#xff1a;代码分析 2&#xff1a;代码…...

人工智障的软件开发-git仓库篇-弃gitlab,走gitea

指令接收&#xff1a;「开始构建代码宇宙」 系统检测&#xff1a;需求模糊度99.9% 启动应急协议&#xff1a;构建最小可行性生态圈 核心组件锁定&#xff1a;代码基因库&#xff08;人类称之为Git仓库&#xff09; 需求分析&#xff1a;论人类语言的艺术性 人类指令翻译机 表…...

Spring Boot 如何实现自动配置?

欢迎并且感谢大家指出我的问题&#xff0c;由于本人水平有限&#xff0c;有些内容写的不是很全面&#xff0c;只是把比较实用的东西给写下来&#xff0c;如果有写的不对的地方&#xff0c;还希望各路大牛多多指教&#xff01;谢谢大家&#xff01;&#x1f970; 大家如果对Java…...

STM32H743ZIT6 FreeRTOS CMSIS_V2 Lwip DP83848/LAN8720 最新HAL V1.12.1版本 AC6编译器,速通。

HAL库版本&#xff1a;V1.12.1 最新版 这版CUBEmx生成的LAN8742 的驱动文件有问题&#xff0c;无法正常初始化&#xff0c;导致无法PING通。 lwip 内存池 不需要手动指定0x30040200区域&#xff0c;lwipopts.h已作配置 开启DCACH 和ICACH 和 D2域SRAM3 时钟 /*** brief Th…...

C# 添加图标

一、前言 为应用程序添加图标是优化用户界面、提升应用辨识度的重要操作。合适的图标能帮助用户快速识别和区分不同应用&#xff0c;增强应用的易用性和专业性。 本指南旨在为你提供详细、易懂的步骤&#xff0c;教你如何为应用程序的窗体添加图标。从图标素材的获取到具体的…...

MVC模式和MVVM模式

目录 一、MVC模式和MVVM模式 1. MVC模式 2. MVVM 模式 3.在Qt中的应用示例 4.总结 二、MVC与MVVM模式的共同点和区别 1.共同点 2.区别 3.交互流程 4.总结 MVC&#xff08;Model-View-Controller&#xff09;和MVVM&#xff08;Model-View-ViewModel&#xff09;是两种…...

【kafka系列】Kafka如何实现高吞吐量?

目录 1. 生产者端优化 核心机制&#xff1a; 关键参数&#xff1a; 2. Broker端优化 核心机制&#xff1a; 关键源码逻辑&#xff1a; 3. 消费者端优化 核心机制&#xff1a; 关键参数&#xff1a; 全链路优化流程 吞吐量瓶颈与调优 总结 Kafka的高吞吐能力源于其生…...

如何学习Elasticsearch(ES):从入门到精通的完整指南

如何学习Elasticsearch&#xff08;ES&#xff09;&#xff1a;从入门到精通的完整指南 嘿&#xff0c;小伙伴们&#xff01;如果你对大数据搜索和分析感兴趣&#xff0c;并且想要掌握Elasticsearch这一强大的分布式搜索引擎&#xff0c;那么你来对地方了&#xff01;本文将为…...

GDB QUICK REFERENCE (GDB 快速参考手册)

GDB QUICK REFERENCE {GDB 快速参考手册} References GDB QUICK REFERENCE GDB Version 4 https://users.ece.utexas.edu/~adnan/gdb-refcard.pdf 查看方式&#xff1a;在新标签页中打开图片 References [1] Yongqiang Cheng, https://yongqiang.blog.csdn.net/ [2] gdb-refc…...

Flutter_学习记录_动画的简单了解

用AnimationController简单实现如下的效果图&#xff1a; 1. 只用AnimationController实现简单动画 1.1 完整代码案例 import package:flutter/material.dart;class AnimationDemo extends StatefulWidget {const AnimationDemo({super.key});overrideState<AnimationDe…...

【JavaEE进阶】验证码案例

目 &#x1f332;实现说明 &#x1f384;Hutool介绍 &#x1f333;准备工作 &#x1f334;约定前后端交互接口 &#x1f6a9;接口定义 &#x1f6a9;实现服务器后端代码 &#x1f6a9;前端代码 &#x1f6a9;整体测试 &#x1f332;实现说明 随着安全性的要求越来越⾼…...

SQL复习

SQL复习 MySQL MySQL MySQL有什么特点&#xff1f; MySQL 不支持全外连接。 安装 数据类型 MySQL中的数据类型分为哪些&#xff1f; MySQL中的数据类型主要分为三大类&#xff1a;数值类型、字符串类型、日期时间类型。 其中&#xff0c; 数值类型又分为七种&#xff1a;T…...

景联文科技:以精准标注赋能AI未来,打造高质量数据基石

在人工智能蓬勃发展的时代&#xff0c;数据已成为驱动技术革新的核心燃料&#xff0c;而高质量的数据标注则是让AI模型从“感知”走向“认知”的关键桥梁。作为深耕数据服务领域的创新者&#xff0c;景联文科技始终以“精准、高效、安全”为核心理念&#xff0c;为全球AI企业提…...

蓝桥杯(B组)-每日一题(阶乘求和)

题目 代码解析&#xff1a; #include<iostream> using namespace std;long long multiply(int x) {long long sum1;//定义longlong类型初始为1 for(int i1;i<x;i)sumsum*i;//每一项的阶乘 return sum;//将阶乘结果返回 }int main() {int n;cin>>n;long long r…...

大模型应用开发时如何调试提示词?

在编程领域&#xff0c;调试通常依赖于断点、堆栈跟踪和详细的错误信息。然而&#xff0c;在提示调试的上下文中&#xff0c;这些传统工具变得不再适用。提示调试更多地依赖于对任务的理解、对提示的精细调整&#xff0c;以及对结果的迭代优化。在本文&#xff0c;我们将深入探…...

国产编辑器EverEdit - 二进制模式下观察Window/Linux/MacOs换行符差异

1 换行符格式 1.1 应用场景 稍微了解计算机历史的人都知道&#xff0c; 计算机3大操作系统&#xff1a; Windows、Linux/Unix、MacOS&#xff0c;这3大系统对文本换行的定义各不相同&#xff0c;且互不相让&#xff0c;导致在文件的兼容性方面存在一些问题&#xff0c;比如它们…...

LockSupport

文章目录 SynchronizedJUCLockSupport详解 Synchronized package com.xd;public class SynchronizedDemo {//等待线程public void waitThread() { // 1.如果将synchronized (this){}注释,会抛出异常,因为wait和notify⼀定要在同步块或同步⽅法中synchronized (this) {try {Sys…...

Spark 和 Flink

Spark 和 Flink 都是目前流行的大数据处理引擎&#xff0c;但它们在架构设计、应用场景、性能和生态方面有较大区别。以下是详细对比&#xff1a; 1. 架构与核心概念 方面Apache SparkApache Flink计算模型微批&#xff08;Micro-Batch&#xff09;为主&#xff0c;但支持结构…...

maven——使用idea创建maven项目(文件夹上颜色)

把一开始灰色和相对于maven标准目录缺少的文件夹上色和新建&#xff1a; 在右边给叉掉文件夹就又全都变成灰色的了&#xff1a; 在这个地方也可以改&#xff1a; 使用骨架创建 不使用骨架创建...

DeepSeek教unity------UI框架

/****************************************************文件&#xff1a;BasePanel.cs作者&#xff1a;Edision日期&#xff1a;#CreateTime#功能&#xff1a;面板基类 *****************************************************/using UnityEngine;public class BasePanel : Mo…...