OceanBase V4.3.5 上线全文索引功能,让数据检索更高效
近日,OceanBase 4.3.5 BP1 版本正式推出了企业级全文索引功能。该版本在中文分词、查询效率及混合检索能力上进行了全面提升。经过自然语言模式和布尔模式在不同场景下的对比测试,OceanBase 的全文索引性能明显优于 MySQL。
点击下载 OceanBase 社区版 4.3.5 BP1 >>
全文索引(Full-Text Index),是一种专为加速数据库中文本数据检索而设计的特殊索引类型,尤其擅长处理包含大量文本字段(例如文章内容、评论、博客等)的查询请求。它能够支持高效的关键词匹配查询,允许在文本中搜索一个或多个词语,并迅速返回相关结果。全文索引广泛应用于搜索引擎和文本分析系统中,助力企业和用于迅速查找关键信息,显著提升搜索效率。
在企业的实际生产中,全文索引功能可以应用于系统日志分析、用户分析等众多场景,全文索引能够对数据做到高效率过滤筛选、或是高质量相关性评估。在 AI 领域,OceanBase 基于稀疏稠密向量与全文索引相结合的多路召回架构,能在具有特殊知识领域的 RAG 系统中实现更高效、更精准的召回效果。本文将深入解析其背后的技术原理,并展示其在实践中的表现。
一、全文索引企业级功能四大核心价值
最新版本的全文索引,在以下方面帮助用户解决更多搜索使用上的痛点:
🚩 支持分区表,索引数据和分区数据就近存储,提高性能。
🚩 支持主表上建立多种混合索引(普通二级、全文、多值、向量等),一套数据应对不同查询目标和加速场景。
🚩 支持 IK 中文分词器和词典修改,在一些需要中文专业术语的业务里,字典维护和匹配更加易用和精准。
🚩 支持常用的自然语言和布尔模式,性能优于 MySQL,功能与性能两方面支撑业务做平替。
二、核心技术解析:BM25算法与查询优化
数据库中全文索引要解决的基本问题是如何通过查询里的关键词快速有效地找到对应的文档。在 OceanBase 存储引擎内部,用户的文档(doc)会被分词器(parser)拆分成若干关键词(word/token)。这些关键词连同文档的统计信息特征被存储在内部的辅助表(tablet)上,用于信息检索阶段的相关性评估算法(ranking)。OceanBase 采用能够更好评估信息关联性的 BM25 算法,对用户查询语句中的关键词和存储的文档计算相关性分数,并最终输出有关联的文档和其评分。
结合 OceanBase 已有的高性能查询引擎能力,在全文索引查询流程内,我们针对性地做了 TAAT/DAAT 流程优化、对标 Oracle 的 functional lookup 功能以及多索引间的 index merge 等,让全文能结合更多复杂的查询特性,完成用户想要的数据检索。
三、实战测评:以中文体育新闻搜索为例
接下来,我们以中文体育新闻搜索为例,动手体验 OceanBase 的全文索引,同时展示常用的视图和查询技巧。
集群部署与数据导入
首先用最新版 OceanBase 4.3.5 BP1 搭建两副本,一个 2C4G 的 MySQL 模式租户。
OceanBase 内置支持中文语言的 IK 分词器,以及比传统自然语言模式更好用的布尔模式。所以实验的数据集使用中文足球体育新闻(https://github.com/ej0cl6/SportsSum)。在 OceanBase 内创建一张无主键分区表,包含三列变长字符串(event,date,news)。对 news 字段使用了 IK 中文分词器,并指定 max_word 模式。IK 分词器的另一种 smart 模式,和 max_word 的区别是,其在匹配到最长词语后就停止匹配更短的词语。
OceanBase 内置分词器还包括适合英语的 space 和 beng。以及按照字符长度分割的 ngram。
-- 建表语句
CREATE TABLE sport_data_whole(
event varchar(64),
date varchar(16),
news varchar(65535),
fulltext INDEX (news) WITH parser ik PARSER_PROPERTIES =(ik_mode = "max_word")
);
通过客户端本地文件的方式,将新闻数据集导入到表格内,时间大概在十五秒左右。
-- 导入语句
load data /*+ parallel(8) */
local infile "/home/jiahua.cjh/sports_data_whole.csv"
into table sport_data_whole
fields terminated by ',' lines terminated by '\n';
导入后共 5268 条新闻,平均文档长度在 2700 个中文字。原始数据是 57MB 左右。实际存储的总空间大小,在经过存储引擎的压缩后,连同索引不到 30MB。可以看到其中比较大的是全文索引中倒排和正排辅助表,内部存储了比较多的分词记录。
-- 体育新闻数据集
select
avg(length(news)),
count(*)
from
sport_data_whole;
+-------------------+----------+
| avg(length(news)) | count(*) |
+-------------------+----------+
| 2781.6900 | 5268 |
+-------------------+----------+
1 row in set (0.03 sec)
select
*
from
oceanbase.DBA_OB_TABLE_SPACE_USAGE\G
*************************** 1. row ***************************
TABLE_ID: 500007
DATABASE_NAME: test
TABLE_NAME: sport_data_whole
OCCUPY_SIZE: 8349796
REQUIRED_SIZE: 10489856
*************************** 2. row ***************************
TABLE_ID: 500008
DATABASE_NAME: test
TABLE_NAME: __idx_500007_news
OCCUPY_SIZE: 30247553
REQUIRED_SIZE: 31461376
*************************** 3. row ***************************
TABLE_ID: 500009
DATABASE_NAME: test
TABLE_NAME: __idx_500007_fts_rowkey_doc
OCCUPY_SIZE: 70125
REQUIRED_SIZE: 77824
*************************** 4. row ***************************
TABLE_ID: 500010
DATABASE_NAME: test
TABLE_NAME: __idx_500007_fts_doc_rowkey
OCCUPY_SIZE: 73171
REQUIRED_SIZE: 77824
*************************** 5. row ***************************
TABLE_ID: 500011
DATABASE_NAME: test
TABLE_NAME: __idx_500007_news_fts_doc_word
OCCUPY_SIZE: 28302737
REQUIRED_SIZE: 29364224
利用全文索引查询
利用存储进数据库中的新闻数据集和索引,可以做多条件自由组合,达到高过滤性信息检索的目的。例如作为球迷,想搜索包含有 “拜仁” 和 “乌龙球” 的新闻,推荐使用布尔模式。相较于没有索引的字符串 like 匹配,布尔模式语法上更简洁易懂,查询速度也会更快。
-- 布尔模式
select
count(*)
from
sport_data_whole
where
match (news) against ('+乌龙球 +拜仁' in boolean mode);
+----------+
| count(*) |
+----------+
| 2 |
+----------+
1 row in set (0.03 sec)
select
count(*)
from
sport_data_whole
where
news like '%乌龙球%'
and news like '%拜仁%';
+----------+
| count(*) |
+----------+
| 2 |
+----------+
1 row in set (0.08 sec)
对于返回的多条新闻,在输出结果中增加分值,能用来帮助判断哪条新闻更有关联。OceanBase 的全文支持经过 BM25 算法计算得到的相关性分数。下面可以看到 date 是 0278 的新闻,和我们查询的目的更具关联性。
-- ranking
select
event,
date,
match (news) against ('乌龙球 拜仁') as score
from
sport_data_whole
where
match (news) against ('+乌龙球 +拜仁' in boolean mode);
+-------+------+---------------------+
| event | date | score |
+-------+------+---------------------+
| ucl | 0278 | 0.4657063867776557 |
| ucl | 0201 | 0.41760566608994765 |
+-------+------+---------------------+
2 rows in set (0.04 sec)
布尔模式相较于自然语言,还能反向剔除一些关键词。例如每场足球比赛中几乎都有犯规行为,如果想知道哪些比赛很激烈,但是没有红黄牌甚至没有犯规,则可以用到布尔模式里的 “-” 运算符。
-- 布尔模式运算
select
count(*)
from
sport_data_whole
where
match (news) against ('+激烈 -黄牌 -红牌 -犯规' in boolean mode);
+----------+
| count(*) |
+----------+
| 31 |
+----------+
1 row in set (0.04 sec)
一个调试的小技巧,当发现全文索引的查询结果不符合预期时,通常是因为分词结果不理想。OceanBase 提供了一个快速的 TOKENIZE 函数来辅助测试分词结果。函数支持所有分词器和对应属性。例如下面手动的分词结果,反映了词典中对于国外体育明星人名的支持还不是很好(博阿滕、格策),因此用这些人名去检索新闻的效果可能达不到预期。
-- tokenize 函数
select
tokenize(
'博阿滕右路反击人球分过传中,格策后点停球转身闪开角度,在门前8米处低射从皮亚托夫裆下钻进门内',
'ik',
'[{"additional_args": [{"ik_mode": "smart"}]}]'
);
+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| tokenize('博阿滕右路反击人球分过传中,格策后点停球转身闪开角度,在门前8米处低射从皮亚托夫裆下钻进门内', 'ik', '[{"additional_args": [{"ik_mode": "smart"}]}]') |
+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| ["亚", "格", "夫", "阿", "门内", "从", "下钻", "后点", "右路", "分过", "传中", "低", "转身", "球", "射", "闪开", "博", "进", "反击", "门前", "停", "人", "皮", "裆", "策", "滕", "8米处", "托", "在", "角度"] |
+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
1 row in set (0.03 sec)
select
count(*)
from
sport_data_whole
where
match (news) against ('+格策 +博阿滕' in boolean mode);
+----------+
| count(*) |
+----------+
| 0 |
+----------+
1 row in set (0.04 sec)
如果想提升分词器的精准性,OceanBase 支持修改系统词典表。当我们将上述中文人名插入到系统词典表后,重新分词的效果立竿见影。
🧡 注意:词典修改后,原索引分词效果不变,需要重建索引生效。
-- 中文人名分词效果
select
tokenize(
'博阿滕右路反击人球分过传中,格策后点停球转身闪开角度,在门前8米处低射从皮亚托夫裆下钻进门内',
'ik',
'[{"additional_args": [{"ik_mode": "smart"}]}]'
);
+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| tokenize('博阿滕右路反击人球分过传中,格策后点停球转身闪开角度,在门前8米处低射从皮亚托夫裆下钻进门内', 'ik', '[{"additional_args": [{"ik_mode": "smart"}]}]') |
+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| ["门内", "从", "下钻", "后点", "右路", "分过", "传中", "低", "转身", "球", "皮亚托夫", "射", "闪开", "进", "反击", "门前", "停", "人", "裆", "8米处", "在", "角度", "格策", "博阿滕"] |
+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
1 row in set (0.04 sec)
select
count(*)
from
sport_data_whole
where
match (news) against ('+格策 +博阿滕' in boolean mode);
+----------+
| count(*) |
+----------+
| 79 |
+----------+
1 row in set (0.05 sec)
实验最后,对全文索引与普通索引混合查询下 union merge 带来的性能提升做一个对比。对 sport_data_whole 表的 date 列再建立一个普通局部索引。可以通过 show index 观察索引生效情况。
-- 构建普通索引
alter table sport_data_whole add index (date);
show index from sport_data_whole\G
*************************** 1. row ***************************
Table: sport_data_whole
Non_unique: 1
Key_name: news
Seq_in_index: 1
Column_name: news
Collation: A
Cardinality: NULL
Sub_part: NULL
Packed: NULL
Null: YES
Index_type: FULLTEXT
Comment: available
Index_comment:
Visible: YES
Expression: NULL
*************************** 2. row ***************************
Table: sport_data_whole
Non_unique: 1
Key_name: date
Seq_in_index: 1
Column_name: date
Collation: A
Cardinality: NULL
Sub_part: NULL
Packed: NULL
Null: YES
Index_type: BTREE
Comment: available
Index_comment:
Visible: YES
Expression: NULL
2 rows in set (0.00 sec)
当两个索引条件使用 OR 连接时,过滤性好的情况下,union merge 带来的收益会比扫描普通索引后再过滤(计划中有 has_functional_lookup=true)更快。从两种计划最后预估的时间上可以看到有数量级的提升。
-- union merge 计划对比
explain
select
/*+UNION_MERGE(sport_data_whole date news)*/
*
from
sport_data_whole
where
date = '0322'
or (match (news) against ('+乌龙球' in boolean mode));
+-------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| Query Plan |
+-------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| =================================================================================== |
| |ID|OPERATOR |NAME |EST.ROWS|EST.TIME(us)| |
| ----------------------------------------------------------------------------------- |
| |0 |DISTRIBUTED INDEX MERGE SCAN|sport_data_whole(date,news)|45 |9102 | |
| =================================================================================== |
| Outputs & filters: |
| ------------------------------------- |
| 0 - output([sport_data_whole.event], [sport_data_whole.date], [sport_data_whole.news]), filter([sport_data_whole.date = '0322' OR MATCH(sport_data_whole.news) |
| AGAINST('+乌龙球' IN BOOLEAN MODE)]), rowset=256 |
| access([sport_data_whole.__pk_increment], [sport_data_whole.date], [sport_data_whole.news], [sport_data_whole.event]), partitions(p0) |
| is_index_back=true, is_global_index=false, keep_ordering=true, use_index_merge=true, filter_before_indexback[false], |
| index_name: date, range_cond([sport_data_whole.date = '0322']), filter(nil) |
| index_name: news, range_cond(nil), filter(nil) |
| lookup_filter([sport_data_whole.date = '0322' OR MATCH(sport_data_whole.news) AGAINST('+乌龙球' IN BOOLEAN MODE)]) |
+-------------------------------------------------------------------------------------------------------------------------------------------------------------------+
14 rows in set (0.03 sec)
explain
select
*
from
sport_data_whole
where
date = '0322'
or (match (news) against ('+乌龙球' in boolean mode));
+-------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| Query Plan |
+-------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| =========================================================== |
| |ID|OPERATOR |NAME |EST.ROWS|EST.TIME(us)| |
| ----------------------------------------------------------- |
| |0 |TABLE FULL SCAN|sport_data_whole|79 |526939 | |
| =========================================================== |
| Outputs & filters: |
| ------------------------------------- |
| 0 - output([sport_data_whole.event], [sport_data_whole.date], [sport_data_whole.news]), filter([sport_data_whole.date = '0322' OR MATCH(sport_data_whole.news) |
| AGAINST('+乌龙球' IN BOOLEAN MODE)]), rowset=256 |
| access([sport_data_whole.__pk_increment], [sport_data_whole.date], [sport_data_whole.news], [sport_data_whole.event]), partitions(p0) |
| is_index_back=false, is_global_index=false, filter_before_indexback[false], |
| range_key([sport_data_whole.__pk_increment]), range(MIN ; MAX)always true, has_functional_lookup=true |
+-------------------------------------------------------------------------------------------------------------------------------------------------------------------+
12 rows in set (0.04 sec)
四、性能对比:OceanBase 远超 MySQL
OceanBase 的全文索引性能横向比较如何?我们以 MySQL 的全文索引为例。MySQL 的中文分词能力不是很好,因此对比数据集选定在英文数据集 wikir1k(369721行,平均每行100词)上。以下分别是自然语言模式,以及布尔模式下多种场景的对比结果。
结果上:
💡 OceanBase 在需要大量分词或是返回结果的场景中,都远优于 MySQL。
💡 小结果集上,因为计算量占比不高,查询引擎的优势不明显,两者十分接近。
测试环境如下:
-
OceanBase 租户规格 8c 16g
-
MySQL Ver 8.0.36 for Linux on x86_64 (MySQL Community Server - GPL)
自然语言模式
# Query
# q1
select * from wikir1k where match (document) against ('and');
# q2
select * from wikir1k where match (document) against ('and') limit 10;
# q3
select * from wikir1k where match (document) against ('librettists');
# q4
select * from wikir1k where match (document) against ('librettists') limit 10;
# q5
select * from wikir1k where match (document) against ('alleviating librettists');
# q6
select * from wikir1k where match (document) against ('black spotted white yellow');
# q7
select * from wikir1k where match (document) against ('black spotted white yellow') limit 10;
# q8
select * from wikir1k where match (document) against ('between up and down');
# q9
select * from wikir1k where match (document) against ('between up and down') limit 10;
# q10
select * from wikir1k where match (document) against ('alleviating librettists modifications retelling intangible hydrographic administratively berwickshire strathaven dumfriesshire lesmahagow transhumanist musselburgh prestwick cardiganshire montgomeryshire');
# q11
select * from wikir1k where match (document) against ('alleviating librettists modifications retelling intangible hydrographic administratively berwickshire strathaven dumfriesshire lesmahagow transhumanist musselburgh prestwick cardiganshire montgomeryshire and');
# q12
select * from wikir1k where match (document) against ('alleviating librettists modifications retelling intangible hydrographic administratively berwickshire strathaven dumfriesshire lesmahagow transhumanist musselburgh prestwick cardiganshire montgomeryshire and') limit 10;
布尔模式
# Query
# q1: +高频词 -中频词
select * from wikir1k where match (document) against ('+and -which -his' IN BOOLEAN MODE);
# q2: +高频词 -低频词
select * from wikir1k where match (document) against ('+which (+and -his)' IN BOOLEAN MODE);
# q3: +中频词 (+高频词 -中频词)
select * from wikir1k where match (document) against ('+and -carabantes -bufera' IN BOOLEAN MODE);
# q4: +高频词 +低频词
select * from wikir1k where match (document) against ('+and +librettists' IN BOOLEAN MODE);
五、未来路线:OceanBase 全文索引将持续演进
OceanBase 全文索引的能力还远不止于此,结合新的技术趋势和新的数据检索场景,在后续版本,我们还会推出更多易用性功能。例如:
🔎 能支持交集能力的全面的 index merge;
🔎 以插件方式支持更丰富流行的多语言分词器;
🔎 更灵活的用户自定义词典和停词;
🔎 更常用的 term query、phrase query,compound query 功能;
🔎 在检索方面,结合 OceanBase 的多模稀疏向量,进一步增强文档的语义理解力;
🔎 使用多路召回、动态剪裁以及底层例如 WAND 的加速算法,在质量和速度两个方面提升检索体验等等。
全文索引不仅是数据库能力的延伸,更是企业实现数据智能化的关键基础设施。经过全面升级的 OceanBase 全文索引,在中文处理能力、混合查询性能、生产可用性等方面已建立显著优势。
无论是在传统日志分析场景,还是结合 AI 的智能检索需求,OceanBase 的全文索引都能提供企业级解决方案。未来,OceanBase 将持续深化"数据库+搜索+AI"的技术融合,助力企业构建新一代智能数据平台。
相关文章:
OceanBase V4.3.5 上线全文索引功能,让数据检索更高效
近日,OceanBase 4.3.5 BP1 版本正式推出了企业级全文索引功能。该版本在中文分词、查询效率及混合检索能力上进行了全面提升。经过自然语言模式和布尔模式在不同场景下的对比测试,OceanBase 的全文索引性能明显优于 MySQL。 点击下载 OceanBase 社区版…...
【MySQL 数据库】数据表的操作
🔥博客主页🔥:【 坊钰_CSDN博客 】 欢迎各位点赞👍评论✍收藏⭐ 目录 1. 表的查看 1.1 语法 2. 表的创建 2.1 语法 2.2 练习 3. 查看表结构 3.1 语法 3.2 示例 4. 表的修改 4.1 语法 4.2 示例操作 4.2.1 向表中添加字段…...
(三十七)Dart 中使用 Pub 包管理系统与 HTTP 请求教程
Dart 中使用 Pub 包管理系统与 HTTP 请求教程 Pub 包管理系统简介 Pub 是 Dart 和 Flutter 的包管理系统,用于管理项目的依赖。通过 Pub,开发者可以轻松地添加、更新和管理第三方库。 使用 Pub 包管理系统 1. 找到需要的库 访问以下网址,…...
几款开源网盘的比较
开源网盘 1. Nextcloud2. Seafile3. ownCloud4. Syncthing5. FileBrowser6. Z-File7. kiftd总结对比推荐选择 1. Nextcloud 开发语言:PHP (后端) JavaScript (前端) 官网:https://nextcloud.com/ 特点: 功能全面(文件同步、共享…...
python中的in关键字查找的时间复杂度
列表(List) 对于列表来说, in 运算符的复杂度是 O(n),其中n是列表的长度。这意味着如果列表中有n个元素,那么执行 in 运算符需要遍历整个列表来查找目标元素。 以下是一个示例,演示了在列表中使用 in 运算…...
Windows注册鼠标钩子,获取用户选中的文本
注册鼠标钩子 // 注册鼠标钩子 HHOOK hMouseHook; hMouseHook SetWindowsHookEx(WH_MOUSE_LL, MouseProc, GetModuleHandle(NULL), 0);// 取消鼠标钩子 UnhookWindowsHookEx(hMouseHook); hMouseHook nullptr; 上述代码中MouseProc方法用于处理系统的鼠标消息 处理鼠标消息…...
UE5 蓝图里的反射
蓝图支持使用名字调用函数 使用SetTimerByFunctionName节点即可,该节点是指延后多少时间调用函数,注意时间不能是0也不能是负数,否者不会执行...
私有化视频会议系统,业务沟通协作安全不断线
BeeWorks Meet视频会议平台具备丰富而强大的功能,能够满足企业多样化的业务场景需求。其会议管理功能,让企业能够轻松安排和管理各类会议。 从创建会议、设置会议时间、邀请参会人员到会议提醒,一应俱全,确保会议的顺利进行。多人…...
大数据学习(100)-kafka详解
🍋🍋大数据学习🍋🍋 🔥系列专栏: 👑哲学语录: 用力所能及,改变世界。 💖如果觉得博主的文章还不错的话,请点赞👍收藏⭐️留言📝支持一…...
unittest测试模块:Python 标准库中的单元测试利器
在当今的软件开发中,测试的必要性不言而喻。为了确保代码的质量和稳定性,开发者需要一种高效的方式去编写和运行单元测试。Python 提供了一个强大的工具——unittest。这是一个标准库模块,专为编写和运行测试而设计,帮助开发者减少…...
java后端对时间进行格式处理
时间格式处理 通过java后端,使用jackson库的注解JsonFormat(pattern "yyyy-MM-dd HH:mm:ss")进行格式化 package com.weiyu.pojo;import com.fasterxml.jackson.annotation.JsonFormat; import lombok.AllArgsConstructor; import lombok.Data; import …...
Spring的简单介绍
Spring的简单介绍 Spring 是一个开源的 Java 企业级应用开发框架,旨在简化企业应用的开发过程。它通过提供全面的基础设施支持,帮助开发人员构建可靠的、高效的、可扩展的企业级应用程序。Spring 提供了多种功能模块,支持开发不同类型的应用…...
Python基础知识点(函数2)
#需求 打印stu_info def show_info(name,age): print(f"姓名:{name},年龄:{age}") #1.必要参数 在调用函数的时候必须传值 show_info("tom",3) #注意!对于形参,除了个数要匹配,顺序也要匹配 …...
MySQL的左连接、右连接、内连接、外连接
一、前言 MySQL中的左连接、右连接、内连接和全外连接是用于多表关联查询的核心操作。 二、内连接(INNER JOIN) 定义:返回两个表中完全匹配的行,即只保留两个表连接字段值相等的行。示例场景:查询所有有选课记录的学…...
Springboot JPA ShardingSphere 根据年分表
Spring Boot集成JPA与ShardingSphere实现按年分表,需重点关注分片算法选择、时间字段映射及动态表管理。以下是实现方案: 一、依赖配置 1. 核心依赖引入 <!-- ShardingSphere JDBC --> <dependency><groupId>org.apache.shardi…...
巧记英语四级单词 Unit1-3【晓艳老师版】
light 光,轻的、 grant v.准予,承认 gr官人,ant蚂蚁,外面下着大雨,官人让蚂蚁进来了grind v.摩擦,磨碎 官人在里面的 磨刀,准备找法海给白娘子报仇slight v.稍微的,有点的 light 光…...
Flink 任务调度机制
一、Task 任务调度执行流程 一、Graph 的概念 Flink 中的执行图可以分为四层:StreamGraph -> JobGraph -> ExecutionGraph -> 物理执行图。 StreamGraph:执行用户代码中的 env.execute() 方法后,根据用户通过 Stream API 编写的代码生成的最初的图。用来表示程序的…...
设计模式之享元模式
1. 概念 享元模式(Flyweight Pattern), 运用共享技术有效地支持大量细粒度对象的复用。系统只使用少量的对象,而这些对象都很相似,状态变化很小,可以实现对象的多次复用。 在享元模式中可以共享的相同内容称为内部状态(Intrinsic State)&…...
设计模式 - 策略模式Strategy
设计思想: 策略模式的就是定义一系列算法,将他们一个个封装起来,并且使它们可以相互替换,通常我们的代码中出现大量的if...else...或者switch语句时,我们都可以使用策略模式来优化代码 典型场景: 支付系…...
23种设计模式-行为型模式-策略
文章目录 简介场景解决代码关键实现细节 总结 简介 策略是一种行为设计模式,它能让你定义一系列算法,并将每种算法分别放入独立的类中,以使算法对象能够被替换。 场景 你在开发一款导航应用,类似高德。你要实现自动路线规划的功…...
Ubuntu16.04配置远程连接
配置静态IP Ubuntu16.04 修改超管账户默认密码 # 修改root账户默认密码 sudo passwd Ubuntu16.04安装SSH # 安装ssh服务: sudo apt-get install ssh# 启动SSH服务: sudo /etc/init.d/ssh start # 开机自启 sudo systemctl enable ssh# 如无法连接&…...
window部署虚拟机VirtualBox来部署flink
window通过Cygwin部署flink-1.15.0失败 按理来说Cygwin可以在window模拟unix环境来部署运行flink, 但是在flink 不知从哪个版本开始,flink启动时会在window时创建临时文件夹,传递的文件夹名称参数中有冒号,导致文件夹创建失败&a…...
mac 卸载流氓软件安全助手
之前个人电脑在公司使用过一段时间,为了使用网线联网安装了公司指定的 联软上网助手,谁知安装容易卸载难,后来找运维来卸载,输入管理员密码后,也无反应,最后不了了之了,这个毒瘤软件长期在后台驻…...
java基础使用- 泛型
泛型 泛型作用泛型语法(1) 泛型类/接口(2) 泛型方法 类型参数命名习惯类型通配符(Wildcards)(1) 无界通配符 <?>表示“未知类型”(2) 上界通配符 <? extends T>表示“T 或 T 的子类”。(3) 下界通配符 <? super T>表示“T 或 T 的父…...
Appium的学习总结-Inspector参数设置和界面使用(5)
环境搭建好后,怎么使用呢? 环境这里使用的是: Appium的Server端GUI 22版本 Inspector需要单独下载安装,GUI里并没有集成。 (使用Appium v1.22.0,查看元素信息需要另外安装下载Appium Inspector) 操作&…...
多孔介质电化学:原理、应用与展望
引言 多孔介质广泛存在于自然界与人工材料体系中,从土壤、岩石到电池电极、催化剂载体等。多孔介质电化学作为一门交叉学科,融合了电化学与多孔介质理论,聚焦于电流在充满电解液的多孔介质内的传输规律以及电化学反应在复杂多孔结构中的发生…...
使用Prometheus监控systemd服务并可视化
实训背景 你是一家企业的运维工程师,需将服务器的systemd服务监控集成到Prometheus,并通过Grafana展示实时数据。需求如下: 数据采集:监控所有systemd服务的状态(运行/停止)、资源占用(CPU、内…...
网络游戏服务器如何构建全方位防御体系?DDoS与CC攻击实战防护指南
一、DDoS与CC攻击:游戏服务器的两大“隐形杀手” DDoS攻击:通过僵尸网络发起海量流量冲击,常见形式包括SYN Flood(占满连接队列)、UDP Flood(耗尽带宽)、DNS放大攻击(小查询引发大流…...
geoserver搭建Docker一键直接安装并上传tif影像预览
geoserver搭建Docker一键直接安装 文章目录 geoserver搭建Docker一键直接安装前言一、Docker拉取Geoserver二、运行后使用geoserver进行数据管理进入geoserver调整语言登录geoserver上传一个tif影像建立工作空间并上传自己的tif数据建立图层预览 总结 前言 使用docker安装geos…...
ragflow本地部署(WSL下Ubuntu)
本地docker及 docker-compose版本 安装参考: 实践笔记-docker安装及配置镜像源实践笔记-docker-compose安装 1.下载源码 git clone https://github.com/infiniflow/ragflow.git2.运行docker-compose拉取镜像 cd ragflow/docker docker-compose up -d3.启动报错…...
面试题ing
1、js中set和map的作用和区别? 在 JavaScript 中,Set 和 Map 是两种非常重要的集合类型 1、Set 是一种集合数据结构,用于存储唯一值。它类似于数组,但成员的值都是唯一的,没有重复的值。Set 中的值只能是唯一的,任何…...
我的NISP二级之路-02
目录 一.数据库 二.TCP/IP协议 分层结构 三.STRIDE模型 四.检查评估与自评估 检查评估 自评估 五.信息安全应急响应过程 六.系统工程 七.SSE-CMM 八.CC标准 九.九项重点工作 记背: 一.数据库 关于数据库恢复技术,下列说法不正确的是:…...
私有云平台总体建设方案
一、总体规划 二、项目建设...
前端使用正则表达式提取经纬度 度分秒值
经纬度:1240′0.0″,我想提取度分秒 const regex /(\d\.\d)\s*(\d\.\d)′\s*(\d\.\d)″/; const latMatches record.latDegreeMinuteSecond.match(regex); if (latMatches) {record.latDegree latMatches[1]; // 提取度record.latMinute latMatches[…...
如何在 Windows 11 上查找计算机的 IP 地址?
原文:如何在 Windows 11 上查找计算机的 IP 地址? | w3cschool笔记 在开始之前,我们先来了解一下什么是 IP 地址: 假设你住在一栋公寓楼里,快递员需要把包裹送到你家。为了确保快递能准确送到,你需要提供…...
JavaEE vs JavaSE:Java开发的两大世界深度解析
JavaEE vs JavaSE:Java开发的两大世界深度解析 🌐☕ 前言:Java世界的双子星座 作为一名Java开发者,你是否曾经困惑过JavaSE和JavaEE的区别?是否在选择学习路径时感到迷茫?别担心!今天我们将彻…...
[环境配置] 2. 依赖库安装
依赖库安装 本文档详细介绍深度学习项目所需的核心依赖库安装过程,包括 CUDA、PyTorch 等组件的安装和配置。 CUDA和cuDNN安装 CUDA安装 检查显卡是否支持CUDA: 访问NVIDIA官网查看支持列表使用命令 nvidia-smi 查看显卡信息 下载安装CUDA Toolkit&a…...
No module named ‘keras.api._v2‘
No module named keras.api._v2 解解方法,同: No module named ‘keras.engine‘-CSDN博客...
线性方程组的解法
文章目录 线性方程组的解法认识一些基本的矩阵函数MATLAB 实现机电工程学院教学函数构造1.高斯消元法2.列主元消去法3. L U LU LU分解法 线性方程组的解法 看到以下线性方程组的一般形式:设有以下的 n n n阶线性方程组: A x b \mathbf{Ax}\mathbf{b} A…...
OpenHarmony-5.0.0-Risc-V架构搭建DeepSeek-R1
OpenHarmony-5.0.0-Risc-V架构搭建DeepSeek-R1 参考laval社区的文章:OpenHarmony带你玩转DeepSeekR1大模型 文章目录 OpenHarmony-5.0.0-Risc-V架构搭建DeepSeek-R1前言一、前期准备二、获取源码1.错误示范2.下载 三、编译llama.cpp1.生成makefile2.编译 四、模型文…...
Elixir语言的函数定义
Elixir语言的函数定义 Elixir是一种基于Erlang虚拟机(BEAM)的函数式编程语言,因其并发特性及可扩展性而受到广泛欢迎。在Elixir中,函数是程序的基本构建块,了解如何定义和使用函数对于掌握这门语言至关重要。本文将深…...
Spring MVC 数据绑定教程
一、数据绑定概述 将HTTP请求中的表单数据自动映射到Controller方法的参数中,支持多种数据类型绑定。 二、自动绑定数据类型 2.1 基本数据类型绑定 支持类型 基本类型:int, double 等包装类:Integer, Double 等String 类型 实现步骤 创…...
可发1区的超级创新思路(python 实现):基于时空解耦和对比学习的可解释性模型
首先声明,该模型为原创!原创!原创!且该思路还未有成果发表,感兴趣的小伙伴可以借鉴! 目录 首先声明,该模型为原创!原创!原创!且该思路还未有成果发表,感兴趣的小伙伴可以借鉴! 一、应用领域 二、模型解析 1.1 创新点深度解读 (1) 双路空间解耦架构(双路编码器…...
一个简单的php加密的理解
前言 原帖子 https://www.52pojie.cn/thread-1991616-1-1.html 一段简单的 php 代码加密,大佬使用了一段 python 代码给解密出来了,但是我没太理解整个逻辑 于是在本地跑了一遍,尝试理解整个解密流程,这里记录下整个学习过程 …...
基于微信小程序的高校寝室快修小程序研究
标题:基于微信小程序的高校寝室快修小程序研究 内容:1.摘要 随着高校规模的不断扩大,学生寝室数量增多,寝室设施维修需求日益增长。传统的维修报修方式效率低下,易出现信息传递不及时等问题。本文旨在研究基于微信小程序的高校寝室快修小程序…...
windows11在连接第二屏幕之后没有声音问题
博主在使用HDMI线连接第二个屏幕之后发现没有声音了。经过翻阅资料总结以下几个步骤。 1、拔开HDMI线,观察是否有声音,如果有声音就是HDMI线插上之后的声音输出设备选择问题。 观察下图: 声音输出设备:1、电脑麦克风࿰…...
手撕Tomcat
后端开发进阶:Web APP -> Web 服务器 Jerrymouse Server设计目标如下: 1、支持Servlet 6的大部分功能: 支持Servlet组件; 支持Filter组件; 支持Listener组件; 支持Sesssion(仅限Cookie模式&a…...
oracle 快速创建表结构
在 Oracle 中快速创建表结构(仅复制表结构,不复制数据)可以通过以下方法实现,适用于需要快速复制表定义或生成空表的场景 1. 使用 CREATE TABLE AS SELECT (CTAS) 方法 -- 复制源表的全部列和数据类型,但不复制数据 C…...
InnoDB存储引擎的三大特性
InnoDB存储引擎的三大特性 Buffer Pool 原理:Buffer Poo 是InnoDB存储引擎用于缓存数据页和索引页的内存区域。他提高了数据库的读写性能,因为数据也和索引页在内存中读写比磁盘上快得多。需要访问数据时,InnoDB会在Buffer Pool 中查找&…...
算法初识-时间复杂度空间复杂度
注:观看Adbul Bari算法视频 算法概念 算法:先验分析,不依托于硬件,无语言限制,逻辑。 程序:后验测试,依托硬件,语言限制,实现。 特点: 输入-0或多个输出-至…...