数据仓库与数据挖掘记录 二
1.数据仓库的产生
从 20 世纪 80 年代初起直到 90 年代初,联机事务处理一直是关系数据库应用的主流。然而,应用需求在不断地变化,当联机事务处理系统应用到一定阶段时,企业家们便发现单靠拥有联机事务处理系统已经不足以获得市场竞争的优势,他们需要对其自身业务的运作以及整个市场相关行业的态势进行分析,进而做出有利的决策。这种决策需要对大量的业务数据包括历史业务数据进行分析才能得到
。把这种基于业务数据的决策分析称为联机分析处理
。如果说传统联机事务处理强调的是更新数据库(向数据库中添加信息) ,那么联机分析处理就是从数据库中获取信息,利用信息。因此,著名的数据仓库专家 Ralph Kimball写道:“我们花了二十多年的时间将数据放入数据库 ,如今是该将它们拿出来的时候了”。事实上 ,将大量的业务数据应用于分析和统计原本是一种非常简单和自然的想法。但在实际的操作中,人们却发现要获得有用的信息并非如想象得那么容易。
(1) 所有联机事务处理强调的是密集的数据更新处理性能和系统的可靠性,并不太关心数据查询的方便与快捷。
(2) 业务数据往往被存放于分散的异构环境中,不易统一查询访问,而且还有大量的历史数据处于脱机状态 ,形同虚设。
(3) 业务数据的数据库模式针对事务处理系统而设计,数据的格式和描述方式并不适合非计算机专业人员进行业务上的分析和统计。
因此有人感叹: 联机事务处理系统刚上线时 ,查询不到数据是因为数据太少了,而几十年后查询不到有关数据是因为数据太多了。针对这一问题,人们设想专门为业务数据的统计分析建立一个数据中心,它的数据从联机事务处理系统中来,从异构的外部数据源来或从脱机的历史业务数据中来,这个数据中心也是一个联机系统,它专门为分析统计和决策支持应用服务,通过它可获取决策支持和联机分析应用所需要的一切数据。这个数据中心就叫做数据仓库。简单地说,数据仓库就是一个作为决策支持和联机分析应用系统数据源的结构化数据环境,数据仓库要研究和解决的就是从数据库中获取信息的问题。
2.数据仓库技术
数据仓库技术是为了有效地把操作型数据集成到统一的环境中以提供决策型数据访问的各种技术和模型的总称。
2.1 OLAP技术
- 联机事务处理与联机分析处理的比较
数据处理通常分成两大类: 联机事务处理Con-line transaction processing,OLTP)和联机分析处理(on-line analytical processing,OLAP) 。
OLTP 是传统的操作型数据库系统的主要应用,主要是一些基本的日常事务处理,如银行柜台存取款、股票交易和商场 POS 系统等。OLAP 是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。
- OLAP 技术的有关概念
(1) 多维数据集
。多维数据集是联机分析处理的主要对象,它是一个数据集合
,通常从数据仓库的子集构造,并组织汇总成一个由一组维度和度量值定义的多维结构。
(2) 维度
。维度是 OLAP 技术的核心,即人们观察客观世界的角度,通过把一个实体的一些重要属性定义为维(dimension) ,使用户能对不同维属性上的数据进行比较研究
。因此维是一种高层次的类型划分 ,一般都包含层次关系,甚至相当复杂的层次关系。例如,一个企业在考虑产品的销售情况时,通常从时间、销售地区和产品等不同角度来深入观察产品的销售情况。这里的时间 .地区和产品就是维度。而这些维的不同组合和所考查的度量值(如销售额)共同构成的多维数据集则是 OLAP 分析的基础。
(3) 度量值
。度量值也叫度量指标,是多维数据集中的一组数值
,这些值基于多维数据集的事实数据表中的一列,是最终用户浏览多维数据集时重点查看的数值数据,也是所分析的多维数据集的中心值
。如销售量 .成本值和费用支出等都可能成为度量值。
(4) 多维分析。多维分析是指对以维
形式组织起来的数据(多维数据集)采取切片(slice) 、切块(dice) 、钻取(Cdrill down 和 roll up 等)和旋转(pivot)等各种分析动作,以求剖析数据,使用户能从不同角度 ,不同侧面观察数据仓库中的数据,从而深入理解多维数据集中的信息。多维分析操作通常包括如下内容。
钻取
可以改变维的层次,变换分析的粒度,包括向上钻取(roll up)、向下钻取(drildown) 交叉钻取(drill across)和钻透(Cdrill through)等。向上钻取即减少维数 ,是在某一维上将低层次的细节数据概括到高层次的汇总数据; 而向下钻取则正好相反,它从汇总数据深入到细节数据进行观察,增加了维数。
切片和切块
是在一部分维上选定值后,度量值在剩余维上的分布。如果剩余维有两
个则是切片,如果有三个则是切块。
旋转
是变换维的方向,即在表格中重新安排维的放置,例如行列互换。
总结:
OLAP 技术是使分析人员、管理人员或执行人员能够从多角度对信息进行快速、一致、交互的存取,进而获得对数据深入了解的一种软件技术。其目标是满足在多维数据环境下的特定查询与报表需求,以及辅助决策支持的需求。OLAP 技术通常表现为多维数据分析工具的集合
。
- OLAP 的分类
OLAP 根据其存储数据的方式可分为ROLAP .MOLAP 和 HOLAP 三类。
常见的 OLAP 主要是基于多维数据库的 MOLAP 及基于关系数据库的ROLAP 两种
。MOLAP 是以多维数据库的方式组织和存储数据,ROLAP 则利用现有的关系数据库技术来模拟多维数据。
(1) ROLAP
表示基于关系数据库的 OLAP 实现
(relational OLAP) ,它以关系数据库为核心,以关系型结构进行多维数据的表示和存储。ROLAP 将多维数据集的多维结构划分为两类表: 一类是事实表,用来存储度量数据和维关键字; 另一类是维表,即针对每个维使用一个或多个表来存放维的层次、成员类别等维的描述信息。维表和事实表通过主关键字和外关键字联系在一起,形成了“星型模式
”。
对于层次复杂的维 ,为避免冗余数据占用过大的存储空间 ,可以使用多个表来描述这种维度,这实际上是对星型模式的扩展,由此产生的多维数据存储模式称为“雪花型模式”
。
(2) MOLAP
表示基于多维数据结构组织的 OLAP 实现
(multidimensional OLAP) ,它以多维数据组织方式(多维数据库)为核心,例如 MOLAP 使用多维数组来存储数据。多维数据在存储中形成类似“立方块(cube)结构 ,在 MOLAP 中对“立方块”可以不止三维,而是多维 Cube) 的“旋转切块和切片是产生多维数据报表的主要技术 。
(3) HOLAP
表示基于混合数据组织的 OLAP 实现
Chybrid OLAP) ,如低层是关系型的,高层是多维数组矩阵的。这种方式具有更好的灵活性。
3.数据仓库系统的体系结构
一个典型的数据仓库系统通常包含数据源、.数据存储与管理、OLAP 服务器以及前端工具与应用4个部分。
- 数据源
数据源是数据仓库系统的基础,即系统的数据来源 ,通常包括企业(或事业单位)的各种内部信息和外部信息。内部信息,例如存于操作型数据库中的各种业务数据和办公自动化系统中包含的各类文档数据; 外部信息,例如各类法律法规、市场信息、竞争对手的信息以及各类外部统计数据及其他有关文档等。
- 数据的存储与管理
数据的存储与管理是整个数据仓库系统的核心。在现有各业务系统的基础上,对数据进行抽取清理,并有效集成,按照主题进行重新组织 ,最终确定数据仓库的物理存储结构,同时组织存储数据仓库元数据(包括数据仓库的数据字典.记录系统定义、数据转换规则数据加载频率以及业务规则等信息) 。按照数据的覆盖范围和存储规模,数据仓库可以分为企业级数据仓库
和部门级数据仓库
。对数据仓库系统的管理也就是对其相应数据库系统的管理,通常包括数据的安全归档、备份.维护和恢复等工作。
【这里的部门级数据仓库就是数据集市】
- OLAP 服务器
OLAP 服务器对需要分析的数据按照多维数据模型进行重组,以支持用户随时从多角度 .多层次来分析数据 ,发现数据规律与趋势。OLAP 服务器通常有如下3 种实现方式。
(1) ROLAP 基本数据和聚合数据均存放在 RDBMS 之中。
(2) MOLAP 基本数据和聚合数据均存放于多维数据集中。
(3) HOLAP 是 ROLAP 与 MOLAP 的综合,基本数据存放于 RDBMS 之中,聚合数据存放于多维数据集中。
- 前端工具与应用
前端工具主要包括各种数据分析工具、报表工具,查询工具、数据挖掘工具以及各种基于数据仓库或数据集市开发的应用。其中,数据分析工具主要针对 OLAP 服务器; 报表工具、数据挖掘工具既可针对数据仓库,也可针对 OLAP 服务器。
数据仓库系统的体系结构根据应用需求的不同 ,可以分为以下 4 种类型。(1) 两层架构(generic two-level architecture) 。
(2) 独立型数据集市(independent data mart) 。
(3) 依赖型数据集市和操作型数据存储(Cdependent data mart and operational data Store) 。
(4) 逻辑型数据集市和实时数据仓库(logical data mart and real-time data warehouse) 。
3.1两层架构
通常的数据仓库是两层体系结构 ,如图所示。构造这种体系结构需要以下 4 个基本步骤。
(1) 数据是从各种内外部的源系统文件或数据库中抽取得到。在一个大的组织中,可能有几十个甚至几百个这样的文件和数据库系统。
(2) 不同源系统中的数据在加载到数据仓库之前需要被转换和集成。甚至可能需要发送一些事务信息到源系统中,以纠正在数据分段传输中发现的错误。
(3) 建立为决策支持服务的数据库,即数据仓库,它通常会同时包括详细的和概括的数据。
(4) 用户通过 SQL 查询语言或分析工具访问数据仓库,其结果又会反馈到数据仓库和
操作型数据库中。
数据仓库环境最重要的三个环节包括抽取(extract)、转换(Ctransform)及加载(load, 把数据从源数据系统中加载到数据仓库),即 ETL 过程。
抽取和加载通常是定期的,即每天、每星期或每个月。因此 ,数据仓库常常没有或者说不需要有当前数据。数据仓库不支持操作型事务处理,虽然它含有事务型数据(但更多的是事务的概括和变量状态的快照,如账户余额和库存级别等) 。对大多数数据仓库应用来说,用户不是寻找对个别事务的反应,而是寻求包括在整个数据仓库中的一个特定子集上的企业(或其他组织)状态的趋势和模式。例如,通常会有 5 个季度及以上的财务数据保存在数据仓库中,以便识别趋势和模式。太陈旧的数据,如果确定对决策分析已没有意义,也可被清除或存档
3.2 基于独立数据集市的数据仓库体系结构
一些企业或事业组织由于其特殊的业务需求或历史原因,刚开始时并没有建立数据仓库 ,而是创建了许多分离的数据集市。其实,每一个数据集市都是基于数据仓库技术的,而不是基于事务处理的数据库技术。数据集市是范围受限的小型数据仓库(mini warehouses) ,常适用于特定终端用户群制定决策应用。在这种情况下,每个独立数据集市的内容都来自于独立的 ETL 处理过程。下述其他情况的数据集市内容则可能来源于数据仓库。数据集市被设计用来优化定义明确的和可预测的使用性能,通常包括单个或一组针对某特殊应用的查询功能,如市场数据集市.财务数据集市和供应链数据集市等。相对于其他数据仓库体系结构 ,独立型数据集市策略的一个明显特性是: 当需要访问分离的数据集市中的数据时,对终端用户来说具有相对的复杂性(如图 1. 3 所示,由互相交又的连线来表示 ,连线连接所有数据集市到终端用户表示工具) 。这个复杂性不仅来自于从分离的数据集市数据库访问数据,而且可能来自于不一致的数据系统产生的数据集市。如果有一个元数据集合跨越所有的数据集市,且数据集市上的数据通过数据分段传输时保存一致(即数据分段传输中拥有”一致维”) ,那么,对用户来说复杂性就减小了。另一方面是其
ETL 处理的复杂性,因为需要为每一个独立的数据集市创建一个抽取、转换和加载过程。
3.3 基于依赖型数据集市和操作型数据存储的数据仓库体系结构
解决独立数据集市架构局限性的方法之一是使用基于依赖型数据集市(dependent data mart)和操作型数据存储Coperational data store,ODS) 的数据仓库体系结构。通过从企业级数据仓库(Centerprise data warehouse,EDW)中加载依赖型数据集市,在整个体系架构中只使用单一的 ETL 过程 ,确保了 ETL 的效率和数据集市数据的一致性。
企业级数据仓库是一个集中的、集成的数据仓库,它拥有一致的数据版本,并可以对数据作统一控制,对终端用户的决策支持也是可用的。依赖型数据集市的主要目标就是提供一个简单 ,高性能的数据环境,用户群可以访问数据集市,当需要其他数据时,也可以访问企业数据仓库。另外,跨依赖型数据集市的完余在控制之内,且完余的数据是一致的,因为每一个数据集市都是从一个共同的源数据以一种同步的方式加载而来的。
基于依赖型数据集市和操作型数据存储的数据仓库体系结构(如图 1.4 所示)常常被称为“中心和辐射(Chub and spoke)”架构,其中企业级数据仓库是中心,源数据系统和数据集市在输入和输出范围的两端。这种体系结构也被称为合作信息工厂(corporate information factory,CIF) 。在支持所有用户的数据需求中,它被认为是一个全面的企业级的数据视图 。
相对于一般的两层体系结构而言 ,依赖型数据集市的优势是它们可以处理各个用户群的需求,甚至是探索性数据仓库的需求。探索性数据仓库是一种专门的数据仓库版本,它使用先进的统计学 .数学模型和可视化工具来优化,通常用于数据控掘和商业智能等业务模型应用的探索。独立型数据集市的主要优点是可以采用分段方法来开发数据仓库。事实上,分段方法也可以在基于依赖型数据集市和操作型数据存储的体系结构(即 CIF 模式) 中实现。
ODS 为所有的业务数据提供了一个集成的数据源 ,同时也解决了独立数据集市架构不能下钻到更小细节的问题。ODS 实际上是一个集成的面向主题的.可更新的.当前值的(但是可"挥发"的) 企业级的.详细的数据库,也叫运营数据存储。
3.4 基于逻辑型数据集市和实时数据仓库的体系结构
逻辑型数据集市(logical data mart) 和实时数据仓库体系结构实际上只用于一些特定环境的数据仓库系统 ,或使用一些高性能的数据仓库技术时,例如 NCR Teradata 系统。这种体系结构具有如下特征。
(1) 辑数据集市并不是物理上分离的数据库,而是在同一个物理数据库里的、稍微有些不规范的关系数据仓库的不同关系视图。
(2) 数据被放到数据仓库而不是分离的分段传输区域中,利用数据仓库技术的高性能计算能力来执行清洗和转换步又。
(3) 新的数据集市可以非常快地创建,因为不需要创建或获得物理数据库或数据库技术,且不需要书写加载程序。
(4) 数据集市总是最新的,因为涉及到某个视图时,视图中的数据将被建立,如果用户有一系列的查询和分析来清理数据集市中相同的实例,视图可以被物化。
图1.5 中的实时数据仓库 (real time data warehouse )也叫动态数据仓库(active data warehouse) ,它意味着源数据系统.决策支持服务和数据仓库之间以一个接近实时的速度交换数据和业务规则
。事实上,有许多的分析业务需要快速响应系统当前的、全面的组织状况和描述。例如,一些分析型 CRM 系统(特别是 Call Center)的回答问题和日志记录问题,会需要客户最近的销售信息.欠账和付款事务信息、维护活动和订单的有关信息描述。一个重
要事件 ,如输入一个新的产品订单 ,可以立即对客户和客户所在组织的最新状况有一个全面了解
习题
-
数据仓库就是一个 面向主题的 、集成的、相对稳定的 、反映历史变化的数据集合。
-
元数据是描述数据仓库内数据的结构和建立方法的数据,它为访问数据仓库提供了一个信息目录,根据元数据用途的不同可将数据仓库的元数据分为 技术元数据和 业务元数据 两类 。
-
数据处理通常分成两大类: 联机事务处理和 联机分析处理
-
多维分析是指对以“维”形式组织起来的数据(多维数据集)采取 钻取 、切块、切片和旋转等各种分析动作 ,以求剖析数据,使用户能从不同角度.不同侧面观察数据仓库中的数据,从而深入理解多维数据集中的信息。
-
ROLAP 是基于 关系数据库 的 OLAP 实现,而 MOLAP 是基于多维数据结构组织的OLAP 实现。
-
数据仓库按照其开发过程,其关键环节包括数据抽取 、数据存储与管理 和数据表现等。
-
数据仓库系统的体系结构根据应用需求的不同 ,可以分为以下4 种类型;
(1) 两层架构(generic two-level architecture) 。
(2) 独立型数据集市(independent data mart) 。
(3) 依赖型数据集市和操作型数据存储(Cdependent data mart and operational data Store) 。
(4) 逻辑型数据集市和实时数据仓库(logical data mart and real-time data warehouse) 。 -
操作型数据存储实际上是一个集成的`面向主题的、可更新的 、当前值的 (但是可"“挥
发”的) 企业级的、详细的数据库,也叫运营数据存储。
9.“实时数据仓库意味着源数据系统、决策支持服务和数据仓库之间以一个接近实时的速度交换数据和业务规则 。
- 从应用的角度看,数据仓库的发展演变可以归纳为 5 个阶段:以报表为主、以分析为主、以预测模型为主、以营运导向为主 和以实时数据仓库和自动决策为主。
- 什么是数据仓库? 数据仓库的特点主要有哪些?
数据仓库(Data Warehouse, DW)是面向主题(Subject-Oriented)、集成(Integrated)、相对稳定(Non-Volatile)、反映历史变化(Time-Variant)
的 数据集合,用于支持管理决策。 - 简述数据仓库 4 种体系结构的异同点及其适用性。
- 简述你对数据仓库未来发展趋势的看法。
- 请列出 3 种数据仓库产品,并说明其优缺点。
Amazon Redshift(AWS 数据仓库)
简介:
Amazon Redshift 是 AWS 提供的 云数据仓库,基于 PostgreSQL,采用列存储架构,适用于大规模数据分析。
✅ 优点:
高性能:采用并行处理(MPP,Massively Parallel Processing),查询速度快。
弹性扩展:支持按需扩展计算和存储资源。
生态完善:与 AWS 生态系统(S3、Glue、Athena、QuickSight 等)无缝集成。
成本相对较低:相比传统本地数据仓库,按需计费,性价比高。
❌ 缺点:
数据加载有延迟:适用于批处理,不适用于高频实时查询。
SQL 兼容性问题:部分 SQL 语法不兼容标准 PostgreSQL,需要调整代码。
冷启动较慢:集群启动或扩展时可能有一定的等待时间。
Google BigQuery
简介:
BigQuery 是 Google Cloud 提供的 全托管无服务器数据仓库,基于 Dremel 查询引擎,擅长大规模数据分析。
✅ 优点:
无服务器(Serverless):无需管理基础设施,自动扩展。
查询速度极快:支持 分布式列存储 和 向量化执行,适合大规模分析。
支持 SQL 语法:兼容标准 SQL,易于迁移。
与 Google 生态集成:与 Google Analytics、Looker、TensorFlow 等无缝对接。
❌ 缺点:
按查询量收费:基于数据扫描量计费,大数据查询成本较高。
数据更新不友好:适用于分析型查询,不适用于高频事务性操作(OLTP)。
数据传输成本:跨区域数据迁移会产生额外费用。
Snowflake
简介:
Snowflake 是一个 云原生数据仓库,可以运行在 AWS、Azure 和 Google Cloud 之上,采用独特的 存储计算分离架构。
✅ 优点:
计算与存储分离:可以单独扩展计算资源或存储资源,提高资源利用率。
多云支持:同时支持 AWS、Azure、GCP,避免云供应商锁定(Vendor Lock-in)。
自动扩展:可以根据查询负载自动调整计算能力,适合弹性需求。
数据共享方便:支持跨组织的数据共享(Data Sharing)。
❌ 缺点:
价格较高:存储和计算分离后,按需计费可能导致成本不可控。
SQL 语法不完全兼容:部分 SQL 功能需要 Snowflake 特定实现。
依赖云厂商:无法自建,需要依赖第三方云服务。
相关文章:
数据仓库与数据挖掘记录 二
1.数据仓库的产生 从 20 世纪 80 年代初起直到 90 年代初,联机事务处理一直是关系数据库应用的主流。然而,应用需求在不断地变化,当联机事务处理系统应用到一定阶段时,企业家们便发现单靠拥有联机事务处理系统已经不足以获得市场竞争的优势,他们需要对其自身业务的运作以及整个…...
SolidWorks速成教程P3-1【零件 | 第一节】——特征成型介绍拉伸凸台/基体与设计树
零件是由特征构成的,所以零件学习也叫做特征学习。 特征命令,我们可以认为是将二维草图变成三维实体的过程,学习完成后我们就能画出很多东西了,比如画一台手机的外形,学完后我们一起画一个手机支架,来熟练…...
vscode插件Remote - SSH使用教程
Remote - SSH 是一款非常实用的 Visual Studio Code (VSCode) 扩展插件,它允许开发者通过SSH连接到远程服务器,并像在本地一样进行代码编辑和调试。这意味着你可以直接在VS Code中打开位于远程机器上的文件夹,并利用本地安装的VS Code功能,如语法高亮、智能感知、Git集成等…...
sqli_labs_master Less-8 时间盲注,boolen盲注 获取数据库中的表、列
获取当前数据库名 import requestsdef inject_database(url):namemax_length20 # 假设数据库名称最大长度为20# ASCII范围:数字、字母、下划线(_)low{a: 97, z: 122, A: 65, Z: 90, 0: 48, 9: 57, _: 95}high{97: a, 122: z, 65: A, 90: Z,…...
Android Studio:RxJava事件流Observable
一、什么是“事件流”? 简单来说,事件流 就是数据从一个地方(发布者)传递到另一个地方(订阅者)的过程,像是一个“流水线”。发布者发布事件(数据),订阅者则在…...
Influxdb学习 - TSM存储
InfluxDb为什么这么快 InfluxDB 之所以在时序数据场景下表现出色,主要得益于其专为时序数据优化的架构设计和多层次的性能优化策略 专为时序设计:TSM 引擎、列式存储、时间分区等特性直接针对时序数据痛点。写入优化:内存缓存 + 批量刷盘 + 高压缩率,最大化吞吐。查询加速…...
监控系统磁盘 I/O 性能的命令
iostat -x -k 1 是一个用于监控系统磁盘 I/O 性能的命令,下面详细解释该命令以及其输出各项的含义。 命令参数解释 iostat:这是一个用于报告中央处理器(CPU)统计信息和磁盘输入 / 输出统计信息的工具。 -x:显示扩展的…...
NumPy中生成和堆叠数组、生成切片的特殊对象:np.r_ np.c_ np.s_
在NumPy中有三个特殊的对象,非常好用: np.r_:按行连接两个数组,也就是将两个数组垂直堆叠。np.c_:按列连接两个数组,也就是将两个数组水平堆叠。np.s_:生成用于切片的slice对象。 下面详细介绍…...
js计算当(月/年)工作日(除去节假日)时间进度
js封装文件 // 获取当年的节假日12个月的数据 let holidaysArr [[1, 4, 5, 11, 12, 18, 19, 25, 26, 27, 28, 29, 30, 31], // 1月[1, 2, 3, 4, 5, 6, 9, 15, 16, 22, 23], // 2月[], // 3月[4, 5, 6, 12, 13, 19, 20, 26], // 4月[1, 2, 3, 4, 5, 10, 11, 17, 18, 24, 25, …...
zyNo.22
常见Web漏洞解析 命令执行漏洞 1.Bash与CMD常用命令 (1)Bash 读取文件:最常见的命令cat flag 在 Bash 中,cat 以及的tac、nl、more、head、less、tail、od、pr 均为文件读取相关命令,它们的区别如下: …...
服务器绑定 127.0.0.1 和 0.0.0.0 的区别
前言 IP 地址实际上并不是分配给计算机的,而是分配给网卡的,因此当计算机上存在多块网卡时,每一块网卡都会有自己的 IP 地址。 绑定 127.0.0.1 是绑定到 lookback 这个虚拟的本地回环接口,该接口只处理本机上的数据,…...
系统思考—团队学习
“一个人的成长是从问题中学习,而组织的成长是从结构中进化。” —— 彼得圣吉 看似松散的团队学习结构,回头一看,你早已成长了许多。今天和小伙伴们聊起2024年,才发现很多改变,都是在不经意间发生的。 从最初的探索…...
《Python百炼成仙》21-30章(不定时跟新)
第廿一章 列表开天可变序列初成 不周山的擎天玉柱裂开蛛网纹路,山体内部传出数据结构崩塌的轰鸣。叶军踏着《数据结构真解》残页凌空而立,手中薛香的本命玉尺泛起列表操作的幽光: 补天石序列 [五色石] * 9补天石序列[3] 息壤 # 引发链式变…...
element-ui时间组件同一个月内选择/30天内选择
element-ui时间组件同一个月内选择/30天内选择 同一个月 <el-date-picker v-model"time" type"datetimerange"range-separator"至" start-placeholder"开始时间"value-format"timestamp" :picker-options"pickerO…...
【大模型】阿里云百炼平台对接DeepSeek-R1大模型使用详解
目录 一、前言 二、DeepSeek简介 2.1 DeepSeek 是什么 2.2 DeepSeek R1特点 2.2.1 DeepSeek-R1创新点 2.3 DeepSeek R1应用场景 2.4 与其他大模型对比 三、阿里云百炼大平台介绍 3.1 阿里云百炼大平台是什么 3.2 阿里云百炼平台主要功能 3.2.1 应用场景 3.3 为什么选…...
微信小程序配置3 配置sass
1. 在config。json文件里面的setting配置“sass” 2. 改你需要的页面后缀名为scss。 3.查看页面即可看到样式。...
应用层优秀的共享民宿物联网框架该怎么选?
有一说一,应用层优秀的物联网框架通常能帮助提升用户体验、提高运营效率、节能减排等等优势,很多老板也很注重这个层面的设计和打磨,那么对于选择应用层优秀的共享民宿物联网框架时,大家可以从哪几个关键因素进行考量呢࿱…...
macOS 上部署 RAGFlow
在 macOS 上从源码部署 RAGFlow-0.14.1:详细指南 一、引言 RAGFlow 作为一款强大的工具,在人工智能领域应用广泛。本文将详细介绍如何在 macOS 系统上从源码部署 RAGFlow 0.14.1 版本,无论是开发人员进行项目实践,还是技术爱好者…...
postman登录cookie设置
1.设置环境变量, 定义变量存放共享的登录信息 如Cookie 2.登录接口编码test脚本获取cookie信息 let jsessionidCookie pm.cookies.get("JSESSIONID");if (jsessionidCookie) {let cookie "JSESSIONID" jsessionidCookie "; Admin-Tok…...
如何在Linux中设置定时任务(cron)
在Linux系统中,定时任务是自动执行任务的一种非常方便的方式,常常用于定期备份数据、更新系统或清理日志文件等操作。cron是Linux下最常用的定时任务管理工具,它允许用户根据设定的时间间隔自动执行脚本和命令。在本文中,我们将详…...
激光工控机在精密制造中的应用与优势
在精密制造中,激光工控机可以用于许多场景例如 激光切割与雕刻:用于金属、塑料、陶瓷等材料的精密切割和雕刻,适用于汽车、航空航天、电子等行业;可实现复杂图案和高精度加工,满足微米级精度要求。 激光焊接…...
conda的创建
1. 确认 conda 已安装 在使用 conda 创建环境之前,需要确保 conda 已经成功安装在你的系统中。你可以通过在命令行中输入以下命令来检查: conda --version如果已经安装,命令行会显示 conda 的版本号;若未安装,你可以…...
python视频爬虫
文章目录 爬虫的基本步骤一些工具模拟浏览器并监听文件视频爬取易错点一个代码示例参考 爬虫的基本步骤 1.抓包分析,利用浏览器的开发者工具 2.发送请求 3.获取数据 4.解析数据 5.保存数据 一些工具 requests, 用于发送请求,可以通过get,p…...
cv2.Sobel
1. Sobel 算子简介 Sobel 算子是一种 边缘检测算子,通过对图像做梯度计算,可以突出边缘。 Sobel X 方向卷积核: 用于计算 水平方向(x 方向) 的梯度。 2. 输入图像示例 假设我们有一个 55 的灰度图像,像素…...
Oracle入门精读03_Oracle11g安装目录及子目录的结构简介
在Windows2012 Server R2,个人把 Oracle Database 11g安装于硬盘D,如下: 在Oracle Database 11g中,Oracle的目录结构是由Oracle_Base及其子目录cfgtoollogs 、diag 、product、admin、flash_recovery_area和oradata等。这个与Oracle 10G不同的…...
Unity 卡死排查方法(游戏死循环、打包卡死)
适用场景 游戏运行一半卡住了 打包卡住了 工具 visual studio 方法 visual studio 启动工程,调试->附加到Unity,如果开了多个unity,可以用附加到进程找unity 打开线程窗口,调试->窗口->线程 点击暂停按钮&…...
开源、免费项目管理工具比较:2025最新整理30款
好用的开源、免费版项目管理系统有:1.Redmine;2. Taiga;3. OpenProject; 4.ProjectLibre; 5.GanttProject; 6.Tuleap; 7.Trac;8. Phabricator; 9.Notion; 10.…...
AlmaLinux使用Ansible自动部署k8s集群
以下是使用Ansible在AlmaLinux上自动化部署Kubernetes(K8S)集群的详细步骤: 1. 环境准备 1.1 节点规划 至少3台AlmaLinux 9服务器(1个Master,2个Worker)确保所有节点网络互通,SSH免密登录已配…...
Django创建超管用户
在 Django 中创建超级用户(superuser)可以通过命令行工具 createsuperuser 完成。以下是具体步骤: 1. 确保已进行数据库迁移 在创建超级用户前,确保已执行数据库迁移: python manage.py migrate 2. 创建超级用户 …...
机器翻译技术的演进与未来趋势:从规则到神经网络的革新
随着全球化的不断推进和多语言交流的日益频繁,机器翻译(Machine Translation, MT)技术的需求日益增长。机器翻译技术经历了从基于规则的方法到统计方法,再到如今的神经网络方法的发展历程。本文将探讨机器翻译技术的演进过程及其未来趋势,并结合Python代码示例,展示现代机…...
蓝桥杯备赛 Day13.1走出迷宫
链接:走出迷宫 题目描述 小明现在在玩一个游戏,游戏来到了教学关卡,迷宫是一个N*M的矩阵。 小明的起点在地图中用“S”来表示,终点用“E”来表示,障碍物用“#”来表示,空地用“.”来表示。 障碍物不能通…...
Word中Ctrl+V粘贴报错问题
Word中CtrlV粘贴时显示“文件未找到:MathPage.WLL”的问题 Word的功能栏中有MathType,但无法使用,显示灰色。 解决方法如下: 首先找到MathType安装目录下MathPage.wll文件以及MathType Commands 2016.dotm文件,分别复…...
C# Barrier 类使用详解
总目录 前言 Barrier 是 C# 中用于多线程分阶段协同工作的同步工具,位于 System.Threading 命名空间下。它允许多个线程在指定阶段(Phase)的屏障点(Barrier Point)同步,所有线程到达屏障点后,才…...
DeepSeek应用——与word的配套使用
目录 一、效果展示 二、配置方法 三、使用方法 四、注意事项 1、永久化使用 2、宏被禁用 3、office的生成失败 记录自己学习应用DeepSeek的过程...... 这个是与WPS配套使用的过程,office的与这个类似: 一、效果展示 二、配置方法 1、在最上方的…...
基于AIOHTTP、Websocket和Vue3一步步实现web部署平台,无延迟控制台输出,接近原生SSH连接
背景:笔者是一名Javaer,但是最近因为某些原因迷上了Python和它的Asyncio,至于什么原因?请往下看。在着迷”犯浑“的过程中,也接触到了一些高并发高性能的组件,通过简单的学习和了解,aiohttp这个…...
CentOS 7.8 安装MongoDB 7教程
文章目录 CentOS 7.8 安装MongoDB 7教程一、准备工作1. 系统更新2. 权限 二、添加MongoDB软件源1. 创建MongoDB的yum源文件2. 添加以下内容3. 保存并退出编辑器 三、安装MongoDB1. 更新yum缓存2. 安装MongoDB 四、启动MongoDB服务1. 启动MongoDB2. 设置MongoDB开机自启动 五、配…...
瑞芯微开发板/主板Android调试串口配置为普通串口方法 深圳触觉智能科技分享
本文介绍瑞芯微开发板/主板Android调试串口配置为普通串口方法,不同板型找到对应文件修改,修改的方法相通。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联…...
【HDFS】addInternalPBProtocol、setProtocolEngine和registerProtocolAndImpl
本文主要与Hadoop的RPC框架相关 DFSUtil#addInternalPBProtocol: /*** Add protobuf based protocol to the {@link org.apache.hadoop.ipc.RPC.Server}.* This method is for exclusive use by the hadoop libraries, as its signature* changes with the version of the sha…...
springboot239-springboot在线医疗问答平台(源码+论文+PPT+部署讲解等)
💕💕作者: 爱笑学姐 💕💕个人简介:十年Java,Python美女程序员一枚,精通计算机专业前后端各类框架。 💕💕各类成品Java毕设 。javaweb,ssm…...
web3是什么,最简单的介绍
Web3是指第三代互联网技术,也被称为分布式互联网。它是在传统互联网(Web2.0)基础上发展出来的一种新技术体系,旨在通过区块链技术来重新定义人们访问和使用网络服务的方式。以下是关于Web3的详细介绍: 一、核心特点 …...
机器学习 - 词袋模型(Bag of Words)实现文本情感分类的详细示例
为了简单直观的理解模型训练,我这里搜集了两个简单的实现文本情感分类的例子,第一个例子基于朴素贝叶斯分类器,第二个例子基于逻辑回归,通过这两个例子,掌握词袋模型(Bag of Words)实现文本情感…...
【注意】sql语句where条件中的数据类型不一致,不仅存在性能问题,还会有数据准确性方面的bug......
隐式类型转换规则 MySQL 在进行比较操作时,如果比较双方的数据类型不一致,通常会尝试将其中一个数据类型转换为另一个数据类型,以便进行比较。 对于 select * from t_order where order_no 1538808276987285507 ,当 order_no 为 …...
w~大模型~合集30
我自己的原文哦~ https://blog.51cto.com/whaosoft/13284996 #VideoMamba 视频理解因大量时空冗余和复杂时空依赖,同时克服两个问题难度巨大,CNN 和 Transformer 及 Uniformer 都难以胜任,Mamba 是个好思路,让我们看看本文是…...
基于单片机的仓库安防系统(论文+源码)
2.1 需求分析 仓库由于存有大量物品,因此对仓库的监控非常重要,目前仓库已经普遍装有安防系统,以保证仓库的安全,本次基于单片机的仓库安防系统设计,在功能上设计如下: 用户可通过IC卡进入仓库࿱…...
AndroidStudio查看Sqlite和SharedPreference
1.查看Sqlite 使用App Inspection,这是个好东西 打开方式:View → Tool Windows → App Inspection 界面如图: App inspection不但可以看Sqlite还可以抓包network和background task连抓包工具都省了。 非常好使 2.查看sharedPreference 使…...
仿 RabbitMQ 实现的简易消息队列
文章目录 项目介绍开放环境第三⽅库介绍ProtobufMuduo库 需求分析核⼼概念实现内容 消息队列系统整体框架服务端模块数据管理模块虚拟机数据管理模块交换路由模块消费者管理模块信道(通信通道)管理模块连接管理模块 客户端模块 公共模块日志类其他工具类…...
JavaScript基础知识及高频用法
目录 一、语言基础:构建代码逻辑的积木 二、核心概念:理解JavaScript的灵魂 三、高频用法:现代开发必备技巧 四、避坑指南:常见错误与调试 五、学习路线与资源推荐 从入门到实战,掌握现代Web开发基石 作为全球使…...
VUE项目中实现权限控制,菜单权限,按钮权限,接口权限,路由权限,操作权限,数据权限实现
VUE项目中实现权限控制,菜单权限,按钮权限,接口权限,路由权限,操作权限,数据权限实现 权限系统分类(RBAC)引言菜单权限按钮权限接口权限路由权限 菜单权限方案方案一:菜单…...
多机器人系统的大语言模型:综述
25年2月来自 Drexel 大学的论文“Large Language Models for Multi-Robot Systems: A Survey”。 大语言模型 (LLM) 的快速发展为多机器人系统 (MRS) 开辟新的可能性,从而增强通信、任务规划和人机交互。与传统的单机器人和多智体系统不同,MRS 带来独特…...
如何在 Java 应用中实现数据库的主从复制(读写分离)?请简要描述架构和关键代码实现?
在Java应用中实现数据库主从复制(读写分离) 一、架构描述 (一)整体架构 主库(Master) 负责处理所有的写操作(INSERT、UPDATE、DELETE等)。它是数据的源头,所有的数据变…...