当前位置: 首页 > news >正文

大数据(5)(基础概念)Spark从入门到实战:核心原理与大数据处理实战案例

目录

      • 一、背景介绍
        • 1‌. 为什么需要Spark?‌
        • ‌2. Spark的诞生‌:
      • 二、Spark核心原理
        • 1. ‌四大核心特性‌
        • 2. ‌核心架构‌
        • 3. ‌执行流程‌
      • 三、Spark实战案例
        • 案例1:单词计数(WordCount)
        • 案例2:实时流处理(Structured Streaming)
        • 案例3:Spark SQL数据分析(电商用户行为统计)‌
        • 案例4:MLlib机器学习(鸢尾花分类)‌
        • 案例5:GraphX图计算(社交网络影响力分析)‌
      • 四、Spark优势与适用场景
        • 1. ‌核心优势‌
        • 2. ‌典型应用场景‌
      • 五、总结
        • 未来学习方向:
        • 大数据相关文章(推荐)

一、背景介绍

1‌. 为什么需要Spark?‌

在大数据时代,传统的数据处理框架(如Hadoop MapReduce)由于计算效率低、编程模型复杂等问题,难以满足实时或近实时数据处理的需求

‌2. Spark的诞生‌:

Apache Spark由UC Berkeley AMPLab于2009年开发,2013年成为Apache顶级项目。它以内存计算为核心提供高效的数据处理能力,支持批处理、流处理、机器学习等多种场景,成为大数据领域的核心框架之一。

二、Spark核心原理

1. ‌四大核心特性‌
  • ‌快速计算‌:基于内存计算,比MapReduce快100倍(官方数据)。
  • ‌易用性‌:支持Java、Scala、Python、R等多种语言API。
  • ‌通用性‌:提供Spark SQL(结构化数据)、MLlib(机器学习)、GraphX(图计算)、Spark Streaming(流处理)等组件。
  • ‌容错性‌:通过弹性分布式数据集(RDD)实现自动故障恢复。
2. ‌核心架构‌
  • ‌Driver Program‌:用户编写的程序,负责调度任务。
  • ‌Cluster Manager‌:管理资源(如YARN、Mesos、Standalone)。
  • ‌Executor‌:在Worker节点上执行具体任务。
  • ‌RDD(Resilient Distributed Dataset)‌:
    • ‌弹性‌:支持数据分片、容错恢复。
    • ‌不可变性‌:通过转换(Transformations)生成新RDD。
    • ‌惰性计算‌:仅当执行动作(Actions)时触发计算。
3. ‌执行流程‌
  1. 用户提交任务到Driver。
  2. Driver将任务拆分为Task,通过Cluster Manager分配资源。
  3. Executor在Worker节点执行Task,结果返回Driver。

三、Spark实战案例

案例1:单词计数(WordCount)

‌场景‌:统计文本中每个单词出现的次数。
‌代码实现(Scala)‌:

val textFile = spark.sparkContext.textFile("hdfs://path/to/input.txt")
val wordCounts = textFile.flatMap(line => line.split(" ")).map(word => (word, 1)).reduceByKey(_ + _)
wordCounts.saveAsTextFile("hdfs://path/to/output")

‌关键步骤解析‌:

  1. textFile读取HDFS文件生成RDD。
  2. flatMap将每行拆分为单词。
  3. map将单词转换为键值对(单词, 1)。
  4. reduceByKey对相同单词的计数累加。
案例2:实时流处理(Structured Streaming)

‌场景‌:从Kafka读取实时数据,统计每5秒的点击量。
‌代码实现(Python)‌:

from pyspark.sql import SparkSessionspark = SparkSession.builder.appName("KafkaClickStream").getOrCreate()df = spark.readStream.format("kafka") \.option("kafka.bootstrap.servers", "localhost:9092") \.option("subscribe", "click_events") \.load()query = df.groupBy("user_id").count() \.writeStream.outputMode("complete") \.format("console") \.trigger(processingTime='5 seconds') \.start()query.awaitTermination()

输出结果‌:

Batch: 1
+-------+-----+
|user_id|count|
+-------+-----+
|  user1|  150|
|  user2|  200|
+-------+-----+
案例3:Spark SQL数据分析(电商用户行为统计)‌

加粗样式‌场景‌:分析电商平台用户订单数据,统计用户消费频次与客单价。
‌数据集‌:CSV格式订单数据(字段:user_id, order_id, amount, timestamp)。
‌代码实现(Python)‌:

from pyspark.sql import SparkSession  
spark = SparkSession.builder.appName("ECommerceAnalysis").getOrCreate()  # 读取数据并创建临时视图  
df = spark.read.csv("hdfs://path/to/orders.csv", header=True, inferSchema=True)  
df.createOrReplaceTempView("orders")  # 执行SQL查询  
result = spark.sql("""  SELECT  user_id,  COUNT(order_id) AS order_count,  ROUND(AVG(amount), 2) AS avg_amount  FROM orders  GROUP BY user_id  HAVING order_count > 5  ORDER BY avg_amount DESC  
""")  result.show(10)  

输出示例‌:

+-------+-----------+----------+  
|user_id|order_count|avg_amount|  
+-------+-----------+----------+  
|  userA|         12|   1500.00|  
|  userB|          8|   2200.50|  
+-------+-----------+----------+  

技术点‌:

  • 利用Spark SQL进行结构化数据查询‌7
  • 结合聚合函数与条件过滤实现复杂分析‌18
案例4:MLlib机器学习(鸢尾花分类)‌

‌场景‌:基于鸢尾花数据集训练分类模型,预测花卉种类。
‌数据集‌:经典鸢尾花数据集(含sepal_length, petal_width, species等字段)。
‌代码实现(Scala)‌:

import org.apache.spark.ml.classification.RandomForestClassifier  
import org.apache.spark.ml.evaluation.MulticlassClassificationEvaluator  // 加载数据  
val data = spark.read.format("libsvm").load("iris_libsvm.txt")  // 拆分训练集与测试集  
val Array(train, test) = data.randomSplit(Array(0.8, 0.2))  // 训练随机森林模型  
val rf = new RandomForestClassifier()  .setLabelCol("label")  .setFeaturesCol("features")  .setNumTrees(10)  
val model = rf.fit(train)  // 预测并评估  
val predictions = model.transform(test)  
val evaluator = new MulticlassClassificationEvaluator()  .setMetricName("accuracy")  
println(s"准确率 = ${evaluator.evaluate(predictions)}")  

输出结果‌:

准确率 = 0.96  

‌技术点‌:

  • 使用MLlib内置算法快速构建分类模型‌68
  • 模型评估与参数调优方法‌7
案例5:GraphX图计算(社交网络影响力分析)‌

‌场景‌:识别社交网络中影响力最高的用户(基于PageRank算法)。
‌数据集‌:边列表文件(格式:src_user_id, dest_user_id)。
‌代码实现(Scala)‌:

import org.apache.spark.graphx._  
import org.apache.spark.rdd.RDD  // 构建图结构  
val edges: RDD[Edge[Double]] = spark.sparkContext  .textFile("hdfs://path/to/social_edges.csv")  .map(line => {  val parts = line.split(",")  Edge(parts(0).toLong, parts(1).toLong, 1.0)  })  val graph = Graph.fromEdges(edges, 1.0)  // 运行PageRank算法  
val ranks = graph.pageRank(0.0001).vertices  // 输出Top 10用户  
ranks.sortBy(_._2, ascending=false)  .take(10)  .foreach(println)  

‌输出示例‌:

(1024, 8.72)  
(2048, 7.89)  

‌技术点‌:

  • 图数据建模与算法应用(如PageRank)‌
  • 分布式图计算性能优化技巧‌

四、Spark优势与适用场景

1. ‌核心优势‌
  • ‌性能‌:内存计算减少磁盘I/O。
  • ‌统一引擎‌:批处理、流处理、SQL查询共用同一API。
  • ‌生态系统‌:集成MLlib、GraphX等高级库。
2. ‌典型应用场景‌
  • ‌ETL处理‌:清洗和转换大规模数据。
  • ‌实时分析‌:如电商实时用户行为分析。
  • ‌机器学习‌:训练TB级数据模型。

五、总结

Spark凭借其高效的内存计算能力和丰富的生态系统,已成为大数据处理的首选框架。通过本文的案例,读者可以快速掌握其核心原理和基础编程方法

未来学习方向:
  1. 深入学习Spark SQL优化技巧。
  2. 探索Spark与云原生技术(如Kubernetes)的集成。
  3. 实战复杂场景(如图计算、深度学习)。
大数据相关文章(推荐)
  1. 架构搭建:
    中小型企业大数据平台全栈搭建:Hive+HDFS+YARN+Hue+ZooKeeper+MySQL+Sqoop+Azkaban 保姆级配置指南

  2. 大数据入门:大数据(1)大数据入门万字指南:从核心概念到实战案例解析

  3. Yarn资源调度文章参考:大数据(3)YARN资源调度全解:从核心原理到万亿级集群的实战调优

  4. Hive函数汇总:Hive函数大全:从核心内置函数到自定义UDF实战指南(附详细案例与总结)

  5. Hive函数高阶:累积求和和滑动求和:Hive(15)中使用sum() over()实现累积求和和滑动求和

  6. Hive面向主题性、集成性、非易失性:大数据(4)Hive数仓三大核心特性解剖:面向主题性、集成性、非易失性如何重塑企业数据价值?

  7. Hive核心操作:大数据(4.2)Hive核心操作实战指南:表创建、数据加载与分区/分桶设计深度解析

  8. Hive基础查询:大数据(4.3)Hive基础查询完全指南:从SELECT到复杂查询的10大核心技巧

  9. Hive多表JOIN:大数据(4.4)Hive多表JOIN终极指南:7大关联类型与性能优化实战解析

  10. Hive数据仓库分层架构实战:Hive数据仓库分层架构实战:4层黄金模型×6大业务场景×万亿级数据优化方案

  11. Hive执行引擎选型:大数据(4.6)Hive执行引擎选型终极指南:MapReduce/Tez/Spark性能实测×万亿级数据资源配置公式

  12. Hive查询优化:大数据(4.7)Hive查询优化四大黑科技:分区裁剪×谓词下推×列式存储×慢查询分析,性能提升600%实战手册

  13. Spark安装部署:大数据(5)Spark部署核弹级避坑指南:从高并发集群调优到源码级安全加固(附万亿级日志分析实战+智能运维巡检系统)

  14. Spark RDD编程:大数据(5.1)Spark RDD编程核弹级指南:从血泪踩坑到性能碾压(附万亿级数据处理优化策略+容错机制源码解析)

  15. Spark SQL:大数据(5.2)Spark SQL核弹级优化实战:从执行计划血案到万亿级秒级响应(附企业级Hive迁移方案+Catalyst源码级调优手册)

  16. Spark Streaming:大数据(5.3)Spark Streaming核弹级调优:从数据丢失血案到万亿级实时处理(附毫秒级延迟调优手册+容灾演练全流程)

相关文章:

大数据(5)(基础概念)Spark从入门到实战:核心原理与大数据处理实战案例

目录 一、背景介绍1‌. 为什么需要Spark?‌‌2. Spark的诞生‌: 二、Spark核心原理1. ‌四大核心特性‌2. ‌核心架构‌3. ‌执行流程‌ 三、Spark实战案例案例1:单词计数(WordCount)案例2:实时流处理&…...

Ubuntu小练习

文章目录 一、远程连接1、通过putty连接2、查看putty运行状态3、通过Puuty远程登录Ubuntu4、添加新用户查看是否添加成功 5、用新用户登录远程Ubuntu6、使用VNC远程登录树莓派 二、虚拟机上talk聊天三、Opencv1、简单安装版(适合新手安装)2、打开VScode特…...

运行Spark会出现恶问题

1. 依赖冲突问题:Spark依赖众多组件,如Scala、Hadoop等。不同版本的依赖之间可能存在兼容性问题,导致Spark无法正常运行。比如,特定版本的Spark可能要求与之匹配的Scala版本,若使用了不兼容的Scala版本,会在…...

uniapp大文件分包

1. 在pages.json中配置 "subPackages":[{"root":pagesUser,"pages":[{"path":mine/xxx,"style":xxx },{"path":mine/xxx,"style":xxx}]},{"root":pagesIndex,"pages":[{"p…...

Git 源码打包、迁移、恢复和备份

介绍 Git 项目打包方式,适用于源码交付、迁移、备份等场景。 一 Git 仓库的两种类型 在实际项目开发与交付中,常接触 的 两种 Git 仓库: 仓库类型是否包含源码适用场景普通仓库是本地开发、运行、构建裸仓库否代码托管、只读交付、备份 普…...

Linux 内核网络协议栈中的 struct packet_type:以 ip_packet_type 为例

在 Linux 内核的网络协议栈中,struct packet_type 是一个核心数据结构,用于注册特定协议类型的数据包处理逻辑。它定义了如何处理特定协议的数据包,并通过协议类型匹配机制实现协议分发。本文将通过分析 ip_packet_type 的定义和作用,深入探讨其在网络协议栈中的重要性。 …...

LeetCodeHot100-第三章:数学

面试经典 150 题 - 学习计划 - 力扣(LeetCode)全球极客挚爱的技术成长平台 目录 🎈1、双指针:9. 回文数 🎈2、逻辑题 :66. 加一 🎈3、逻辑题:172. 阶乘后的零 🎈4、…...

JavaScript 错误处理:理解和应对异常

在编程中,错误是不可避免的,特别是在进行复杂的逻辑操作、与外部系统交互或处理用户输入时。错误处理是软件开发中非常重要的一部分,它可以帮助开发者提高应用的稳定性和可用性。本文将深入探讨JavaScript中的错误处理机制,如何利…...

LangGraph异步化sqlite checkpoint

安装 pip install langgraph-checkpoint-sqlite异步checkpiont初始化: from langgraph.checkpoint.sqlite.aio import AsyncSqliteSaver conn aiosqlite.connect(":memory:", check_same_threadFalse) memory AsyncSqliteSaver(conn)如果使用异步流式…...

StarRocks 助力首汽约车精细化运营

作者:任智红,首汽约车大数据负责人 更多交流,联系我们:https://wx.focussend.com/weComLink/mobileQrCodeLink/334%201%202/ffbe5 导读: 本文整理自首汽约车大数据负责人任智红在 StarRocks 年度峰会上的演讲&#xf…...

Versatile-OCR-Program:可以从复杂的教育材料(如试卷)中提取结构化数据的开源多模态OCR工具

Versatile-OCR-Program 此 OCR 系统专门设计用于以针对机器学习 (ML) 训练优化的格式从复杂的教育材料(如试卷)中提取结构化数据。它支持多语言文本、数学公式、表格、图表和图表,非常适合创建高质量的训练数据集。 主…...

时序数据库 TDengine Cloud 私有连接实战指南:4步实现数据安全传输与成本优化

小T导读:在物联网和工业互联网场景下,企业对高并发、低延迟的数据处理需求愈发迫切。本文将带你深入了解 TDengineCloud 如何通过全托管服务与私有连接,帮助企业实现更安全、更高效、更低成本的数据采集与传输,从架构解析到实际配…...

vue项目本地调试使用https

由于测试环境远程接口,是采用https协议,为了能正常携带cookie访问接口,需要把本地项目也采用https协议访问。前提是后端的cookie设置在二级域名下,且允许固定其他子域名跨域访问(需要在后端设置) 项目框架…...

【学习笔记】文件上传漏洞--二次渲染、.htaccess、变异免杀

目录 第十二关 远程包含地址转换 第十三关 突破上传删除 条件竞争 第十四关 二次渲染 第十五关 第十六关 第十七关 .htaccess 第十八关 后门免杀 第十九关 日志包含 第十二关 远程包含地址转换 延续第十一关,加一个文件头,上传成功&#xff0c…...

探秘 MQTT 协议:物联网的 “隐形桥梁”

在当今数字化时代,物联网技术正以前所未有的速度改变着我们的生活。从智能家居到工业自动化,从远程医疗到智能交通,无数设备相互连接、交换信息,构建起一个庞大而复杂的智能世界。而在这背后,有一个关键的 “隐形桥梁”…...

[ctfshow web入门] web24

前置知识 isset:判断这个变量是否声明且不为NULL,否则返回False mt_srand:设置随机数种子,如果不手动设置,那么系统会自动进行一次随机种子的设置 mt_rand:生成一个随机数,这个随机数与种子有个…...

Unity 实现伤害跳字

核心组件: Dotween TextMeshPro 过程轨迹如下图: 代码如下: using System.Collections; using System.Collections.Generic; using DG.Tweening; using TMPro; using UnityEngine; using UnityEngine.Pool;public class …...

在SQLark 中快速生成测试数据

在软件开发与数据库管理过程中,高质量的测试数据是保障系统稳定性和性能优化的关键。然而,手动构造仿真数据不仅耗时耗力,还难以覆盖多样化的测试场景。现在,可以使用 SQLark 的数据生成功能,通过 8大类47子类的数据规…...

Postman接口测试详解

一、为何使用postman postman是一款简单高效的接口测试工具,能够很方便发送接口请求,易于保存接口请求脚本,postman提供接口响应数据比对功能,可以设置预期结果作断言,还能把测试用例放在一个集合中批量执行&#xff…...

[ctfshow web入门] web30

信息收集 题目将flag system php不区分大小写地过滤了 解题 前置知识 print_r:php中用于打印数组 scandir:php中用于获取指点目录下的所以文件目录名 getcwd:获取当前目录 目录获取 这里提供两种方法 print_r(scandir(getcwd())); pri…...

ElasticSearch迁移数据

一、查询索引 1、查询所有索引 curl --user elastic:123456 -XGET "http://localhost:19200/_cat/indices?v&sindex" 2、查询索引配置 以索引名称hello为例 curl --user elastic:123456 -XGET "http://localhost:19200/hello/_settings?pretty" 3…...

ES:账号、索引、ILM

目录 笔记1:账号权限查看、查看账号、创建账号等查看所有用户查看特定用户验证权限修改用户权限删除用户 笔记2:索引状态和内容的查看等查看所有索引查看特定索引内容查看索引映射查看索引设置查看索引统计信息查看ILM策略 笔记1:账号权限查看…...

Spring MVC 逻辑视图(JSP、Thymeleaf、FreeMarker)与非逻辑视图(JSON、Excel、PDF、XML)详解及示例

Spring MVC 逻辑视图与非逻辑视图详解及示例 一、逻辑视图与非逻辑视图的定义 类型定义逻辑视图通过视图解析器(ViewResolver)将逻辑名称(如 success)映射到具体视图实现。非逻辑视图直接返回具体视图对象(如 JsonVie…...

开发体育赛事直播系统:实现聊天交友的私聊功能技术实现全方案解析

基于“东莞梦幻网络科技”体育赛事直播系统,展示前后端技术(PHP ThinkPHP Vue.js Android Java iOS OC)实现的“用户与用户之间私聊”完整方案,包括功能描述、界面效果、技术实现、数据结构、接口设计及关键代码示例。 一、私…...

UTF-8和GBK编码的区别和详细解释

各位看官,大家早安午安晚安呀~~~ 如果您觉得这篇文章对您有帮助的话 欢迎您一键三连,小编尽全力做到更好 欢迎您分享给更多人哦 今天我们来学习:一个小的知识点—UTF-8和GBK编码的解释 1.关于bite位和进制的关系 1 个比特(bit&am…...

java导入excel更新设备经纬度度数或者度分秒

文章目录 一、背景介绍二、页面效果三、代码0.pom.xml1.ImportDevice.vue2.ImportDeviceError.vue3.system.js4.DeviceManageControl5.DeviceManageUserControl6.Repeater7.FileUtils8.ResponseModel9.EnumLongitudeLatitude10.词条 四、注意点本人其他相关文章链接 一、背景介…...

使用python访问mindie部署的vl多模态模型

说明 今天使用mindie1.0部署了qwen2_7b_vl模型,测试过程出现一些问题,这里总结下。 问题1:transformers版本太低 报错信息: [ERROR] [model_deploy_config.cpp:159] Failed to get vocab size from tokenizer wrapper with ex…...

github发布个人中英文简历网站CaoYongshengcys.github.io

在GitHub上创建个人主页(也称为GitHub Pages)是一个展示个人项目、技能和经历的好方法。以下是详细步骤: 1. 创建GitHub账号 • 如果你还没有GitHub账号,先访问GitHub官网注册一个账号。 • 选择一个专业的用户名,因…...

动态规划算法深度解析:0-1背包问题(含完整流程)

简介: 0-1背包问题是经典的组合优化问题:给定一组物品(每个物品有重量和价值),在背包容量限制下选择物品装入背包,要求总价值最大化且每个物品不可重复选取。 动态规划核心思想 通过构建二维状态表dp[i]…...

QML面试笔记--UI设计篇04交互控件

1. QML中常用交互控件 1.1. Button1.2. Slider1.3. ProgressBar1.4. TextField1.5. TextArea1.6. ComboBox1.7. CheckBox1.8. RadioButton1.9. Menu1.10. Dialog 1. QML中常用交互控件 在万物互联的智能时代,QML凭借其‌声明式语法‌和‌跨平台能力‌&#xff0c…...

【数学】线性代数(Python)

参考:https://aibydoing.com/notebooks/appendix01-01-linear-algebra-with-python 目录 矩阵的定义矩阵的运算矩阵的属性矩阵的分解矩阵的本质遗留问题 矩阵的定义 通过数组的维度来区分向量(1 维数组)、矩阵(2 维数组&#xff0…...

ragflow开启https访问:添加证书后,使用浏览器还是有警告,如何解决?

如果在 Windows 系统中安装了 PEM 证书(使用方法一通过证书管理器 MMC 导入),但浏览器仍然提示安全警告,可能有以下几个原因及解决方法: 1. 证书未正确安装到受信任的存储位置 问题:如果证书被导入到错误的存储位置(如“个人”而非“受信任的根证书颁发机构”),浏览器…...

vue.config.js配置代理(输出代理前后的地址)

devServer: {host: 0.0.0.0,port: port,open: true,before(app) {app.use((req, res, next) > {// console.log(原始地址:, req.originalUrl) // 原始地址,如 /api/some-api/xxxxxnext()})},proxy: {[process.env.VUE_APP_BASE_API]: {target: http://192.168.50…...

【八股文】http1.0和1.1的区别

http1.0默认使用短连接,每次请求都需要建立TCP连接(三次握手),响应完成后立即关闭连接,导致资源浪费和延迟增加。 支持通过Connection:Keep-alive 手动开启长连接,但需客户端和服务端显式协商 …...

【Prompt实战】邮件分类专家

本文原创作者:姚瑞南 AI-agent 大模型运营专家,先后任职于美团、猎聘等中大厂AI训练专家和智能运营专家岗;多年人工智能行业智能产品运营及大模型落地经验,拥有AI外呼方向国家专利与PMP项目管理证书。(转载需经授权&am…...

K8S核心技术点

Pod,Service和Deployment的关系 Pod:Kubernetes 中最小的部署单元,用于运行容器化应用。 Service:提供服务发现和负载均衡,为 Pod 提供稳定的网络端点,ClusterIP,NodePort,LoadBala…...

Python手写“随机森林”解决鸢尾花数据集分类问题

Python使用“随机森林”解决鸢尾花数据集分类问题 任务描述解题1. 导入必要的库2. 数据采样函数 sample3. 设置随机种子和超参数4. 定义随机森林类 random_forest5. 加载数据集并划分训练集和测试集6. 创建并训练随机森林模型7. 进行预测并计算准确率 代码 任务描述 您的任务是…...

Python 字典和集合(泛映射类型)

本章内容的大纲如下: 常见的字典方法 如何处理查找不到的键 标准库中 dict 类型的变种set 和 frozenset 类型 散列表的工作原理 散列表带来的潜在影响(什么样的数据类型可作为键、不可预知的 顺序,等等) 泛映射类型 collections.…...

CrystalDiskInfo电脑硬盘监控工具 v9.6.0中文绿色便携版

前言 CrystalDiskInfo是一个不用花钱的硬盘小帮手软件,它可以帮你看看你的电脑硬盘工作得怎么样,健不健康。这个软件能显示硬盘的温度高不高、还有多少地方没用、传输东西快不快等等好多信息。用了它,你就能很容易地知道硬盘现在是什么情况&…...

rqlite:一个基于SQLite构建的分布式数据库

今天给大家介绍一个基于 SQLite 构建的轻量级分布式关系型数据库:rqlite。 rqlite 基于 Raft 协议,结合了 SQLite 的简洁性以及高可用分布式系统的稳健性,对开发者友好,操作极其简便,其核心设计理念是以最低的复杂度实…...

网络1 网络设备

计算机网络设备 集线器: 易发生阻塞:所有端口共享一条带宽,两个端口发生传输时,其他端口若想传输数据给这两个端口,需等待这两个端口传输数据完毕。 端口数量限制:10M带宽下可用15口。15口共享10Md带宽 集线…...

mybatis 某些特殊的 ORA-00979:not a GROUP BY expression

打印的日志sql执行都是正常的 但是 就是报ORA-00979: not a GROUP BY expression 可能是 GROUP BY中不能使用动态参数 或特殊方法 使用 硬编码可以解决问题 <if test"statisticsInVo.timeTypeSql!null and statisticsInVo.timeTypeSql yyyy">TO_CHAR(CARD_T…...

基于OpenCV的图像处理程序设计实践

一.安装OpenCV3.x # 安装依赖 sudo apt update sudo apt install build-essential cmake git libgtk2.0-dev pkg-config libavcodec-dev libavformat-dev libswscale-dev# 下载OpenCV源码 git clone https://github.com/opencv/opencv.git -b 3.4 cd opencv mkdir build &…...

DeepSeek 全套汇总资料pdf免费下载(最新更新8篇)

DeepSeek 全套汇总资料pdf目前仍然在持续更新中&#xff0c;今天更新了8篇&#xff0c;合计的汇总都在这里了&#xff0c;有需要的朋友可以直接去下载了。 后续更新请关注文章&#xff1a;DeepSeek 全套汇总资料pdf免费下载&#xff08;持续更新&#xff09; _ 潘子夜个人博客…...

前端面试题(六):HTTP和HTTPS的区别以及他们如何保障数据安全

HTTP&#xff08;HyperText Transfer Protocol&#xff09;和HTTPS&#xff08;HyperText Transfer Protocol Secure&#xff09;都是用于在互联网上传输数据的协议&#xff0c;但它们之间有一个重要的区别&#xff1a;安全性。 1. HTTP&#xff08;超文本传输协议&#xff09…...

Buffer Pool 的核心作用与工作机制

Buffer Pool 的核心作用与工作机制 1. Buffer Pool 是什么&#xff1f; Buffer Pool 是 InnoDB 存储引擎的核心内存区域&#xff0c;用于 缓存磁盘中的数据页。 作用&#xff1a;通过内存缓存减少直接磁盘 I/O&#xff0c;加速数据库的读写操作。默认大小&#xff1a;通常设…...

使用uglifyjs对静态引入的js文件进行压缩

前言 因为有时候js文件没有npm包&#xff0c;或者需要修改&#xff0c;只能引入静态的js&#xff0c;那么这个时候就可以对js进行压缩了。我其实想通过vite、webpack等插件进行压缩的&#xff0c;可是他都不能定位到public目录下面的文件&#xff0c;所以我只能自己压缩了。编…...

Vue 3 的<Teleport>功能与用法

Vue 3 的 <Teleport> 功能与用法 1. 基本用法 <Teleport> 是 Vue 3 的一个内置组件&#xff0c;允许将组件的内容渲染到 DOM 中的任意位置&#xff0c;而不改变其逻辑结构。以下是基本用法&#xff1a; 定义目标 DOM 元素&#xff1a;<div id"teleport-…...

2025 年江苏交安安全员考试:借助本地培训资源提升能力​

江苏拥有丰富的教育和培训资源&#xff0c;为交安安全员备考提供了有力支持。考生可关注本地专业培训机构开设的交安安全员培训课程&#xff0c;这些课程往往由经验丰富的讲师授课&#xff0c;他们熟悉本地考试特点和行业实际需求。课程内容不仅涵盖考试大纲的知识点&#xff0…...

Umi Max 和 Ant Design Pro 的区别

1、前言&#xff1a; Ant Design Pro Umi Max Umi Max 和 Ant Design Pro 其实关系很紧密&#xff0c;但用途不同、定位不同。 我们一起来搞清楚它们的区别、联系、使用场景&#x1f447; 2、一句话总结 名称作用Umi Max是现代前端框架&#xff0c;用来构建中后台项目&#x…...