拆解 Prompt 工程:五大场景驱动 DeepSeek 超越 ChatGPT
同样的模型、不一样的答案,差距往往发生在一行 Prompt 里。本文围绕五大高频实战场景,给出可直接复制的 DeepSeek 提问框架,并穿插《DeepSeek 行业应用大全》中 64 个行业模板精华,帮助读者迅速跑赢 ChatGPT。🌟
剧透! 文末购书送福利了!
大量视频,光看书都不吃亏!
目录
1. Prompt 工程核心原则——角色·场景·限制·期望(R‑S‑C‑O)
1.1 角色 (Role)
1.2 场景 (Scenario)
1.3 限制 (Constraint)
1.4 期望 (Outcome)
1.5 模板示例
2. 内容创作场景——AIDA·PAS·金字塔三板斧
2.1 AIDA 示范
2.2 模型间对比
3. 代码协作场景——多步思考 + 单元测试注入
3.1 分步拆解策略 (Chain‑of‑Thought)
3.2 Prompt 片段
3.3 效果评估
4. 数据分析场景——表格描述 + JSON 指令
4.1 描述式表格 Prompt
4.2 结构化 JSON Prompt
5. 生活助理场景——多轮上下文 + 用户画像持久化
5.1 用户画像注入
5.2 会话管理
5.3 Prompt 示例
6. 多模型协同——DeepSeek × 开源 LLM 组合拳
7. 实操环节——优化「年终总结」Prompt
7.1 原始 Prompt(154 字)
7.2 优化思路
7.3 优化后 Prompt(88 字)
7.4 效果对比
8. 常见误区与排坑
总结
1. Prompt 工程核心原则——角色·场景·限制·期望(R‑S‑C‑O)
公式:
角色 (Role)
+场景 (Scenario)
+限制 (Constraint)
+期望输出 (Outcome)
虎口要诀: 角色定调,场景定域,限制定边界,期望定格式。
1.1 角色 (Role)
-
精准职业:资深运营、法律顾问、Python 工程师…
-
语气与人格:活泼、严谨、第一人称/第三人称。
1.2 场景 (Scenario)
-
真实业务背景,例如“B 站 3C 数码频道脚本”。
-
关联上下游系统(OA、ERP、CRM)。
1.3 限制 (Constraint)
-
字数、风格、格式(Markdown / JSON)。
-
合规与保密:不得引用内部代码片段。
1.4 期望 (Outcome)
-
明确交付物:表格、代码块、会议纪要。
-
量化衡量:阅读时长 ≤ 3 分钟、信息点 ≥ 5 条。
提示:R‑S‑C‑O 四要素写成四行,排版清晰,模型更容易解析。
1.5 模板示例
角色:资深产品经理
场景:撰写面向 C 端用户的版本更新公告
限制:200 字以内;使用轻松幽默口吻;包含 3 个 Emoji;不出现专业术语
期望:以 Markdown 列表形式输出
👆 以上结构即《行业应用大全》第 1~31 号通用模板的底层逻辑,可按需替换关键词。
2. 内容创作场景——AIDA·PAS·金字塔三板斧
模型 | 公式 | 适用内容 | DeepSeek 提示片段 |
---|---|---|---|
AIDA | Attention → Interest → Desire → Action | 广告文案、社媒帖 | "请使用 AIDA 结构生成…" |
PAS | Problem → Agitation → Solution | 软文、开场白 | "采用 PAS 说服模型,问题点列出…" |
金字塔 | 结论先行 → 关键论点 → 论据 | 白皮书、PRD | "请用金字塔结构拆解…" |
2.1 AIDA 示范
角色:新媒体运营专家
场景:推广线上 Python 训练营
限制:<=100 字;加入 2 个技术痛点
期望:AIDA 结构,Markdown 段落
2.2 模型间对比
-
ChatGPT:英文模板优先,需要手动声明中文。
-
DeepSeek:内置中文句式库,完成度提升 15~30%。
书中连结:章节 2.3 收录 12 条「创意写作」即用提示词,覆盖微信公众号、知乎、短视频脚本。
3. 代码协作场景——多步思考 + 单元测试注入
3.1 分步拆解策略 (Chain‑of‑Thought)
-
理解需求:用
# 请先思考再回答
触发推理。 -
设计算法:输出伪代码而非直接代码。
-
生成代码:根据伪代码输出可运行脚本。
-
自检:让模型生成 pytest 测试。
3.2 Prompt 片段
角色:Python 大师
场景:优化以下冒泡排序代码
限制:必须给出时间复杂度分析;附 1 个 pytest
期望:分四步输出:思考→伪代码→代码→测试
3.3 效果评估
-
DeepSeek:在中文注释与 pytest 均表现稳定;
-
ChatGPT:易在中文注释翻译上偏差。
《行业应用大全》IT & 互联网模块收录 8 条「代码重构/调试」高级模板,可直接引入 VS Code 插件。
4. 数据分析场景——表格描述 + JSON 指令
4.1 描述式表格 Prompt
角色:数据科学家
场景:分析以下销售数据
限制:用 Markdown 表格输出 Top5 城市的 GMV、环比增长、备注
期望:表格下方给出 3 条增长策略
4.2 结构化 JSON Prompt
输出格式严格遵守 JSON Schema:
{"city": string,"gmv": number,"growth": string,"suggestion": string
}
🔍 提示:显式声明 "Only return JSON, no other text.",可让 DeepSeek 减少前后缀。
书中【科技金融】章节内含 "财报分析"、"KPI 预测" 10+ JSON 模板,覆盖各种财务字段。
5. 生活助理场景——多轮上下文 + 用户画像持久化
5.1 用户画像注入
系统提示:
- 名字:Alex
- 职业:UI 设计师
- 偏好:低糖饮食、马拉松
5.2 会话管理
-
意图识别:健康、理财、亲子…
-
槽位填充:日期、预算、目标等。
-
总结并写入记忆:每日跑步公里数。
5.3 Prompt 示例
角色:私人健康教练
场景:根据我的周跑步记录优化下周训练计划
限制:目标 10 KM 赛事;加入拉伸建议
期望:按天列出配速、距离、拉伸
行业模板:书籍【教育培训】【智慧城市】章节中提供“学习计划”“出行助手”等持久化对话蓝本。
6. 多模型协同——DeepSeek × 开源 LLM 组合拳
任务阶段 | 推荐模型 | 理由 |
中文需求解析 | DeepSeek | 方言、俚语鲁棒性高 |
代码生成 | StarCoder / CodeQwen | 代码 Token 化更优 |
英文润色 | GPT‑4o | 长文本一致性佳 |
结果审校 | DeepSeek | 中文差错率低 |
RAG 流程:DeepSeek 负责摘要 → 结果丢入 Faiss 向量库 → Open‑Source LLM 分块问答 → DeepSeek 聚合输出。
7. 实操环节——优化「年终总结」Prompt
目标: 输出长度 ↓30%,要点 ↑2×
7.1 原始 Prompt(154 字)
“请帮我写一篇 1500 字的年终总结,要包含所有项目进度、个人成长和团队贡献。”
7.2 优化思路
-
角色:HR BP
-
场景:P7 后端工程师述职
-
限制:1000 字以内;分三大板块;每板块 3~5 子弹点
-
期望:Markdown 二级标题 + 列表
7.3 优化后 Prompt(88 字)
角色:HR 业务伙伴
场景:P7 后端开发年终述职
限制:1000 字内;3 大板块(项目、成长、团队);每板块 3~5 bullet;语气务实
期望:Markdown 二级标题 + 列表
7.4 效果对比
指标 | 原始 | 优化 | 变化 |
字数 | ≈1500 | ≈980 | ↓34% |
关键要点 | 12 | 24 | ↑100% |
逻辑层次 | 弱 | 强 | – |
挑战:试着把限制放宽到 800 字,同时要求输出 JSON 摘要,观察要点密度变化。
8. 常见误区与排坑
误区 | 现象 | 解决 |
角色缺失 | 模型输出空泛 | 明确职业 & 语气 |
限制过多 | 模型拒答或缩水 | 逐条剔除测试 |
期望含糊 | 格式混乱 | 用示例或 JSON Schema |
直接多语种 | 中英混杂 | 分步翻译而非一次性 |
总结
本文通过五大典型场景演示了 R‑S‑C‑O Prompt 工程套路,并示范了年终总结 Prompt 的性能飞跃。若需快速落地行业方案,可参阅《DeepSeek 行业应用大全》中的 66 个场景指令。欢迎读者在评论区贴出自己的 Prompt 优化案例。
相关文章:
拆解 Prompt 工程:五大场景驱动 DeepSeek 超越 ChatGPT
同样的模型、不一样的答案,差距往往发生在一行 Prompt 里。本文围绕五大高频实战场景,给出可直接复制的 DeepSeek 提问框架,并穿插《DeepSeek 行业应用大全》中 64 个行业模板精华,帮助读者迅速跑赢 ChatGPT。🌟 剧透…...
【解决方案】CloudFront VPC Origins 实践流程深入解析 —— 安全高效架构的实战之道
目录 引言一、VPC Origins 的核心价值(一)安全性提升(二)运维效率优化(三)成本节约(四)全球分发能力的保留 二、VPC Origins 的架构解析(一)流量路径设计&…...
软考 系统架构设计师系列知识点 —— 黑盒测试与白盒测试(2)
接前一篇文章:软考 系统架构设计师系列知识点 —— 黑盒测试与白盒测试(1) 本文内容参考: 黑盒测试和白盒测试详解-CSDN博客 软件测试中的各种覆盖(Coverage)详解-CSDN博客 特此致谢! 二、白…...
【背包dp----01背包】例题三------(标准的01背包+变种01背包1【恰好装满背包体积 产生的 最大价值】)
【模板】01背包 题目链接 题目描述 : 输入描述: 输出描述: 示例1 输入 3 5 2 10 4 5 1 4输出 14 9说明 装第一个和第三个物品时总价值最大,但是装第二个和第三个物品可以使得背包恰好装满且总价值最大。 示例2 输入 3 8 12 6 11 8 6 8输出 8 0说明 装第三个物…...
设计模式之状态模式
在日常开发中,我们经常会遇到这样的场景:一个对象在不同时刻有不同的状态,不同状态下它的行为也会发生变化。此时,使用大量if...else或switch语句会让代码变得混乱而难以维护。为了更优雅地应对这种问题,状态模式(Stat…...
arXiv论文 MALOnt: An Ontology for Malware Threat Intelligence
文章讲恶意软件威胁情报本体。 作者信息 作者是老美的,单位是伦斯勒理工学院,文章是2020年的预印本,不知道后来发表在哪里(没搜到,或许作者懒得投稿,也可能是改了标题)。 中心思想 介绍开源…...
Spark处理过程-转换算子和行动算子
计算时机 转换算子 转换算子是惰性执行的,这意味着在调用转换算子时,系统不会立即进行数据处理。这种惰性计算的方式可以让 Spark 对操作进行优化,例如合并多个转换操作,减少数据的传输和处理量。行动算子 行动算子是立即执行的。…...
使用 pgrep 杀掉所有指定进程
使用 pgrep 杀掉所有指定进程 pgrep 是一个查找进程 ID 的工具,结合 pkill 或 kill 命令可以方便地终止指定进程。以下是几种方法: 方法1:使用 pkill(最简单) pkill 进程名例如杀掉所有名为 “firefox” 的进程&…...
Android学习总结之MMKV(代替SharedPreferences)
Q1:SharedPreferences 为什么会导致 ANR?MMKV 如何从根本上解决? 高频考察点:Android 主线程阻塞原理、SP 同步 / 异步机制缺陷、MMKV 内存映射技术 SP 导致 ANR 的三大元凶: 同步提交(commit ()…...
SWiRL:数据合成、多步推理与工具使用
SWiRL:数据合成、多步推理与工具使用 在大语言模型(LLMs)蓬勃发展的今天,其在复杂推理和工具使用任务上却常遇瓶颈。本文提出的Step-Wise Reinforcement Learning(SWiRL)技术,为解决这些难题带…...
【PostgreSQL数据分析实战:从数据清洗到可视化全流程】7.2 PostgreSQL与Python数据交互(psycopg2库使用)
👉 点击关注不迷路 👉 点击关注不迷路 👉 点击关注不迷路 文章大纲 PostgreSQL与Python数据交互:psycopg2库实战指南一、引言:数据交互的桥梁1.1 psycopg2核心优势 二、环境准备与基础连接2.1 安装配置2.1.1 安装psyco…...
【Prompt工程—文生图】案例大全
目录 一、人物绘图 二、卡通头像 三、风景图 四、logo设计图 五、动物形象图 六、室内设计图 七、动漫风格 八、二次元图 九、日常场景图 十、古风神化图 十一、游戏场景图 十二、电影大片质感 本文主要介绍了12种不同类型的文生图技巧,通过加入不同的图像…...
NVM完全指南:安装、配置与最佳实践
发布于 2025年5月7日 • 阅读时间:10分钟 💡 TL;DR: 本文详细介绍了如何完整卸载旧版Node.js,安装NVM,配置阿里云镜像源,以及设置node_global与node_cache目录,打造高效Node.js开发环境。 📋 目…...
成都养老机器人“上岗”,机器人养老未来已至还是前路漫漫?
近日,成都养老机器人“上岗”引发关注,赛博养老这一概念再次成为人们讨论的焦点,究竟赛博养老未来已来,还是仍需漫长等待,引发诸多思考。 成都研发的养老机器人“上岗”确实标志着智慧养老领域的又一进步,…...
数据中心 第十五次CCF-CSP计算机软件能力认证
总结一下图树算法比如krusal 迪杰斯特拉 prim算法喜欢改变距离定义 或者求别的东西 而拓扑排序喜欢大模拟 本题使用kerusal算法求出最后一条边就可以。 ac代码: #include <iostream> #include <vector> #include <algorithm>using namespac…...
【面试 · 一】vue大集合
目录 vue2 基础属性 组件通信 全局状态管理 vueX 路由 路由守卫 vue3 基础属性 组件通信 全局状态管理 Pinia 路由 路由守卫 vue2、vue3生命周期 setup vue2 基础属性 data:用于定义组件的初始数据,必须是一个函数,返回一个对…...
Java 常用的 ORM框架(对象关系映射)
Java 常用的 ORM(对象关系映射)框架有以下几种,每种都有其特点和使用场景: Hibernate ● 特点: ○ 完整的 ORM 框架,功能强大。 ○ 支持缓存机制(一级缓存、二级缓存)。 ○ 支持多种…...
自动化创业机器人:现状、挑战与Y Combinator的启示
自动化创业机器人:现状、挑战与Y Combinator的启示 前言 AI驱动的自动化创业机器人,正逐步从科幻走向现实。我们设想的未来是:商业分析、PRD、系统设计、代码实现、测试、运营,全部可以在monorepo中由AI和人类Co-founder协作完成…...
支持向量机
支持向量机(Support Vector Machine,SVM)是一种有监督的机器学习算法,可用于分类和回归任务,尤其在分类问题上表现出色。下面将从原理、数学模型、核函数、优缺点和应用场景等方面详细介绍。 原理 支持向量机的基本思…...
华为昇腾910B通过vllm部署InternVL3-8B教程
前言 本文主要借鉴:VLLM部署deepseek,结合自身进行整理 下载模型 from modelscope import snapshot_download model_dir snapshot_download(OpenGVLab/InternVL3-8B, local_dir"xxx/OpenGVLab/InternVL2_5-1B")环境配置 auto-dl上选择单卡…...
ZArchiver解压缩工具:高效解压,功能全面
在使用智能手机的过程中,文件管理和压缩文件的处理是许多用户常见的需求。无论是解压下载的文件、管理手机存储中的文件,还是进行日常的文件操作,一款功能强大且操作简便的文件管理工具都能极大地提升用户体验。今天,我们要介绍的…...
ETL介绍
(一)ETL介绍 “ETL,是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过抽取(Extract)、转换(Transform)、加载(Load)至目的端的过程。ETL一词较…...
2025.05.07-华为机考第三题300分
📌 点击直达笔试专栏 👉《大厂笔试突围》 💻 春秋招笔试突围在线OJ 👉 笔试突围OJ 03. 城市紧急救援队伍协同规划 问题描述 智慧城市建设中,卢小姐负责设计一套紧急救援队伍协同系统。城市被规划为一个 n n n \times n...
缓存菜品-04.功能测试
一.功能测试 redis中的数据已缓存 查询数据时并没有发sql 修改鸡蛋汤价格为5元。 缓存数据没有了 价格修改成功 停售启售是一样的。修改后清理,再次查询又被缓存到redis中。...
跨境电商生死局:动态IP如何重塑数据生态与运营效率
凌晨三点的深圳跨境电商产业园,某品牌独立站运营总监李明(化名)正盯着突然中断的广告投放系统。后台日志显示,过去24小时内遭遇了17次IP封禁,直接导致黑五促销期间损失23%的预期流量。这并非个案——2023年跨境电商行业…...
day 14 SHAP可视化
一、原理——合作博弈论 SHAP(SHapley Additive exPlanations)是一种用于解释机器学习模型预测结果的方法,它基于合作博弈论中的 Shapley 值概念。Shapley 值最初用于解决合作博弈中的利益分配问题。假设有 n 个参与者共同合作完成一项任务并…...
处理PostgreSQL数据库事务死锁过程
查询pg_locks表,获取未得到满足的锁信息: select * from pg_locks where granted is false ; --查询得不到锁的,那就是两个互相等待对方持有的锁查询活动的事务会话进程,和上一步的锁的事务对应起来: select * from …...
大数据、物联网(IoT)、平台架构与设计重构大模型应用
结合大数据、物联网(IoT)、平台架构与设计重构大模型应用,需构建一个数据驱动、实时响应、弹性扩展的智能系统。以下从技术架构、数据流、核心模块设计三个维度展开: 一、整体架构设计 分层架构(基于云-边-端协同): [物联网设备层] → [边缘计算层] → [大数据平台层]…...
开发 Chrome 扩展中的侧边栏图标设置实录(Manifest V3)
在开发自己的 Chrome 扩展 Pocket Bookmarks(口袋书签) 的过程中,我遇到了一个看似简单却颇具挑战的问题:如何在扩展的侧边栏显示自定义图标? 这篇文章记录一下我踩过的坑,以及最终的解决方案。 这里说的侧…...
Baumer工业相机堡盟工业相机如何通过BGAPI SDK在Linux系统下设置多个USB相机(C++)
Baumer工业相机堡盟工业相机如何通过BGAPI SDK在Linux系统下设置多个USB相机(C) Baumer工业相机Baumer工业相机BGAPI SDK在Linux系统下设置USB相机的技术背景Linux系统内核 USB 模块内存的修改内存限制的确定使用 GRUB 引导加载程序修改内存限制使用 U-B…...
zst-2001 历年真题 知识产权
知识产权 - 第1题 发表权有时间限制 其他下面3个没有 c 知识产权 - 第2题 bd是财产权 c 知识产权 - 第3题 b 知识产权 - 第4题 d 知识产权 - 第5题 d 知识产权 - 第6题 d 知识产权 - 第7题 d 知识产权 - 第8题 b是国务院发布的 d没有复制权…...
设备与驱动:UART设备
大部分的嵌入式系统都包括一些I/O设备,例如仪器上的数据显示屏、工业设备上的串口通信、数据采集设备上模拟数据采样、用于保存数据的Flash/SD卡以及网络设备上的以太网接口等,都是嵌入式系统中容易找到的I/O设备例子。 本专栏主要是分享RT-Thread是如何…...
Linux 服务器静态 IP 配置初始化指南
✅ 第一步:确认网络管理方式 运行以下命令判断系统使用的网络管理服务: # 检查 NetworkManager 是否活跃 systemctl is-active NetworkManager# 检查 network(旧服务)是否活跃 systemctl is-active network或者检查配置路径&…...
【ROS2】Nav2源码之行为树定义、创建、加载
1、简述 在 Navigation2 里,机器人的导航是一项复杂的任务,包含路径规划、避障、恢复机制等多个子任务。行为树能把这些子任务组织成清晰的层次结构,让机器人可以依据不同的情况做出合理的决策。例如,当机器人在导航途中碰到障碍物时,行为树可以决定是重新规划路径、尝试…...
Redis持久化存储介质评估:NFS与Ceph的适用性分析
#作者:朱雷 文章目录 一、背景二、Redis持久化的必要性与影响1. 持久化的必要性2. 性能与稳定性问题 三、NFS作为持久化存储介质的问题1. 性能瓶颈2. 数据一致性问题3. 存储服务单点故障4. 高延迟影响持久化效率.5. 吞吐量瓶颈 四、Ceph作为持久化存储介质的问题1.…...
如何统一修改word中所有英文字母的字体格式
1.需求分析 我想让整篇论文中的所有英文字母格式都修改为Time New Roman格式。 2.直观操作流程 点击左上角开始 --> 点击替换 --> 点击更多 --> 点击特殊格式 --> 选择查找内容为任意字母(Y) --> 将光标点到替换内容 --> 点击格式 --> 点击字体 --> …...
服务器上机用到的设备
服务器上机通常需要以下硬件设备: 服务器主机: CPU:选择高性能的多核处理器,如英特尔至强(Xeon)系列或AMD EPYC系列,以满足高并发和多任务处理需求。 内存(RAM)…...
【Java ee 初阶】多线程(8)
Synchronized优化: 一、锁升级 锁升级时一个自适应的过程,自适应的过程如下: 在Java编程中,有一部分的人不一定能正确地使用锁,因此,Java的设计者为了让大家使用锁的门槛更低,就在synchronize…...
数字孪生大屏UI设计
近年来,5G、大数据、云计算等新一代信息技术的蓬勃发展,计算机仿真技术与拟真软件的成熟运用,让数字孪生技术开始蔓延渗透到“互联网”相关的产业中。数字孪生大屏给予了可视化的数据直观窗口,其中展现的动态映射与实时数据让业务流转效率得到了有效提升,管理、运营和决策都能高…...
【Java ee 初阶】多线程(9)上
一、信号量Semaphore 本质上就是一个计数器,描述了一种“可用资源”的个数 申请资源(P操作):使得计数器-1 释放资源(V操作):使得计数器1 如果计数器为0了,继续申请资源ÿ…...
eclipse开发环境中缺少JavaEE组件如何安装
新版本eclipse去掉server了吗?在最近新版本的eclipse里面,确实找不到server模块了,无法配置tomcat等web服务器插件了。我们需要自己手工安装一下javaEE组件才行。 1 1:找到自己当前eclipse版本号码 2:去这个地址&…...
stm32之ADC
目录 1.简介2.逐次逼近型ADC3.基本结构4.输入通道5.转换模式6.触发控制7.数据对齐8.转换时间7.校准10.ADC外围电路11.api和结构体11.1 结构体11.2 api1. ADC_DeInit2. ADC_Init3. ADC_StructInit4. ADC_Cmd5. ADC_DMACmd6. ADC_ITConfig7. ADC_ResetCalibration8. ADC_GetReset…...
从电话到V信语音:一款App实现全场景社交脱身
作为一名资深社恐人士,我深知那些无法脱身的社交场合有多煎熬。上周参加一个行业聚会,面对滔滔不绝的陌生人,我如坐针毡却又找不到合适的离场理由。这时我突然想起之前朋友推荐的一款神器应用,它让我得以优雅脱身。今天就来分享这…...
conda init before conda activate
先conda init 然后退出命令窗口,再重新打开命令窗口再conda activate...
MySQL数据库高可用(MHA)详细方案与部署教程
一:MHA简介 核心功能 二:MHA工作原理 三:MHA组件 四:MHA 架构与工具 MHA架构 Manager关键工具 Node工具 五:工作原理与流程 1: 故障检测 2: 故障切换(Failover) 3 : 切换模式 六&a…...
《Python星球日记》 第44天: 线性回归与逻辑回归
名人说:路漫漫其修远兮,吾将上下而求索。—— 屈原《离骚》 创作者:Code_流苏(CSDN)(一个喜欢古诗词和编程的Coder😊) 专栏:《Python星球日记》,限时特价订阅中ing 目录 一、引言:回归方法的重要性二、线性回归原理与损失函数1. 线性回归的数学模型2. 损失函数:衡量…...
Flutter TabBar / TabBarView 详解
目录 一、引言 二、基本用法 代码解析 三、主要属性 3.1 TabBar 3.2 TabBarView 四、进阶定制:突破默认样式 4.1 视觉样式深度定制 4.2 自定义指示器与标签 4.3 动态标签管理 五、工程实践关键技巧 5.1 性能优化方案 5.2 复杂手势处理 5.3 响应式布局…...
001 环境搭建
🦄 个人主页: 小米里的大麦-CSDN博客 🎏 所属专栏: Linux_小米里的大麦的博客-CSDN博客 🎁 GitHub主页: 小米里的大麦的 GitHub ⚙️ 操作环境: Visual Studio 2022 文章目录 Linux 环境搭建全解析:从历史到实践一、Linux 的起源与…...
Spark-core-RDD入门
RDD基本概念 Resilient Distributed Dataset 叫做弹性分布式数据集,是Spark中最基本的数据抽象,是分布式计算的实现载体,代表一个不可变,可分区,里面的元素并行计算的集合。 - Dataset: 一个数据集合&…...
在scala中,转换算子和行动算子有什么区别
在Scala结合Spark编程中,转换算子(Transformation)和行动算子(Action)有以下区别: 执行机制 **转换算子**: 具有惰性求值(延迟计算)特性 。它对RDD(弹性分布…...