AWS Glue基础知识
AWS Glue 是一项完全托管的 ETL(提取、转换、加载)服务,与考试相关,尤其是在数据集成、处理和分析方面。
1.数据集成和 ETL(提取、转换、加载)
- AWS Glue 主要用于构建 ETL 管道以准备数据以进行分析。作为解决方案架构师,您需要知道如何设计涉及集成和转换数据的解决方案,而 AWS Glue 是该领域的关键服务。
- 使用案例 包括:
- 在不同数据存储之间移动数据(例如,从 S3 移动到 Redshift,或从 DynamoDB 移动到 S3)。
- 下游分析的数据清理、转换和准备。
- 组件:AWS Glue 包含 ETL 作业、爬虫和数据目录等元素。ETL 作业负责数据的提取、转换和加载;爬虫会探索数据源,填充数据目录;数据目录则存储元数据。
- 自动化 ETL:它通过提供预构建的函数、通往各类数据源的连接器以及托管式执行环境,简化了 ETL 流程。这减少了常规数据管道的手动编码工作。
相关主题: - 数据存储和管理解决方案(例如 S3、Redshift、RDS)。
- 集成数据处理服务。
2.数据湖和分析
- AWS Glue 在数据湖架构中发挥着至关重要的作用。它可以对存储在 Amazon S3 中的原始数据进行编目,并将其转换为结构化格式,以供 Amazon Athena 和 Amazon Redshift 等服务查询。
- AWS Glue Data Catalog 是数据湖的核心组件,为数据集提供统一的元数据存储库,从而可以轻松查询存储在各种服务中的数据。
相关主题:
- 设计数据湖(例如,使用 S3、Glue、Athena)。
- 无服务器分析解决方案(例如 Athena、Redshift Spectrum、Glue)。
3.AWS Glue 数据目录
- Glue Data Catalog 是一个中央元数据存储库,用于存储表定义、作业定义和其他用于数据处理和分析的必要元数据。
- 它与其他 AWS 服务集成,包括 Amazon Athena、Amazon Redshift Spectrum 和 AWS Glue ETL 作业。
相关主题: - 将 AWS Glue 数据目录与分析和查询服务结合使用。
- 元数据管理和数据管理的最佳实践。
4.无服务器架构
- AWS Glue 是一项完全托管的无服务器服务。它抽象出底层基础设施,使架构师能够专注于数据管道,而不是管理计算资源。
- 了解无服务器架构在考试中非常重要,因为解决方案通常利用 AWS Glue 等完全托管的服务来实现可扩展性、成本效益和简单性。
相关主题:
- 设计无服务器架构(例如,使用 AWS Glue、Lambda、API Gateway)。
- 无服务器数据处理工作流。
5.安全和权限
- 使用 AWS Glue 时,安全性是一个关键考虑因素。您需要知道如何管理数据处理作业的权限、加密和访问控制。
- AWS Identity and Access Management (IAM)** 用于控制对 AWS Glue 资源的访问,并且可以为存储在 S3 中的数据或通过 Glue 作业处理的数据启用加密。
- Glue 作业 可以配置为使用具有最低权限原则的 IAM 角色来确保安全性。
相关主题:
- 管理访问控制和权限(IAM、KMS)。
- 静态和传输中的数据加密。
- 保护 ETL 工作流。
6.AWS Glue 作业和工作流
- AWS Glue 作业允许在数据源之间转换和移动数据,您可能需要设计和配置能够以自动化方式执行这些操作的作业。
- Glue 工作流的概念使您能够创建和管理一系列依赖作业。
- 了解 Glue 作业的 类型 (Python、Scala、Spark) 以及这些作业针对各种处理任务的配置非常重要。
相关主题: - 使用 AWS Glue 设计自动化工作流。
- 配置数据转换和移动作业。
- 监控和排查 Glue 作业。
7.数据处理与大数据
- AWS Glue 可以处理批处理数据和流数据。它与 Amazon Kinesis、Amazon Redshift 和 Amazon S3 集成,以实现实时和批处理。
- 涉及大数据架构的解决方案可能包括 AWS Glue 作为数据管道的一部分。
相关主题:
- 使用 Glue、EMR、Redshift 和 Athena 等服务进行大数据处理。
- 设计实时和批处理解决方案。
- 使用 AWS 服务构建大数据管道。
8.成本优化
- 由于 AWS Glue 是无服务器的,因此它会根据数据大小和工作负载自动扩展。了解 AWS Glue 的成本模型,包括数据处理单元 (DPU) 的定价以及如何优化成本,是考试的一个关键领域。
- 作为解决方案架构师,您需要设计不仅可扩展且经济高效的解决方案,这包括管理 AWS Glue 的使用。
相关主题:
- 使用 AWS 服务的成本优化策略。
- AWS Glue 等无服务器服务的定价模型。
要回顾的关键 AWS Glue 概念:
- AWS Glue Studio,用于可视化 ETL 作业设计。
- AWS Glue 爬网程序,用于在 S3 中发现和分类数据。
- AWS Glue 触发器,用于根据事件自动执行作业。
- AWS Glue Dynamic Frames 用于处理半结构化数据。
AWS Glue 数据目录
- 元数据管理:充当元数据的核心枢纽,存储有关数据源、表模式及关系的详细信息,便于在 AWS 各项服务间无缝发现数据。
- 表与模式管理:支持创建、删除和修改表条目。您能够定义列、数据类型以及分区信息,从而实现有序的数据访问。
ETL 作业与爬虫
- ETL 作业创建:可通过 AWS 控制台、命令行界面(CLI)或软件开发工具包(SDK)来创建。作业可用 Python 或 Scala 等语言编写脚本,并借助 Spark 提升处理能力。
- 模式发现:爬虫会分析 S3、RDS 等数据源中的数据。它们自动检测列名、数据类型和分区,无需手动输入模式信息即可填充数据目录。
AWS Glue 安全
- IAM 角色与策略:IAM 角色会关联到 Glue 作业上,这些角色附带的策略规定了访问权限,诸如对 S3 存储桶的读/写权限,或是访问 RDS 数据库的权限。
- 加密:对于静态数据,可使用 AWS KMS 密钥加密 S3 中的数据。在传输过程中,SSL/TLS 协议会保障 Glue 组件与数据源之间的数据安全。
用于数据集成的 Glue
- 连接数据源:拥有针对 S3、RDS、Redshift 等的原生连接器,能够流畅地从多个存储库摄取数据。
- 转换语言:支持 Python、Scala 和 Spark SQL。尤其是 Spark,为复杂的数据操作提供了丰富的函数集。
Glue 触发器与调度
- 基于事件的触发器:当诸如 S3 中有新文件到达这类事件发生时,能够触发作业。定时触发器则使用 cron 表达式,按设定的时间间隔(如每天或每周)运行作业。
监控与日志记录
- CloudWatch 监控:CloudWatch 追踪作业指标,像是执行时间、资源利用率以及成功/失败率。CloudWatch 中的日志会提供详细的错误消息,便于调试。
- 错误处理:最佳实践包括在 CloudWatch 中设置告警、分析堆栈跟踪信息,以及在作业脚本中使用重试机制。
Glue 作业性能
- 优化:涉及数据分区、选用合适的数据处理单元(DPU),以及选择恰当的数据格式。例如,对于大型数据集,Parquet 格式性能更佳。
- 资源配置:可依据数据量调整 DPU。也能微调内存分配,防止处理过程中出现瓶颈。
二、注意事项
- 动手实践:不要只死记硬背概念,要使用 AWS Glue 控制台、CLI 和 SDK 构建示例 ETL 管道、爬虫,并管理数据目录。
- 理解服务交互:由于 Glue 与众多 AWS 服务交互,需知晓它与 S3、Redshift 和 Athena 的协同方式。例如,Glue 元数据的变更会如何影响 Athena 查询。
- 跟进更新:AWS 服务在不断演进,要及时了解 Glue 的新特性、安全增强功能,或是定价模式的变动。
相关文章:
AWS Glue基础知识
AWS Glue 是一项完全托管的 ETL(提取、转换、加载)服务,与考试相关,尤其是在数据集成、处理和分析方面。 1.数据集成和 ETL(提取、转换、加载) AWS Glue 主要用于构建 ETL 管道以准备数据以进行分析。作为…...
单片机-LED实验
1、51工程模版 #include "reg52.h" void main(){ while(1){ } } 2、LED灯亮 #include "reg52.h" sbit LED1P2^0; void main(){ while(1){ LED10; } } 3、LED闪烁 #include "reg52.h" sbit LED1P2^0; //P2大…...
使用Python实现健康跟踪应用:打造智能健康管理助手
随着人们对健康的关注日益增强,智能健康管理逐渐成为热门趋势。通过持续跟踪身体状况、饮食、运动和睡眠等方面的数据,我们可以更好地了解自己的健康状态,并采取相应的措施来保持身体健康。Python,作为一种简洁且功能强大的编程语言,非常适合用来开发健康跟踪应用。本文将…...
结构型模式6.享元模式
结构型模式 适配器模式(Adapter Pattern)桥接模式(Bridge Pattern)组合模式(Composite Pattern)装饰器模式(Decorator Pattern)外观模式(Facade Pattern)享元…...
AWS S3文件存储工具类
pom依赖 <!--aws-s3--> <dependency><groupId>com.amazonaws</groupId><artifactId>aws-java-sdk-s3</artifactId><version>1.12.95</version></dependency>S3Utils import cn.hutool.core.util.ZipUtil; import com.a…...
MacDriver 项目推荐
MacDriver 项目推荐 macdriver Native Mac APIs for Go. Soon to be renamed DarwinKit! 项目地址: https://gitcode.com/gh_mirrors/ma/macdriver 1. 项目基础介绍和主要编程语言 MacDriver 是一个开源项目,旨在为 Go 语言提供原生的 macOS API 支持。该项…...
笔记:一次mysql主从复制延迟高的处理尝试
背景 mysql 5.7 主从复制 主库进行了一次灌数,导致多个大事务产生,主从延迟下不去,经确认该表最终truncate,并且该表仅有insert和select操作,故对该表的事务进行跳过,直到同步至truncate 跳过事务需谨慎&…...
《Vue3实战教程》40:Vue3安全
如果您有疑问,请观看视频教程《Vue3实战教程》 安全 报告漏洞 当一个漏洞被上报时,它会立刻成为我们最关心的问题,会有全职的贡献者暂时搁置其他所有任务来解决这个问题。如需报告漏洞,请发送电子邮件至 securityvuejs.org。…...
Linux 基础 6.进程
文章目录 6.1 进程和程序1. **程序 (Program)**2. **进程 (Process)**3. **程序与进程的区别**4. **进程的创建与执行**5. **总结** 6.2 进程号和父进程号1. **进程号 (PID)**2. **进程号的分配**3. **父进程号 (PPID)**4. **进程树结构**5. **进程号的限制与调整**6. **总结**…...
LeetCode:700.二叉搜索树中的搜索
跟着carl学算法,本系列博客仅做个人记录,建议大家都去看carl本人的博客,写的真的很好的! 代码随想录 LeetCode:700.二叉搜索树中的搜索 给定二叉搜索树(BST)的根节点 root 和一个整数值 val。 你…...
web实操9——session
概念 数据保存在服务器HttpSession对象里。 session也是域对象,有setAttribute和getAttribute方法 快速入门 代码 获取session和塞入数据: 获取session获取数据: 请求存储: 请求获取: 数据正常打印:…...
有哪几种方法可以使html脱离文档流?
position: absolute:会使元素脱离文档流,并且相对于最近的已定位的祖先元素进行定位。如果没有已定位的祖先元素,则相对于 <html> 元素定位。 元素脱离文档流,不再占据空间。 不会影响后续元素的位置和布局。 可以通过 top、right、…...
戴尔/Dell 电脑按什么快捷键可以进入 Bios 设置界面?
BIOS(基本输入输出系统)是计算机硬件与操作系统之间的桥梁,它负责初始化和测试系统硬件组件,并加载启动操作系统。在某些情况下,如调整启动顺序、更改系统时间或日期、修改硬件配置等,您可能需要进入BIOS进…...
Fast R-CNN模型详解及分析
模型背景 在目标检测领域的发展历程中,R-CNN系列模型标志着一个重要转折点。然而,在Fast R-CNN问世之前,这一领域的研究仍面临一些显著挑战: 计算效率低下 :早期模型如R-CNN和SPPNet虽然在准确性方面取得进展,但在计算效率上仍有待提高。特别是R-CNN需要多次运行CNN并单…...
android studio 写一个小计时器(版本二)
as版本:23.3.1patch2 例程:timer 在前一个版本的基本上改的,增加了继续的功能,实现方法稍微不同。 动画演示: activity_main.xml <?xml version"1.0" encoding"utf-8"?> <androidx…...
STM32完全学习——使用定时器1精确延时
一、定时器的相关配置 首先一定要是递减定时器,递增的不太行,控制的不够准确,其次在大于10微秒的延时是非常准确的,小于的话,就没有那没准,但是凑合能用。误差都在一个微秒以内。使用高级定时器也就是时钟…...
如何在 Ubuntu 22.04 上安装 Cassandra NoSQL 数据库教程
简介 本教程将向你介绍如何在 Ubuntu 22.04 上安装 Cassandra NoSQL 数据库。 Apache Cassandra 是一个分布式的 NoSQL 数据库,旨在处理跨多个普通服务器的大量数据,并提供高可用性,没有单点故障。Apache Cassandra 是一个高度可扩展的分布…...
【MATLAB第112期】基于MATLAB的SHAP可解释神经网络回归模型(敏感性分析方法)
【MATLAB第112期】基于MATLAB的SHAP可解释神经网络回归模型(敏感性分析方法) 引言 该文章实现了一个可解释的神经网络回归模型,使用BP神经网络(BPNN)来预测特征输出。该模型利用七个变量参数作为输入特征进行训练。为…...
小程序学习06——uniapp组件常规引入和easycom引入语法
目录 一 组件注册 1.1 组件全局注册 1.2 组件全局引入 1.3 组件局部引入 页面引入组件方式 1.3.1 传统vue规范: 1.3.2 通过uni-app的easycom 二 组件的类型 2.1 基础组件列表 一 组件注册 1.1 组件全局注册 (a)新建compoents文件…...
回归预测 | MATLAB实现CNN-BiLSTM-Attention多输入单输出回归预测
回归预测 | MATLAB实现CNN-BiLSTM-Attention多输入单输出回归预测 目录 回归预测 | MATLAB实现CNN-BiLSTM-Attention多输入单输出回归预测预测效果基本介绍程序设计参考资料 预测效果 基本介绍 一、方法概述 CNN-BiLSTM-Attention多输入单输出回归预测方法旨在通过融合CNN的局…...
直接插入排序、折半插入排序、2路插入排序、希尔排序
本篇是排序专栏博客的第一篇,主要探讨以 “插入” 为核心思想的排序算法该如何实现 文章目录 一、前言二、直接插入排序1. 算法思想与操作分析2. 代码实现version 1version 2 3. 复杂度分析 三、折半插入排序1. 算法思想与操作分析2. 代码实现3. 复杂度分析 四、2路…...
HTML-列表标签
列表是一系列排列好的项目,主要分成两类:有序列表和无序列表。 有序列表是每个列表项前面有编号,呈现出顺序,就像下面这样。 1. 列表项 A 2. 列表项 B 3. 列表项 C无序列表则是列表项前面没有编号,只有一个列表符号&…...
计算机网络原理(一)
嘿! 新年的第一篇博客,大家新年快乐呀!希望大家新的一年要多多进步噢! 1.TCP/IP的四层/五层参考模型有哪些层,各层的特点是?计算机网络分层的好处是? TCP/IP 四层参考模型 应用层:直接为用户…...
扩散模型论文概述(二):Google系列工作【学习笔记】
视频链接:扩散模型论文概述(二):Google系列工作_哔哩哔哩_bilibili 本视频讲的是Google在图像生成的工作。 同样,第一张图片是神作,总结的太好了! 在生成式AI的时代,OpenAI和Google不…...
第四届计算机、人工智能与控制工程
第四届计算机、人工智能与控制工程 The 4th International Conference on Computer, Artificial Intelligence and Control Engineering 重要信息 大会官网:www.ic-caice.net 大会时间:2025年1月10-12日 大会地点:中国合肥 (安徽大学磬苑…...
UE4.27 Android环境下获取手机电量
获取电量方法 使用的方法时FAndroidMisc::GetBatteryLevel(); 出现的问题 但是在电脑上编译时发现,会发现编译无法通过。 因为安卓环境下编译时,包含 #include "Android/AndroidPlatformMisc.h" 头文件是可以正常链接的,但在电…...
【人工智能】基于Python与OpenCV构建简单车道检测算法:自动驾驶技术的入门与实践
《Python OpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门! 解锁Python编程的无限可能:《奇妙的Python》带你漫游代码世界 随着自动驾驶技术的快速发展,车道检测作为自动驾驶系统中的一个重要组成部分,起着至关重要的作用。本文将介绍如何利用Python与OpenCV库构…...
永磁同步电机控制算法--最大转矩电流比控制(牛顿迭代法)
一、原理介绍 搭建了基于牛顿迭代法的MTPA双闭环矢量控制系统 二、仿真验证 在MATLAB/simulink里面验证所提算法,采用和实验中一致的控制周期1e-4,电机部分计算周期为1e-6。仿真模型如下所示: 对直接公式计算法和牛顿迭代法进行仿真对比验…...
基于51单片机(STC32G12K128)和8X8彩色点阵屏(WS2812B驱动)的小游戏《贪吃蛇》
目录 系列文章目录前言一、效果展示二、原理分析三、各模块代码1、定时器02、矩阵按键模块3、8X8彩色点阵屏 四、主函数总结 系列文章目录 前言 《贪吃蛇》,一款经典的、怀旧的小游戏,单片机入门必写程序。 以《贪吃蛇》为载体,熟悉各种屏幕…...
Ceph 手动部署(CentOS9)
#Ceph手动部署、CentOS9、squid版本、数字版本19.2.0 #部署服务:块、对象、文件 一、部署前规划 1、兼容性确认 2、资源规划 节点类型节点名称操作系统CPU/内存硬盘网络组件安装集群节点CephAdm01CentOS94U/8GOS:40G,OSD:2*100GIP1:192.169.0.9(管理&集群),IP2:…...
Reactor测试框架之StepVerifier
Reactor测试框架之StepVerifier 测试步骤1、创建StepVerifier实例2、添加断言3、执行验证 代码实例 在响应式编程中,Reactor框架提供了StepVerifier测试类,用于对响应式序列进行断言和验证。StepVerifier主要用于对Publisher发出的元素序列进行逐步的、精…...
unity 播放 序列帧图片 动画
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、方法一:代码控制播放序列帧1、设置图片属性2、创建Image组件3、简单的代码控制4、挂载代码并赋值 二、方法二:直接使用1.Image上添加…...
1-markdown转网页样式页面 --[制作网页模板] 【测试代码下载】
markdown转网页 将Markdown转换为带有样式的网页页面通常涉及以下几个步骤:首先,需要使用Markdown解析器将Markdown文本转换为HTML;其次,应用CSS样式来美化HTML内容。此外,还可以加入JavaScript以增加交互性。下面我将…...
ubuntu 创建服务、查看服务日志
1. 在 /etc/systemd/system/ 下创建文件,名称为 xxx.service [Unit] DescriptionYour Service Description Afternetwork.target[Service] Typesimple ExecStart/path/to/your/service/executable Restarton-failure[Install] WantedBymulti-user.target2. 配置服务…...
[python3]Excel解析库-openpyxl
https://openpyxl.readthedocs.io/en/stable/ openpyxl 是一个用于读写 Excel 2010 xlsx/xlsm/xltx/xltm 文件的 Python 库。它允许开发者创建、修改和保存电子表格,而无需依赖 Microsoft Excel 软件本身。openpyxl 支持读取和写入 Excel 的工作簿(Work…...
使用 LlamaIndex 构建智能文档查询系统
使用 LlamaIndex 构建智能文档查询系统 1. 环境准备2. 初始化模型3. 加载文档4. 构建索引和查询引擎5. 生成扩展查询6. 主函数7. 总结 在现代信息检索系统中,如何高效地从大量文档中提取出有用的信息是一个重要的挑战。本文将介绍如何使用 LlamaIndex 构建一个智能文…...
C++——继承
目录 前言 1. 继承的概念和定义 1.1 继承的概念 1.2 继承的定义 1.2.1 定义格式 1.2.2 继承基类成员访问方式的变化 1.3 继承类模板 2. 基类和派生类之间的转换 3. 继承中的作用域 3.1 隐藏规则 3.2 考察继承作用域相关选择题 4. 派生类的默认成员函数 4.1 4个常…...
01:C语言的本质
C语言的本质 1、ARM架构与汇编2、局部变量初始化与空间分配2.1、局部变量的初始化2.1、局部变量数组初始化 3、全局变量/静态变量初始化化与空间分配4、堆空间5、函数 1、ARM架构与汇编 ARM简要架构如下:CPU,ARM(能读能写),Flash(…...
Jmeter进阶篇(32)Jmeter 在 MySQL 数据库压测中的应用
一、引言 在当今数字化时代,数据库性能的优化对于企业的发展至关重要。随着业务量的不断增长,数据库需要承受越来越大的压力。MySQL作为一种广泛使用的开源数据库,其性能和稳定性备受关注。为了确保数据库在高负载情况下能够正常运行,进行压测是必不可少的环节。Jmeter作为…...
TCPDump参数详解及示例
TCPDump参数详解及示例 TCPDump参数详解TCPDump -G的示例TCPDump -i any -s 2048 -G 600 -p udp -Z root -n -X -tt -w %Y_%m%d_%H%M_%S.pcap &的含义TCPDump是一款强大的网络数据包截获分析工具,可以将网络中传送的数据包的完全截获下来提供分析。它支持针对网络层、协议…...
Protocol Buffer
1、什么是 Protocol Buffers? Protocol Buffers (protobuf) 是一种序列化结构化数据的方法,由 Google 开发。它们提供了一种与语言无关、与平台无关且可扩展的机制,用于高效序列化结构化数据。 Protocol Buffers 中的…...
高等数学学习笔记 ☞ 连续与间断
1. 连续 1. 点连续定义: 设函数在点的某邻域内有定义,取附近的点,对应的函数值分别和, 令,当时,若,则称函数在点处连续。 记作。 此式为增量形式。 又知,则可改写为:。 …...
【three.js】Shader着色器
原始着色器材质RawShaderMaterial 两种着色器材质的 RawShaderMaterial 和 ShaderMaterial 的区别和用法 区别: ShaderMaterial 会自动将一些初始化着色器的参数添加到代码中(内置 attributes 和 uniforms) RawShaderMaterial 则什么都不会添…...
在 macOS 中,设置自动将文件夹排在最前
文章目录 1、第一步访达设置2、第二步排序方式 需要两步设置 1、第一步访达设置 按名称排序的窗口中 2、第二步排序方式 选择名称...
创建并配置华为云虚拟私有云
目录 私有云 创建虚拟私有云 私有云 私有云是一种云计算模式,它将云服务部署在企业或组织内部的私有基础设施上,仅供该企业或组织内部使用,不对外提供服务.私有云的主要特点包括: 私密性:私有云的资源(如…...
Spark是什么?Flink和Spark区别
Spark是什么?Flink和Spark区别 一、Spark二、Spark和Flink区别三、总结 一、Spark Apache Spark 是一个开源的大数据处理框架,主要用于大规模数据处理和分析。它支持多种数据处理模式,包括批处理、流处理、SQL 查询、机器学习和图处理等。 核…...
代码随想录 day 25
第七章 回溯算法 part04 491.递增子序列 本题和大家刚做过的 90.子集II 非常像,但又很不一样,很容易掉坑里。 https://programmercarl.com/0491.%E9%80%92%E5%A2%9E%E5%AD%90%E5%BA%8F%E5%88%97.html 视频讲解:https://www.bilibili.com/…...
数据仓库中的指标体系模型介绍
数据仓库中的指标体系介绍 文章目录 数据仓库中的指标体系介绍前言什么是指标体系指标体系设计有哪些模型?1. 指标分层模型2. 维度模型3. 指标树模型4. KPI(关键绩效指标)模型5. 主题域模型6.平衡计分卡(BSC)模型7.数据指标框架模…...
xr-frame 通过shader去除视频背景色,加载透明视频
目录 前言 实现思路 获取 XR 框架系统: 注册自定义效果 创建效果对象 渲染通道配置 着色器代码 顶点着色器 片元着色器(颜色分量g达到条件的片元将被透透明) effect-removeBlack 完整代码 wxml中使用 前言 实现了一个用于注册自定…...
论文解读 | NeurIPS'24 IRCAN:通过识别和重新加权上下文感知神经元来减轻大语言模型生成中的知识冲突...
点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 点击 阅读原文 观看作者讲解回放! 作者简介 史丹,天津大学博士生 内容简介 大语言模型(LLM)经过海量数据训练后编码了丰富的世界知识。最近的研究表明,…...