内容安全与系统构建加速,助力解决生成式AI时代的双重挑战
内容安全与系统构建加速,助力解决生成式AI时代的双重挑战
- 0. 前言
- 1. PRCV 2024
- 1.1 大会简介
- 1.2 生成式 Al 时代的内容安全与系统构建加速
- 2. 生成式 AI
- 2.1 生成模型
- 2.2 生成模型与判别模型的区别
- 2.3 生成模型的发展
- 3. GAI 内容安全
- 3.1 GAI 时代内容安全挑战
- 3.2 图像篡改检测
- 3.3 人脸伪造图像检测
- 4. GAI 系统构建加速
- 4.1 GAI 时代系统构建挑战
- 4.2 TextIn 大模型加速器
- 小结
0. 前言
生成式 AI
迅速发展的时代,面临着内容安全与系统构建的双重挑战。一方面,基于虚假图片所引发的欺诈事件日益增多,给社会带来了严重的负面影响,因此,我们必须高度关注人工智能的安全性,解决人工智能发展过程中的各种安全挑战,以实现人工智能的持续健康发展。另一方面,训练大模型过程中低质量或不准确的数据会严重影响模型的训练和性能,通过应用性能的智能文档处理,能够自动化数据清洗、格式转换和信息提取,为模型提供高质量的训练数据,推动生成式AI技术的发展。
在本文中,我们将回顾来自合合信息的郭丰俊博士在第七届中国模式识别与计算机视觉大会中关于图像内容安全和智能文档处理推动系统构建加速的思考与探索,并介绍在生成式 AI
时代下文档智能处理技术面临的挑战和研究进展。
1. PRCV 2024
1.1 大会简介
近日,第七届中国模式识别与计算机视觉大会 (The 7th Chinese Conference on Pattern Recognition and Computer Vision
, PRCV 2024
) 在乌鲁木齐成功举办。此次大会由中国自动化学会 (CAA
)、中国图象图形学学会 (CSIG
)、中国人工智能学会 (CAAI
) 和中国计算机学会 (CCF
) 共同主办,由新疆大学承办,是国内顶级的模式识别和计算机视觉领域学术盛会。PRCV 2024
汇聚了国内外模式识别和计算机视觉领域的众多科研工作者及工业界同行,交流最新的理论研究成果与技术进展。
此次会议加强了模式识别和计算机视觉领域学术界和企业界进行深入的“产学研”交流与合作,从而进一步推动模式识别与计算机视觉领域的协同创新。
1.2 生成式 Al 时代的内容安全与系统构建加速
近年来,随着生成式人工智能 (Generative Artificial Intelligence
, GAI
) 技术的迅猛发展,基于虚假图片所引发的欺诈事件也日益增多,给社会带来了严重的负面影响。这些虚假图像不仅误导了公众的认知,还可能对个人、企业和社会造成经济损失和信任危机。因此,确保图像内容的安全性变得尤为重要。在计算机视觉领域,研究和发展能够识别和防范虚假图像的技术,已成为一个紧迫的课题。随着生成伪造图像问题的日益突出,图像内容安全的研究将为保护信息真实性和维护社会信任提供重要支持。
另一方面,智能文档处理系统基于自然语言处理 (Natuarl Language Processing
, NLP
) 和机器学习 (Machine Learning
, ML
) 算法,能够自动理解、生成和转换文档内容,使得系统在处理大量文本信息时,能够实现快速分类、信息提取及内容生成,从而大幅降低人工干预的需求,帮助研发人员加速大模型系统的构建和训练过程,推动生成式AI技术的发展。
合合信息图像算法研发总监郭丰俊博士在 PRCV 2024
上,受邀发表了题为《生成式AI时代的内容安全与系统构建加速》的演讲,分享了图像内容安全和智能文档处理推动系统构建加速方面的最新研究成果和应用实践,助力解决生成式 AI
时代的双重挑战。
2. 生成式 AI
生成式人工智能 (Generative Artificial Intelligence
, GAI
) 是一种人工智能方法,旨在通过学习训练数据的分布模型来生成新的、原创的数据。人工智能生成内容 (Artificial Intelligence Generated Content
, AIGC
) 是生成式人工智能的一个具体应用和实现方式,是指利用人工智能技术生成各种形式的内容,如文字、图像、音频和视频等。
2.1 生成模型
生成模型 (Generative Model
) 是机器学习的一个分支,通过训练模型以生成与给定数据集类似的新数据,换句话说模型通过学习训练数据的分布特征,生成与之类似但又不完全相同的新数据。
假设有一个包含猫图片的数据集,如果在该数据集上训练一个生成模型,以捕捉图像中像素之间的复杂关系。然后,我们可以利用该模型进行采样,生成原始数据集中不存在的逼真(猫)图像,如下图所示。
为了构建生成模型,我们需要一个包含许多我们要生成的实例的数据集,这被称为训练数据 (training data
),其中每一个数据点称为一个观测值 (observation
)。
每个观测值由许多特征 (features
) 组成,对于图像生成问题,特征通常是各个像素的像素值;对于文本生成问题,特征通常是单词或字母组合。我们的目标是构建一个模型,可以生成看起来像是使用与原始数据相同规则创建的新特征集。对于图像生成来说,这是一个非常困难的任务,不仅由于生成的图像需要具有真实世界的特征和细节,包括纹理、颜色、形状等,同时图像生成模型通常需要大量的训练数据来学习图像的特征和分布。
生成模型还必须是概率性的 (probabilistic
),而不是确定性的 (deterministic
),因为我们希望能够采样出具有不同变化的输出,而不是每次得到相同的输出,对于图像数据而言,生成的图像应该具有不同的风格、角度和变化,而不是仅仅复制训练数据中的图像。如果我们的模型仅仅是一个固定的计算,例如在训练数据集中每个像素的平均值,那么它就不是生成模型,生成模型必须包含一个影响模型生成的随机因素。
换句话说,我们假设存在某种未知的概率分布,其可以解释图像在训练数据集中存在(或不存在)的合理性。生成模型的目标是构建一个尽可能精确地模仿这个分布的模型,然后从中进行采样,生成看起来像是原始训练集中可能包含的新的、独特的样本数据。
2.2 生成模型与判别模型的区别
为了了解生成模型及其重要性,首先需要介绍判别模型。假设我们有一个绘画的数据集,其中包含莫奈与一些其他艺术家的画作。通过使用足够的数据,可以训练一个判别模型,以预测给定的画作是否由莫奈绘制。判别模型能够学到画作中的颜色、形状和纹理特征,以便判断画作是否由莫奈所绘制,对于具有莫奈画作特征的绘画,模型会相应地增加其预测权重。下图展示了判别模型的构建过程:
在构建判别模型时,训练数据中的每个观测值都有一个标签 (label
)。对于二分类问题,比如上述画作鉴别器,将莫奈的画作标记为 1
,非莫奈的画作标记为 0
。然后,判别模型学习如何区分这两组画作,并预测新数据样本属于标签 1
的概率,即样本是由莫奈绘制的概率。
而生成模型不需要数据集带有标签,因为生成模型关注的是生成新图像,而非试图预测给定图像的标签。接下来,使用公式正式定义生成模型和判别模型。
- 判别模型估计 p ( y ∣ x ) p(y|x) p(y∣x),即在给定输入 x x x 的情况下,输出 y y y 的概率。其中 y y y 是标签, x x x 是观测值
- 生成模型估计 p ( x ) p(x) p(x),即生成给定输入 x x x 的观测值的概率,而不考虑标签
- 判别模型关注如何根据观测值来预测标签,而生成模型关注如何根据概率分布来生成观测值
- 在判别模型中,可以使用逻辑回归、支持向量机等算法来构建模型。而在生成模型中,常使用生成对抗网络 (
Generative Adversarial Networks
,GAN
) 或扩散模型等算法来生成新的观测值
总结而言,判别模型和生成模型是两种不同的机器学习方法。判别模型通过观测值预测标签,而生成模型通过学习数据分布来生成新的观测值。
生成模型估计 p ( x ) p(x) p(x),即生成观测值 x x x 的概率。也就是说,生成模型旨在对观测值 x x x 进行建模,从所学分布中进行采样可以生成新的观测值。
2.3 生成模型的发展
数年来,判别模型一直是推动机器学习发展的主要动力。这是因为相对于判别问题,相应的生成问题通常更难解决。例如,训练一个模型预测一幅画是否是莫奈所作比起训练一个模型来生成莫奈风格的画作要容易得多;同样,训练一个模型来预测一篇小说是否是莎士比亚所写比起构建一个模型来生成一篇莎士比亚风格的小说要容易得多。
近来,随着机器学习技术的发展,解决生成问题变得不再遥不可及。通过将机器学习应用于构建生成模型的新颖应用得到了快速发展。下图展示了图像生成模型在面部图像生成方面的研究进展。
除了更容易解决的优势之外,判别模型在实际问题中的应用也比生成模型更广泛。例如,能够预测给定视网膜图像是否隐含青光眼迹象的模型对医疗领域具有重要作用,但能够生成眼部图片的模型可能并无作用。
但随着越来越多的公司开始提供面向特定业务问题的生成服务,生成模型的应用范围正在快速扩展。例如,只需提供特定的主题材料,就可以通过 API
访问生成原创博客文章的服务,还可以生成在不同场景下的产品图像,或者编写与品牌和目标信息相匹配的社交媒体内容和广告文案。同时,生成式 AI 在游戏设计和电影制作等行业也逐渐得到应用。
3. GAI 内容安全
在 PRCV 2024
上,合合信息主要分享了 AI
图像安全技术方案的重点技术,包括图像篡改检测和人脸伪造检测技术,以应对日益频发的恶意 P 图、生成式造假和等现象。
3.1 GAI 时代内容安全挑战
随着生成式人工智能 (Generative Artificial Intelligence
, GAI
)技术的迅速发展,伪造数据的数量和可定制性也日益增加,人们对技术革新带来的美好生活倍感期待的同时,也增加了对于人工智能安全问题的担忧,例如,有诈骗分子通过生成篡改内容欺骗受害者,如何有效破解信息安全难题、保障内容安全成为当前的重要议题。
图像作为信息的主要载体之一,图像内容安全在计算机视觉领域的重要性日益突出。例如,在金融行业,银行移动开户、信用卡申办和保险理赔等场景中,身份信息核查是银行、保险等业务场景中的首要项,利用 GAI
技术,攻击者可以快速生成虚假的姓名、地址和电话号码等身份信息,这些篡改身份信息不仅与真实信息相似,还可以根据特定需求进行调整,使得识别变得更加困难,为个人和企业带来巨大的资金损失与潜在风险;同样,在汽车交易、运输等业务中,涉及大量驾驶证、行驶证真实性核查,利用 GAI
技术生成的证件在外观和细节上几乎无法与真实证件区分,这使得不法分子能够轻松利用这些篡改证件进行非法活动,行驶证涉及到车辆买卖合法性,行驶证造假与核查难题给相关企业造成了相当高的经济损失风险;再比如,在财务审批过程中,对网约车订单、付款截图、航空行程单、酒店流水等各类报销佐证单据的真实性检验是一项重要任务,企业在面对这些篡改票据时,往往难以识别,进一步增加了虚假发票和收据生成带来的财务欺诈风险。
由于篡改手段的多样性以及隐蔽性,当前的篡改检测任务面临着诸多复杂的难题。首先,篡改手段多种多样,从简单的像素替换到复杂的图像合成,攻击者可以采用不同的策略来掩盖其篡改行为。这使得检测系统很难建立起有效的识别标准。其次,篡改的隐蔽性使得篡改痕迹往往微弱,甚至在仔细审查的情况下也难以察觉。更为棘手的是,篡改图像与原始图像在内容和形式上可能高度相似,这种相似性进一步增加了识别的难度。
因此,这些因素对检测方法的精度和泛化能力提出了严峻的挑战。检测系统不仅需要在面对明显篡改时保持高精度,还必须具备足够的泛化能力,以适应多变的篡改方式。这要求研究人员不断改进和创新检测技术,力求在不断变化的环境中有效识别出篡改内容,以保护信息的真实性和可靠性。
3.2 图像篡改检测
图像篡改检测是指,给定一张图片,输入到篡改检测模型中,能够判别这张图像是否被篡改,并且定位出篡改图像的篡改区域。
考虑到伪造和篡改的技术也在快速更新,合合信息提出了基于小样本在线增量学习的篡改检测模型,以快速响应客户需求,融合空域与频域关系、知识蒸馏和教师-学生网络等方法提升 CNN Tamper Detector
性能,检测 RGB
域和噪声域存在痕迹的篡改,能够在像素级识别证件、票据等各类重要的商业材料中的 PS 痕迹。
与证照篡改检测相比,截图的背景没有纹路和底色,整个截图没有光照差异,难以通过拍照时产生的成像差异进行篡改痕迹判断,现有的视觉模型通常难以充分发掘原始图像和篡改图像的细粒度差异特征。尽管视觉模型在处理普通图像上表现出色,但当面临具有细粒度差异的原始图像和篡改图像时,它们往往难以有效地进行区分。这是因为篡改操作可能只会对截图进行轻微的修改,这些细节变化对于传统的视觉模型而言很难捕捉到。截图篡改主要分为四种类型:
- 复制移动:图像中的某个区域从一个地方复制到另一个地方
- 拼接:两张毫不相干的图像拼接成为一张新图像
- 擦除:擦除图像中的某些关键信息
- 重打印:在擦除的基础上编辑上新的文本内容
针对这些问题,在传统卷积神经网络后引入两种不同解码器,包括基于降维的解码器 LightHam
和基于注意力的解码器 EANet
,不同形式的解码器的引入令模型可以较好的解决各种场景下的篡改形式,从而捕捉到细粒度的视觉差异,增强模型泛化能力。截图篡改检测可检测包括转账记录、交易记录、聊天记录等多种截图。
应用合合信息的通用篡改检测技术,不仅能够保障信息的真实性,通用篡改检测可防止信息被篡改或伪造,确保信息的真实性和完整性;同时也可以防止欺诈行为,保障用户的合法权益。
同时,合合信息积极参与学术界交流,在 2023
年文档分析与识别国际会议 (International Conference on Document Analysis and Recognition
, ICDAR
) 的挑战赛中,获得了文档篡改检测技术竞赛的冠军,同时与中国信通院、中国图象图形学学会等机构联合发布了《文本图像篡改检测系统技术要求》团体标准,能够推动相关技术更好的落地应用。
3.3 人脸伪造图像检测
人脸伪造图像检测是一个快速发展的领域,旨在识别和验证人脸图像的真实性,以防止欺诈和虚假信息传播。但随着人脸伪造技术的不断演进,检测模型需适应各种生成方法,如生成对抗网络、Deepfake
和扩散模型等,确保能够识别不同类型的人脸伪造图像。
合合信息构建的人脸伪造图像检测系统利用前沿的深度学习技术,基于大量 Deepfake
实际样图训练,具备优秀的泛化识别表现,能够快速而准确地检测单人图像中的人脸伪造行为。通过深度学习算法的高级特征提取和分析,系统能够识别贴图、面部重演、Deepfake
人脸替换等各种伪造行为,同时具备高效的实时处理能力,能够在短时间内对上传的人脸图像进行检测和分析,及时给出检测结果,满足快速反应和处理的需求。
目前,合合信息提出的伪造人脸检测模型已与一些央企及金融机构展开落地合作,相关产品也可以在线体验,例如,使用伪造人脸检测识别使用 Stable Diffusion
生成人脸图像,模型能够准确给出图像“是伪造”的结论。
4. GAI 系统构建加速
4.1 GAI 时代系统构建挑战
在生成式 AI 时代,大模型的构建面临诸多挑战和问题。其中,数据来源和质量的限制成为大模型进一步提高性能的主要障碍。高质量、丰富多样的数据集对于模型的训练至关重要,但在某些领域,合适的数据可能非常稀缺,从而影响模型的性能和公正性。此外,模型的复杂度和训练难度显著增加,往往导致开发和优化的过程变得及其繁琐。以上这些因素共同制约生成式 AI
的进一步发展和应用。
4.2 TextIn 大模型加速器
合合信息 TextIn 是一个文档处理服务平台,其中包含了大量具有不同应用场景的产品,同时针对上述大模型构建过程中的问题,新增了通用文档解析和文本向量模型,用于加速大模型的构建与训练。
利用强大的文字识别和文档理解能力,通用文档解析能够将任意格式、版式的文档(图片、PDF
、Doc/Docx
等)高效、精准解析为大模型能够理解的 Markdown
格式,并按常见的阅读顺序进行还原,赋能大语言模型的数据清洗和文档问答任务,能够帮助研发人员加速大模型系统的构建和训练过程,将文档中的内容更好的结构化为段落、图像、表格和章节等便于后续操作的元素。支持标准的金融报告、论文、企业招投标文件、合同、文书、工程图纸等文档内容,兼容扫描文档和电子 PDF
文件。
合合信息研发的通用文档解析通过应用计算机视觉、自然语言处理等人工智能技术,对文档图像进行自动化处理、分析和识别的过程,可以帮助用户快速高效地对文档图像信息展开深入的分析和理解,实现对文档中的重要信息进行提取。同时,在处理大量文档的情况下,可以显著地减少人力成本和时间成本,提高文档处理的准确度和效果,防止出现错误或遗漏等问题。
具体来说,通用文档解析框架主要包括以下方面:
- 文档图像预处理:在进行文档图像处理之前,对文档图像进行预处理和优化,其主要用于解决文档图像中存在的噪声、变形和失真等问题,以提高文档图像的质量和稳定性,包括图像去噪、切边增强、弯曲矫正和摩尔纹去除等
- 文档图像分析:利用计算机视觉技术对文档图像信息进行分析、理解和处理,其主要用于文档图像的识别、分类和提取等方面,包括文档图像文字识别和提取、清晰化和增强和文档数据信息分析等
- 文档解析与识别:对文档进行结构化分析、编码、识别的提取,可以实现对文档中信息的自动识别和提取,从而提高文档处理效率和准确性,包括结构化分析、语义理解与编码、文字识别 (
Optical Character Recognition
,OCR
) 和表格识别等 - 版面分析与还原:对文档版面进行结构化分析、理解和编码,然后对分析结果中的各个对象进行矫正、拼接和还原,实现文档版面的恢复和重构,主要用于自动化识别、分割和提取文档中重要信息的位置和排版等,包括版面结构分析、对象识别、区域分割和版面纠正、拼接、重构等
- 文档信息抽取与理解:从文档中自动提取出关键信息,并对文档信息进行理解和推理,应用于自动化分析、推理和应用文档信息等,包括关键字提取、实体识别和文本分类等
将解析后的数据应用于下游问答任务能够显著提高结果的准确性,例如,在检索增强生成 (Retrieval Augmented Generation
, RAG
) 模型架构中,通过在生成文本之前先检索相关的信息,增强了生成的质量和准确性。RAG
通常分为两个阶段:首先,模型检索相关文档,然后基于这些文档生成答案或文本,使得生成的内容不仅基于模型的训练知识,还结合了特定的信息,从而提高了响应的相关性和信息丰富度。在下图中,可以看到,通用文档解析得到的信息,能够显著提升问答系统和对话生成等任务中大模型的表现。
小结
合合信息是一家深耕智能文字识别和商业大数据领域的公司,主要的平台产品包括智能文字识别服务平台和商业大数据技术与资产平台,其中,智能文字识别服务平台 TextIn 提供高精准度的智能文字识别引擎及场景化产品,支持多种部署方式,提升文档处理流程的效率,例如光学字符识别 (Optical Character Recognition
, OCR
)、图像切边增强、PS 篡改检测以及图像矫正等。
在生成式 AI 时代,模型具备快速响应用户需求的能力,能够实现即时生成与交互。但不准确数据会影响模型的表现,导致生成内容不可靠,同时随着伴随内容生成的便利,也出现了虚假信息、版权问题等安全挑战。本文通过回顾郭博士在郭丰俊博士在第七届中国模式识别与计算机视觉大会中的报告,介绍了合合信息关于文档和证件等数据的伪造检测技术,以及能够用于加速大模型系统的构建和训练过程的文档处理服务平台。
相关文章:
内容安全与系统构建加速,助力解决生成式AI时代的双重挑战
内容安全与系统构建加速,助力解决生成式AI时代的双重挑战 0. 前言1. PRCV 20241.1 大会简介1.2 生成式 Al 时代的内容安全与系统构建加速 2. 生成式 AI2.1 生成模型2.2 生成模型与判别模型的区别2.3 生成模型的发展 3. GAI 内容安全3.1 GAI 时代内容安全挑战3.2 图像…...
基于Vue的微前端架构实现与挑战
引言 微前端架构作为一种新兴的前端开发方案,能够有效解决大型应用的复杂性问题。本文将详细探讨基于Vue实现微前端的具体方案及其面临的挑战。 什么是微前端? 微前端是一种将前端应用分解成一系列更小、更易管理的独立应用的架构模式。每个子应用可以…...
UE5 DownloadImage加载jpg失败的解决方法
DownloadImage加载jpg失败的解决方法 现象解决方案具体方法 现象 用UE自带的 DownloadImage 无法下载成功,从 failure 引脚出来。 接入一个由监控器自动保存起的图像,有些可以正常加载成功,有些无法加载成功。 经调查问题出现在,…...
Consumer Group
不,kafka-consumer-groups.sh 脚本本身并不用于创建 Consumer Group。它主要用于管理和查看 Consumer Group 的状态和详情,比如列出所有的 Consumer Group、查看特定 Consumer Group 的详情、删除 Consumer Group 等。 Consumer Group 是由 Kafka 消费者…...
[开源] SafeLine 好用的Web 应用防火墙(WAF)
SafeLine,中文名 “雷池”,是一款简单好用, 效果突出的 Web 应用防火墙(WAF),可以保护 Web 服务不受黑客攻击 一、简介 雷池通过过滤和监控 Web 应用与互联网之间的 HTTP 流量来保护 Web 服务。可以保护 Web 服务免受 SQL 注入、XSS、 代码注…...
vue3 路由守卫
在Vue 3中,路由守卫是一种控制和管理路由跳转的机制。它允许你在执行导航前后进行一些逻辑处理,比如权限验证、数据预取等,从而增强应用的安全性和效率。路由守卫分为几种不同的类型,每种类型的守卫都有其特定的应用场景。 其实路…...
unigui 登陆界面
新建项目,因为我的Main页面做了其他的东西,所以我在这里新建一个form File -> New -> From(Unigui) -> 登录窗体 添加组件:FDConnection,FDQuery,DataSource,Unipanel和几个uniedit,…...
Ubuntu,openEuler,MySql安装
文章目录 Ubuntu什么是Ubuntu概述Ubuntu版本简介桌面版服务器版 部署系统新建虚拟机安装系统部署后的设置设置root密码关闭防火墙启用允许root进行ssh安装所需软件制作快照 网络配置Netplan概述配置详解配置文件DHCP静态IP设置 软件安装方法apt安装软件作用常用命令配置apt源 d…...
LLM( Large Language Models)典型应用介绍 1 -ChatGPT Large language models
ChatGPT 是基于大型语言模型(LLM)的人工智能应用。 GPT 全称是Generative Pre-trained Transformer。-- 生成式预训练变换模型: Generative(生成式):可以根据输入生成新的文本内容,例如回答问题…...
deepin系统下载pnpm cnpm等报错
deepin系统下载pnpm cnpm等报错 npm ERR! request to https://registry.npm.taobao.org/pnpm failed, reason: certificate has expired 报错提示证书过期,执行以下命令 npm config set registry https://registry.npmmirror.com下载pnpm npm install pnpm -g查…...
RPC-健康检测机制
什么是健康检测? 在真实环境中服务提供方是以一个集群的方式提供服务,这对于服务调用方来说,就是一个接口会有多个服务提供方同时提供服务,调用方在每次发起请求的时候都可以拿到一个可用的连接。 健康检测,能帮助从连…...
数据结构-二叉树_堆
目录 1.二叉树的概念 编辑1.1树的概念与结构 1.2树的相关语 1.3 树的表示 2. ⼆叉树 2.1 概念与结构 2.2 特殊的⼆叉树 2.2.2 完全⼆叉树 2.3 ⼆叉树存储结构 2.3.1 顺序结构 2.3.2 链式结构 3. 实现顺序结构⼆叉树 3.2 堆的实现 3.2.2 向下调整算法 1.二叉树的概…...
“无关紧要”的小知识点:“xx Packages Are Looking for Funding”——npm fund命令及运行机制
“无关紧要”的小知识点:“xx Packages Are Looking for Funding”——npm fund 命令及运行机制 在 Node.js 和 npm 生态系统中,开源项目的持续发展和维护常常依赖于贡献者的支持和资助。为了让开发者更容易了解他们依赖的项目哪些有资金支持选项&#…...
【案例】---Hutool提取excel文档
目录 一、前言二、提取excel文档2.1、核心代码一、前言 引用jar包 <!--hutool--><dependency><groupId>cn.hutool</groupId>...
GPT-1.0、GPT-2.0、GPT-3.0参数对比
以下是 GPT-1.0、GPT-2.0、GPT-3.0 的模型参数对比表格: 模型GPT-1.0GPT-2.0GPT-3.0参数数量117M1.5B175B层数12 层12 - 48 层96 层嵌入维度768768 - 160012,288注意力头数1212 - 2596上下文长度51210242048词汇表大小约 40,00050,00050,000训练数据BooksCorpus (约…...
鸿蒙网络编程系列48-仓颉版UDP回声服务器示例
1. UDP回声服务器简介 回声服务器指的是这样一种服务器,它接受客户端的连接,并且把收到的数据原样返回给客户端,本系列的第2篇文章《鸿蒙网络编程系列2-UDP回声服务器的实现》中基于ArkTS语言在API 9的环境下实现了UDP回声服务器,…...
110. UE5 GAS RPG 实现玩家角色数据存档
在这篇,我们实现将玩家数据保存到存档内。 增加保存玩家属性 玩家属性默认的等级,经验值,可分配的技能点和属性点。还有一些角色基础属性也需要保存,回忆一下,我们是如何实现玩家的属性的,我们是通过多个…...
Excel - VLOOKUP函数将指定列替换为字典值
背景:在根据各种复杂的口径导出报表数据时,因为关联的表较多、数据量较大,一行数据往往会存在三个以上的字典数据。 为了保证导出数据的效率,博主选择了导出字典code值后,在Excel中处理匹配字典值。在查询百度之后&am…...
多线程并发造成的数据重复问题解决方案参考(笔记记录)
一、添加 MySQL 组合唯一索引,需要注意什么坑? 在 MySQL 中,创建组合唯一索引(Composite Unique Index)时,需要注意以下一些容易踩的坑: 1. 字段顺序影响索引使用 问题:组合唯一索…...
使用uniapp开发微信小程序使用uni_modules导致主包文件过大,无法发布的解决方法
在使用uniapp开发微信小程序时候,过多的引入uni_modules的组件库,会导致主包文件过大,导致无法上传微信小程序,主包要求大小不超过1.5MB.分包大小每个不能超过2M。 解决方法:分包。 1.对每个除了主页面navbar的页面进…...
01_MinIO部署(Windows单节点部署/Docker化部署)
单节点-Windows环境安装部署 在Windows环境安装MinIO,主要包含两个东西: MinIO Server(minio.exe):应用服务本身MinIO Client(mc.exe):MinIO客户端工具(mc)…...
uniapp微信小程序转发跳转指定页面
onShareAppMessage 是微信小程序中的一个重要函数,用于自定义转发内容。当用户点击右上角的菜单按钮,并选择“转发”时,会触发这个函数。开发者可以在这个函数中返回一个对象,用于定义分享卡片的标题、图片、路径等信息。 使用场…...
【AI知识】两类最主流AI应用(文生图、ChatGPT)中的目标函数
之前写过一篇 【AI知识】了解两类最主流AI任务中的目标函数,介绍了AI最常见的两类任务【分类、回归】的基础损失函数【交叉熵、均方差】,以初步了解AI的训练目标。 本篇更进一步,聊一聊流行的“文生图”、“聊天机器人ChatGPT”模型中的目标函…...
区块链入门—带你快速了解(通俗易懂)
读懂这篇文章需要有一定的数据结构与算法的基础。 本篇文章如果有不正确的地方,欢迎指正。 目录 一、区块链基础 1.基本概念 2.核心特性 3.区块链分类 4.区块链发展历程 二、区块链技术概念 1.技术架构 2.区块图解 3.共识机制 4.智能合约 5.密码学—哈…...
【数据库知识】mysql进阶-Mysql数据库的主从复制
mysql主从复制 概述一、数据同步机制二、复制流程三、保证数据一致性的措施四、复制拓扑结构五、应用场景与优势 双主复制的过程一、配置前的准备二、配置主服务器三、配置从服务器(相对角色)四、验证复制状态五、处理潜在的问题 双主复制如何解决冲突问…...
深度学习中的mAP
在深度学习中,mAP是指平均精度均值(mean Average Precision),它是深度学习中评价模型好坏的一种指标(metric),特别是在目标检测中。 精确率和召回率的概念: (1).精确率(Precision):预测阳性结果中实际正确的比例(TP / …...
TB6612电机驱动模块使用指南
实物图: 简介:TB6612是一款双路H桥型直流电机驱动模块,可以控制两个直流电机的转速和方向 H桥:(双路H桥就是有两个这个结构) 引脚图:...
小试牛刀-Anchor安装和基础测试
目录 一、编写目的 二、安装步骤 2.1 安装Rust 设置rustup镜像 安装Rust 2.2 安装node.js 2.3 安装Solana-CLI 2.4 安装Anchor CLI 三、Program测试 四、可能出现的问题 Welcome to Code Blocks blog 本篇文章主要介绍了 [Anchor安装和基础测试] 博主广交技术好友&…...
基于FPGA(现场可编程门阵列)的SD NAND图片显示系统是一个复杂的项目,它涉及硬件设计、FPGA编程、SD卡接口、NAND闪存控制以及图像显示等多个方面
文章目录 0、前言 1、目标 2、图片的预处理 3、SD NAND的预处理 4、FPGA实现 4.1、详细设计 4.2、仿真 4.3、实验结果 前言 在上一篇文章《基于FPGA的SD卡的数据读写实现(SD NAND FLASH)》中,我们了解到了SD NAND Flash的相关知识&am…...
1.tree of thought (使用LangChain解决4x4数独问题)
本教程将介绍如何使用LangChain库和chatglm API来解决一个4x4的数独问题。我们将通过以下步骤实现这一目标: 初始化chatglm 的聊天模型。定义数独问题和解决方案。创建一个自定义的检查器来验证每一步的思考。使用ToTChain来运行整个思考过程。 1. 初始化chatglm4…...
对subprocess启动的子进程使用VSCode python debugger
文章目录 1 情况概要(和文件结构)2 具体设置和启动步骤2.1 具体配置Step 1 针对attach debugger到子进程Step 2 针对子进程的暂停(可选) Step 3 判断哪个进程id是需要的子进程 2.2 启动步骤和过程 3 其他问题解决3.13.2 ptrace: Operation not permitted…...
MATLAB实现GARCH(广义自回归条件异方差)模型计算VaR(Value at Risk)
MATLAB实现GARCH(广义自回归条件异方差)模型计算VaR(Value at Risk) 1.计算模型介绍 使用GARCH(广义自回归条件异方差)模型计算VaR(风险价值)时,方差法是一个常用的方法。GARCH模型能够捕捉到金融时间序列数据中的波…...
Android中常见内存泄漏的场景和解决方案
本文讲解Android 开发中常见内存泄漏场景及其解决方案,内容包括代码示例、原因分析以及最佳实践建议。 1. 静态变量导致的内存泄漏 静态变量的生命周期与应用进程一致,如果静态变量持有了对 Activity 或其他大对象的引用,就可能导致内存泄漏…...
爬取链家二手房房价数据存入mongodb并进行分析
感谢您的关注!需要完整源码评论区获取~ 【实验目的】 1. 使用 python 将爬虫数据存入 mongodb; 2. 使用 python 读取 mongodb 数据并进行可视化分析。 【实验原理】 MongoDB 是文档数据库,采用 BSON 的结构来存储数据。在文档中可嵌套其…...
《TCP/IP网络编程》学习笔记 | Chapter 13:多种 I/O 函数
《TCP/IP网络编程》学习笔记 | Chapter 13:多种 I/O 函数 《TCP/IP网络编程》学习笔记 | Chapter 13:多种 I/O 函数send & recv 函数Linux 平台下的 send 和 recv 函数MSG_OOB:发送紧急消息紧急模式的工作原理检查输入缓冲 readv & w…...
详细介绍下oracle冷备(coolbackup)
冷备,也就说数据库不是运行(热的状态)的备份。有些时候我们的数据库比较小,进行同操作系统数据迁移和恢复的时候就比较好用。下面我们详细介绍下oracle数据库的冷备(我们使用最简单的拷贝数据文件方式进行冷备…...
MYSQL——多表设计以及数据库中三种关系模型
大致介绍数据库中三种关系模型 一对多(1:N) 定义: 一个实体可以与另一个实体的多个实例相关联,而后者只能与前者的一个实例相关联。 例子: 学生和课程的关系。 学生(1):每个学生…...
泷羽sec学习打卡-html基础
声明 学习视频来自B站UP主 泷羽sec,如涉及侵权马上删除文章 笔记的只是方便各位师傅学习知识,以下网站只涉及学习内容,其他的都与本人无关,切莫逾越法律红线,否则后果自负 关于云技术基础的那些事儿-捕获帅照 html基础什么是html? 常用的html标签html示例 css基础什…...
国标GB28181摄像机接入EasyGBS国标GB28181设备管理软件:GB28181-2022媒体传输协议解析
随着信息技术的飞速发展,视频监控领域正经历从传统安防向智能化、网络化安防的深刻转变。在这一转变过程中,国标GB28181设备管理软件EasyGBS成为了这场技术变革的重要一环。 GB28181-2022媒体传输协议 媒体传输命令包括实时视音频点播、历史视音频回放/…...
鸿蒙网络编程系列50-仓颉版TCP回声服务器示例
1. TCP服务端简介 TCP服务端是基于TCP协议构建的一种网络服务模式,它为HTTP(超文本传输协议)、SMTP(简单邮件传输协议)等高层协议的应用程序提供了可靠的底层支持。在TCP服务端中,服务器启动后会监听一个或…...
JMeter监听器与压测监控之 InfluxDB
1. 简介 在本文中,我们将介绍如何在 Kali Linux 上通过 Docker 安装 InfluxDB,并使用 JMeter 对其进行性能监控。InfluxDB 是一个高性能的时序数据库,而 JMeter 是一个开源的性能测试工具,可以用于对各种服务进行负载测试和性能监…...
混合上下文学习 ;In-Context Learning(ICL)
目录 In-Context Learning(ICL) 混合上下文学习 核心内容 核心创新点的原理与理论 举例说明 In-Context Learning(ICL) 是一种在大语言模型(LLM)中使用的技术,它允许模型通过提供一组输入输出示例(即“demonstrations”)来适应新任务,而无需对模型参数进行显…...
【STM32】软件I2C读写MPU6050
文章目录 软件I2C读写MPU6050接线图代码整体框架MyI2C模块MyI2C.cMyI2C.h MPU6050模块MPU6050.cMPU6050_Reg.h MPU6050.h main.c 源程序 软件I2C读写MPU6050 要实现软件I2C读写MPU6050分为两个部分: 完成软件I2C协议时序基于I2C协议读写寄存器操控MPU6050 接线图…...
HarmonyOS鸿蒙系统上File文件常用操作
HarmonyOS鸿蒙系统上,file文件常用操作记录 1.创建文件 createFile(fileName: string, content: string): string {// 获取应用文件路径let context getContext(this) as common.UIAbilityContext;let filesDirPath context.filesDir / fileName;// 新建并打开…...
如何解决Java EasyExcel 导出报内存溢出
如何解决Java EasyExcel 导出报内存溢出 EasyExcel大数据量导出常见方法 1. 分批写入 EasyExcel支持分批写入数据,可以将数据分批加载到内存中,分批写入Excel文件,避免一次性将大量数据加载到内存中。 示例代码: String fileNa…...
[产品管理-91]:产品经理的企业运营的全局思维-1
目录 前言:企业架构图 产品经理的企业运营全局思维 1、用户 - 用户价值与体验:真正的需求,真正的问题,一切的原点 2、大势 - 顺应宏观大势:政策趋势、行业趋势、技术趋势 3、市场 - 知己知彼:市场调研…...
学习笔记——stm32看门狗
目录 一、WDG简介 二、IWDG框图 2.1独立看门狗结构 2.2键寄存器 2.3超时时间 三、WWDG框图 3.1窗口看门狗结构 3.2WWDG时序图 3.3最早、最晚时间 四、IWDG和WWDG对比 五、IWDG相关库函数和应用 5.1相关库函数 5.2应用 六、WWDG相关库函数和应用 6.1相关库函数 6…...
2411rust,cargo清理缓存
原文 Cargo最近在晚间通道上取得了一个不稳定的功能(从nightly-2023-11-17开始),它可自动清理Cargo主目录中的缓存内容. 总之,请求使用晚间通道的人启用此功能,并在Cargo问题跟踪器上报告问题.要启用它,请在你的一般在~/.cargo/config.toml或%USERPROFILE%\.cargo\config.tom…...
高级java每日一道面试题-2024年11月19日-基本篇-获取一个类Class对象的方式有哪些?
如果有遗漏,评论区告诉我进行补充 面试官: 获取一个类Class对象的方式有哪些? 我回答: 在 Java 中,获取一个类的 Class 对象有多种方式。这些方式各有优缺点,适用于不同的场景。以下是常见的几种方法及其详细解释: 1. 使用 new 关键字实…...
Vue 3与TypeScript集成指南:构建类型安全的前端应用
在Vue 3中使用TypeScript,可以让你的组件更加健壮和易于维护。以下是使用TypeScript与Vue 3结合的详细步骤和知识点: 1. 环境搭建 首先,确保你安装了Node.js(推荐使用最新的LTS版本)和npm或Yarn。然后,安…...