LLM( Large Language Models)典型应用介绍 1 -ChatGPT Large language models
- ChatGPT 是基于大型语言模型(LLM)的人工智能应用。
GPT 全称是Generative Pre-trained Transformer。-- 生成式预训练变换模型:
-
Generative(生成式):可以根据输入生成新的文本内容,例如回答问题、撰写文章或交流
-
Pre-trained(预训练):可以在大量的通用文本数据上进行预训练,以学习语言的结构和语义,有自适应和学习的特点。
-
Transformer(变换模型):指模型使用的是 Transformer 架构,这是一种在自然语言处理(NLP)任务中非常有效的深度学习框架。Transformer 架构擅长捕捉上下文信息,支持并行处理,因而效率高、效果好。
-
GPT-1(2018):首次引入生成式预训练概念,具有 1.17 亿参数。
-
GPT-2(2019):参数量大幅提升至 15 亿,生成文本质量显著提高。
-
GPT-3(2020):具备 1750 亿参数,成为当时最强大的语言模型之一。
-
GPT-4(2023):引入多模态功能(支持图像和文本输入),在推理能力和复杂任务处理上进一步增强。
ChatGPT 是Open AI 研发的。基于自然语言对话为核心功能,聊天问答、生成文本、执行任务并提供创意建议。ChatGPT 是 OpenAI 的 GPT 系列模型 的重要应用之一。
-
ChatGPT 的核心特点
-
基于 LLM 的强大语言能力:
- ChatGPT 使用 GPT(Generative Pre-trained Transformer)模型,经过海量文本数据训练,能够理解复杂语境并生成连贯、语法正确的回答。
-
自然对话:
- 专注于用户交互,模拟人类对话的方式提供实时响应。
-
多功能性:
- 不仅支持回答问题,还能完成写作、翻译、编程、教育辅助等任务。
-
多语言支持:
- 可以处理多种语言输入,并在一定程度上翻译和生成其他语言的内容。
-
版本升级:
- 不同版本性能各异,GPT-4 比 GPT-3.5 更智能,具有更强的上下文理解能力和多模态(文本与图像)支持。
-
ChatGPT 的工作原理
- 预训练阶段:
- 使用海量的互联网文无序列表本数据训练,模型学习语言结构、语义关系和世界知识。
- 微调阶段:
- 通过人类反馈(如 RLHF,强化学习与人类反馈结合)优化,使其更符合对话需求。
- 对话生成:
- 根据用户输入(Prompt),生成符合上下文的自然语言回复。
-
ChatGPT 的主要应用
-
日常问答:
- 解答日常问题、提供建议、解决疑惑。
-
内容创作:
- 撰写文章、故事、广告文案、社交媒体帖子等。
-
语言学习:
- 提供翻译、语法检查、语言教学。
-
编程与技术支持:
- 生成代码、调试错误、解释技术概念。
-
商业用途:
- 自动化客服、商业计划书写作、市场分析。
-
教育与学习辅助:
- 提供概念解释、知识总结、学习计划建议。
-
ChatGPT 的版本对比
特性 | GPT-3.5 | GPT-4 |
---|---|---|
理解复杂问题 | 表现良好,但有局限性 | 更强的逻辑推理和复杂问题处理能力 |
上下文长度支持 | 较短 | 支持更长的上下文 |
多模态输入 | 不支持 | 支持文本和图像输入(取决于配置) |
输出准确性 | 较好,但偶尔有幻觉现象 | 更准确,减少错误信息生成 |
使用成本 | 较低 | 成本更高 |
-
优势
- 易用性:与用户直接对话,无需复杂设置。
- 高效性:能快速生成高质量的内容。
- 可扩展性:适合多种领域,从创意到专业技术支持。
-
挑战与局限
- 事实性问题:可能生成错误或虚构的信息。
- 依赖数据:训练数据的质量和覆盖范围直接影响模型性能。
- 伦理问题:可能被用来生成有害或误导性内容。
- 实时性:模型的知识更新滞后于其训练截止时间(如 GPT-4 的知识截止于 2023 年初)。
ChatGPT 是当今生成式 AI 的代表应用之一,依托大型语言模型为基础,推动了自然语言处理技术在各行业的落地。尽管存在局限性,但它在文本生成、问题解答和任务处理上的能力,使其成为不可忽视的技术工具。
4o
相关文章:
LLM( Large Language Models)典型应用介绍 1 -ChatGPT Large language models
ChatGPT 是基于大型语言模型(LLM)的人工智能应用。 GPT 全称是Generative Pre-trained Transformer。-- 生成式预训练变换模型: Generative(生成式):可以根据输入生成新的文本内容,例如回答问题…...
deepin系统下载pnpm cnpm等报错
deepin系统下载pnpm cnpm等报错 npm ERR! request to https://registry.npm.taobao.org/pnpm failed, reason: certificate has expired 报错提示证书过期,执行以下命令 npm config set registry https://registry.npmmirror.com下载pnpm npm install pnpm -g查…...
RPC-健康检测机制
什么是健康检测? 在真实环境中服务提供方是以一个集群的方式提供服务,这对于服务调用方来说,就是一个接口会有多个服务提供方同时提供服务,调用方在每次发起请求的时候都可以拿到一个可用的连接。 健康检测,能帮助从连…...
数据结构-二叉树_堆
目录 1.二叉树的概念 编辑1.1树的概念与结构 1.2树的相关语 1.3 树的表示 2. ⼆叉树 2.1 概念与结构 2.2 特殊的⼆叉树 2.2.2 完全⼆叉树 2.3 ⼆叉树存储结构 2.3.1 顺序结构 2.3.2 链式结构 3. 实现顺序结构⼆叉树 3.2 堆的实现 3.2.2 向下调整算法 1.二叉树的概…...
“无关紧要”的小知识点:“xx Packages Are Looking for Funding”——npm fund命令及运行机制
“无关紧要”的小知识点:“xx Packages Are Looking for Funding”——npm fund 命令及运行机制 在 Node.js 和 npm 生态系统中,开源项目的持续发展和维护常常依赖于贡献者的支持和资助。为了让开发者更容易了解他们依赖的项目哪些有资金支持选项&#…...
【案例】---Hutool提取excel文档
目录 一、前言二、提取excel文档2.1、核心代码一、前言 引用jar包 <!--hutool--><dependency><groupId>cn.hutool</groupId>...
GPT-1.0、GPT-2.0、GPT-3.0参数对比
以下是 GPT-1.0、GPT-2.0、GPT-3.0 的模型参数对比表格: 模型GPT-1.0GPT-2.0GPT-3.0参数数量117M1.5B175B层数12 层12 - 48 层96 层嵌入维度768768 - 160012,288注意力头数1212 - 2596上下文长度51210242048词汇表大小约 40,00050,00050,000训练数据BooksCorpus (约…...
鸿蒙网络编程系列48-仓颉版UDP回声服务器示例
1. UDP回声服务器简介 回声服务器指的是这样一种服务器,它接受客户端的连接,并且把收到的数据原样返回给客户端,本系列的第2篇文章《鸿蒙网络编程系列2-UDP回声服务器的实现》中基于ArkTS语言在API 9的环境下实现了UDP回声服务器,…...
110. UE5 GAS RPG 实现玩家角色数据存档
在这篇,我们实现将玩家数据保存到存档内。 增加保存玩家属性 玩家属性默认的等级,经验值,可分配的技能点和属性点。还有一些角色基础属性也需要保存,回忆一下,我们是如何实现玩家的属性的,我们是通过多个…...
Excel - VLOOKUP函数将指定列替换为字典值
背景:在根据各种复杂的口径导出报表数据时,因为关联的表较多、数据量较大,一行数据往往会存在三个以上的字典数据。 为了保证导出数据的效率,博主选择了导出字典code值后,在Excel中处理匹配字典值。在查询百度之后&am…...
多线程并发造成的数据重复问题解决方案参考(笔记记录)
一、添加 MySQL 组合唯一索引,需要注意什么坑? 在 MySQL 中,创建组合唯一索引(Composite Unique Index)时,需要注意以下一些容易踩的坑: 1. 字段顺序影响索引使用 问题:组合唯一索…...
使用uniapp开发微信小程序使用uni_modules导致主包文件过大,无法发布的解决方法
在使用uniapp开发微信小程序时候,过多的引入uni_modules的组件库,会导致主包文件过大,导致无法上传微信小程序,主包要求大小不超过1.5MB.分包大小每个不能超过2M。 解决方法:分包。 1.对每个除了主页面navbar的页面进…...
01_MinIO部署(Windows单节点部署/Docker化部署)
单节点-Windows环境安装部署 在Windows环境安装MinIO,主要包含两个东西: MinIO Server(minio.exe):应用服务本身MinIO Client(mc.exe):MinIO客户端工具(mc)…...
uniapp微信小程序转发跳转指定页面
onShareAppMessage 是微信小程序中的一个重要函数,用于自定义转发内容。当用户点击右上角的菜单按钮,并选择“转发”时,会触发这个函数。开发者可以在这个函数中返回一个对象,用于定义分享卡片的标题、图片、路径等信息。 使用场…...
【AI知识】两类最主流AI应用(文生图、ChatGPT)中的目标函数
之前写过一篇 【AI知识】了解两类最主流AI任务中的目标函数,介绍了AI最常见的两类任务【分类、回归】的基础损失函数【交叉熵、均方差】,以初步了解AI的训练目标。 本篇更进一步,聊一聊流行的“文生图”、“聊天机器人ChatGPT”模型中的目标函…...
区块链入门—带你快速了解(通俗易懂)
读懂这篇文章需要有一定的数据结构与算法的基础。 本篇文章如果有不正确的地方,欢迎指正。 目录 一、区块链基础 1.基本概念 2.核心特性 3.区块链分类 4.区块链发展历程 二、区块链技术概念 1.技术架构 2.区块图解 3.共识机制 4.智能合约 5.密码学—哈…...
【数据库知识】mysql进阶-Mysql数据库的主从复制
mysql主从复制 概述一、数据同步机制二、复制流程三、保证数据一致性的措施四、复制拓扑结构五、应用场景与优势 双主复制的过程一、配置前的准备二、配置主服务器三、配置从服务器(相对角色)四、验证复制状态五、处理潜在的问题 双主复制如何解决冲突问…...
深度学习中的mAP
在深度学习中,mAP是指平均精度均值(mean Average Precision),它是深度学习中评价模型好坏的一种指标(metric),特别是在目标检测中。 精确率和召回率的概念: (1).精确率(Precision):预测阳性结果中实际正确的比例(TP / …...
TB6612电机驱动模块使用指南
实物图: 简介:TB6612是一款双路H桥型直流电机驱动模块,可以控制两个直流电机的转速和方向 H桥:(双路H桥就是有两个这个结构) 引脚图:...
小试牛刀-Anchor安装和基础测试
目录 一、编写目的 二、安装步骤 2.1 安装Rust 设置rustup镜像 安装Rust 2.2 安装node.js 2.3 安装Solana-CLI 2.4 安装Anchor CLI 三、Program测试 四、可能出现的问题 Welcome to Code Blocks blog 本篇文章主要介绍了 [Anchor安装和基础测试] 博主广交技术好友&…...
基于FPGA(现场可编程门阵列)的SD NAND图片显示系统是一个复杂的项目,它涉及硬件设计、FPGA编程、SD卡接口、NAND闪存控制以及图像显示等多个方面
文章目录 0、前言 1、目标 2、图片的预处理 3、SD NAND的预处理 4、FPGA实现 4.1、详细设计 4.2、仿真 4.3、实验结果 前言 在上一篇文章《基于FPGA的SD卡的数据读写实现(SD NAND FLASH)》中,我们了解到了SD NAND Flash的相关知识&am…...
1.tree of thought (使用LangChain解决4x4数独问题)
本教程将介绍如何使用LangChain库和chatglm API来解决一个4x4的数独问题。我们将通过以下步骤实现这一目标: 初始化chatglm 的聊天模型。定义数独问题和解决方案。创建一个自定义的检查器来验证每一步的思考。使用ToTChain来运行整个思考过程。 1. 初始化chatglm4…...
对subprocess启动的子进程使用VSCode python debugger
文章目录 1 情况概要(和文件结构)2 具体设置和启动步骤2.1 具体配置Step 1 针对attach debugger到子进程Step 2 针对子进程的暂停(可选) Step 3 判断哪个进程id是需要的子进程 2.2 启动步骤和过程 3 其他问题解决3.13.2 ptrace: Operation not permitted…...
MATLAB实现GARCH(广义自回归条件异方差)模型计算VaR(Value at Risk)
MATLAB实现GARCH(广义自回归条件异方差)模型计算VaR(Value at Risk) 1.计算模型介绍 使用GARCH(广义自回归条件异方差)模型计算VaR(风险价值)时,方差法是一个常用的方法。GARCH模型能够捕捉到金融时间序列数据中的波…...
Android中常见内存泄漏的场景和解决方案
本文讲解Android 开发中常见内存泄漏场景及其解决方案,内容包括代码示例、原因分析以及最佳实践建议。 1. 静态变量导致的内存泄漏 静态变量的生命周期与应用进程一致,如果静态变量持有了对 Activity 或其他大对象的引用,就可能导致内存泄漏…...
爬取链家二手房房价数据存入mongodb并进行分析
感谢您的关注!需要完整源码评论区获取~ 【实验目的】 1. 使用 python 将爬虫数据存入 mongodb; 2. 使用 python 读取 mongodb 数据并进行可视化分析。 【实验原理】 MongoDB 是文档数据库,采用 BSON 的结构来存储数据。在文档中可嵌套其…...
《TCP/IP网络编程》学习笔记 | Chapter 13:多种 I/O 函数
《TCP/IP网络编程》学习笔记 | Chapter 13:多种 I/O 函数 《TCP/IP网络编程》学习笔记 | Chapter 13:多种 I/O 函数send & recv 函数Linux 平台下的 send 和 recv 函数MSG_OOB:发送紧急消息紧急模式的工作原理检查输入缓冲 readv & w…...
详细介绍下oracle冷备(coolbackup)
冷备,也就说数据库不是运行(热的状态)的备份。有些时候我们的数据库比较小,进行同操作系统数据迁移和恢复的时候就比较好用。下面我们详细介绍下oracle数据库的冷备(我们使用最简单的拷贝数据文件方式进行冷备…...
MYSQL——多表设计以及数据库中三种关系模型
大致介绍数据库中三种关系模型 一对多(1:N) 定义: 一个实体可以与另一个实体的多个实例相关联,而后者只能与前者的一个实例相关联。 例子: 学生和课程的关系。 学生(1):每个学生…...
泷羽sec学习打卡-html基础
声明 学习视频来自B站UP主 泷羽sec,如涉及侵权马上删除文章 笔记的只是方便各位师傅学习知识,以下网站只涉及学习内容,其他的都与本人无关,切莫逾越法律红线,否则后果自负 关于云技术基础的那些事儿-捕获帅照 html基础什么是html? 常用的html标签html示例 css基础什…...
国标GB28181摄像机接入EasyGBS国标GB28181设备管理软件:GB28181-2022媒体传输协议解析
随着信息技术的飞速发展,视频监控领域正经历从传统安防向智能化、网络化安防的深刻转变。在这一转变过程中,国标GB28181设备管理软件EasyGBS成为了这场技术变革的重要一环。 GB28181-2022媒体传输协议 媒体传输命令包括实时视音频点播、历史视音频回放/…...
鸿蒙网络编程系列50-仓颉版TCP回声服务器示例
1. TCP服务端简介 TCP服务端是基于TCP协议构建的一种网络服务模式,它为HTTP(超文本传输协议)、SMTP(简单邮件传输协议)等高层协议的应用程序提供了可靠的底层支持。在TCP服务端中,服务器启动后会监听一个或…...
JMeter监听器与压测监控之 InfluxDB
1. 简介 在本文中,我们将介绍如何在 Kali Linux 上通过 Docker 安装 InfluxDB,并使用 JMeter 对其进行性能监控。InfluxDB 是一个高性能的时序数据库,而 JMeter 是一个开源的性能测试工具,可以用于对各种服务进行负载测试和性能监…...
混合上下文学习 ;In-Context Learning(ICL)
目录 In-Context Learning(ICL) 混合上下文学习 核心内容 核心创新点的原理与理论 举例说明 In-Context Learning(ICL) 是一种在大语言模型(LLM)中使用的技术,它允许模型通过提供一组输入输出示例(即“demonstrations”)来适应新任务,而无需对模型参数进行显…...
【STM32】软件I2C读写MPU6050
文章目录 软件I2C读写MPU6050接线图代码整体框架MyI2C模块MyI2C.cMyI2C.h MPU6050模块MPU6050.cMPU6050_Reg.h MPU6050.h main.c 源程序 软件I2C读写MPU6050 要实现软件I2C读写MPU6050分为两个部分: 完成软件I2C协议时序基于I2C协议读写寄存器操控MPU6050 接线图…...
HarmonyOS鸿蒙系统上File文件常用操作
HarmonyOS鸿蒙系统上,file文件常用操作记录 1.创建文件 createFile(fileName: string, content: string): string {// 获取应用文件路径let context getContext(this) as common.UIAbilityContext;let filesDirPath context.filesDir / fileName;// 新建并打开…...
如何解决Java EasyExcel 导出报内存溢出
如何解决Java EasyExcel 导出报内存溢出 EasyExcel大数据量导出常见方法 1. 分批写入 EasyExcel支持分批写入数据,可以将数据分批加载到内存中,分批写入Excel文件,避免一次性将大量数据加载到内存中。 示例代码: String fileNa…...
[产品管理-91]:产品经理的企业运营的全局思维-1
目录 前言:企业架构图 产品经理的企业运营全局思维 1、用户 - 用户价值与体验:真正的需求,真正的问题,一切的原点 2、大势 - 顺应宏观大势:政策趋势、行业趋势、技术趋势 3、市场 - 知己知彼:市场调研…...
学习笔记——stm32看门狗
目录 一、WDG简介 二、IWDG框图 2.1独立看门狗结构 2.2键寄存器 2.3超时时间 三、WWDG框图 3.1窗口看门狗结构 3.2WWDG时序图 3.3最早、最晚时间 四、IWDG和WWDG对比 五、IWDG相关库函数和应用 5.1相关库函数 5.2应用 六、WWDG相关库函数和应用 6.1相关库函数 6…...
2411rust,cargo清理缓存
原文 Cargo最近在晚间通道上取得了一个不稳定的功能(从nightly-2023-11-17开始),它可自动清理Cargo主目录中的缓存内容. 总之,请求使用晚间通道的人启用此功能,并在Cargo问题跟踪器上报告问题.要启用它,请在你的一般在~/.cargo/config.toml或%USERPROFILE%\.cargo\config.tom…...
高级java每日一道面试题-2024年11月19日-基本篇-获取一个类Class对象的方式有哪些?
如果有遗漏,评论区告诉我进行补充 面试官: 获取一个类Class对象的方式有哪些? 我回答: 在 Java 中,获取一个类的 Class 对象有多种方式。这些方式各有优缺点,适用于不同的场景。以下是常见的几种方法及其详细解释: 1. 使用 new 关键字实…...
Vue 3与TypeScript集成指南:构建类型安全的前端应用
在Vue 3中使用TypeScript,可以让你的组件更加健壮和易于维护。以下是使用TypeScript与Vue 3结合的详细步骤和知识点: 1. 环境搭建 首先,确保你安装了Node.js(推荐使用最新的LTS版本)和npm或Yarn。然后,安…...
可视化建模与UML《活动图实验报告》
你当像鸟飞往你的山。 一、实验目的: 1、熟悉活动图的基本功能和使用方法。 2、掌握使用建模工具软件绘制协作图的方法 二、实验环境: window7 | 10 | 11 EA15 三、实验内容: <1>绘制学生选课系统中添加课程(Add Course)用例的活动图…...
接雨水
接雨水 1、 题目描述2、解题思路 1、 题目描述 给定 n 个非负整数表示每个宽度为 1 的柱子的高度图,计算按此排列的柱子,下雨之后能接多少雨水。 2、解题思路 本题使用了双指针,根据下图可以得出,下标 i 处能接的雨水量由左边…...
i春秋-签到题
练习平台地址 竞赛中心 题目描述 题目内容 点击GUESS后会有辨识细菌的选择题 全部完成后会有弹窗提示 输入nickname后提示获得flag F12检查 元素中没有发现信息 检查后发现flag在控制台中 flag flag{663a5c95-3050-4c3a-bb6e-bc4f2fb6c32e} 注意事项 flag不一定要在元素中找&a…...
Selenium + 数据驱动测试:从入门到实战!
引言 在软件测试中,测试数据的多样性和灵活性对测试覆盖率至关重要。而数据驱动测试(Data-Driven Testing)通过将测试逻辑与数据分离,极大地提高了测试用例的可维护性和可扩展性。本文将结合Selenium这一流行的测试工具࿰…...
考研倒计时30天丨和西电一起向前!再向前!
上岸后 就能来 西安电子科技大学 和学长学姐一起吃饭,XDU食堂都有你想要的一切 ①、海棠篇:海棠新生初入校园,还在犹豫吃什么?宿舍楼边的海棠餐厅物美价廉,满足你一日三餐的需求与期盼! 俗话说:…...
json数组写入文件每行一条数据
我们知道将json或json数组写入文件,一般是用JSON.stringify先将json或json数组转成字符串,再写入文件。JSON.stringify()的语法是这样的:JSON.stringify(value[, replacer[, space]]) JSON.stringify(value)调用则不带空格tab换行等分隔符&am…...
EasyExcel并行导出多个excel文件并压缩下载
EasyExcel并行导出多个excel文件并压缩下载 在SpringBoot应用中,采用同步方式导出Excel文件会导致服务器在生成文件期间阻塞,特别是在处理大量数据时,这种效率较低的方法会严重影响性能。为了解决这个问题,可以采用以下改进措施:首先将导出的数据进行拆分,然后利用Compl…...
hadoop3.x 新特性
hadoop3.x 新特性 FeaturesHadoop 2.xHadoop 3.xMinimum Required Java VersionJDK 6 and above.JDK 8 is the minimum runtime version of JAVA required to run Hadoop 3.x as many dependency library files have been used from JDK 8.Fault ToleranceFault Tolerance is …...