当前位置：首页 > news >正文

lightgbm做分类

news 来源：原创 2025/5/24 4:16:29


```python
import pandas as pd#导入csv文件的库
import numpy as np#进行矩阵运算的库
import json#用于读取和写入json数据格式#model lgb分类模型,日志评估,早停防止过拟合
from  lightgbm import LGBMClassifier,log_evaluation,early_stopping
#metric
from sklearn.metrics import roc_auc_score#导入roc_auc曲线
#KFold是直接分成k折,StratifiedKFold还要考虑每种类别的占比
from sklearn.model_selection import StratifiedKFold#config
class Config():seed=2024#随机种子num_folds=10#K折交叉验证TARGET_NAME ='label'#标签
import random#提供了一些用于生成随机数的函数
#设置随机种子,保证模型可以复现
def seed_everything(seed):np.random.seed(seed)#numpy的随机种子random.seed(seed)#python内置的随机种子
seed_everything(Config.seed)path='/kaggle/input/'
#sample: Iki037dt dict_keys(['name', 'normal_data', 'outliers'])
with open(path+"whoiswho-ind-kdd-2024/IND-WhoIsWho/train_author.json") as f:train_author=json.load(f)
#sample : 6IsfnuWU dict_keys(['id', 'title', 'authors', 'abstract', 'keywords', 'venue', 'year'])   
with open(path+"whoiswho-ind-kdd-2024/IND-WhoIsWho/pid_to_info_all.json") as f:pid_to_info=json.load(f)
#efQ8FQ1i dict_keys(['name', 'papers'])
with open(path+"whoiswho-ind-kdd-2024/IND-WhoIsWho/ind_valid_author.json") as f:valid_author=json.load(f)with open(path+"whoiswho-ind-kdd-2024/IND-WhoIsWho/ind_valid_author_submit.json") as f:submission=json.load(f)train_feats=[]
labels=[]
for id,person_info in train_author.items():for text_id in person_info['normal_data']:#正样本feat=pid_to_info[text_id]#['title', 'abstract', 'keywords', 'authors', 'venue', 'year']try:train_feats.append([len(feat['title']),len(feat['abstract']),len(feat['keywords']),len(feat['authors']),len(feat['keywords']),int(feat['year'])])except:train_feats.append([len(feat['title']),len(feat['abstract']),len(feat['keywords']),len(feat['authors']),len(feat['keywords']),2000])labels.append(1)for text_id in person_info['outliers']:#负样本feat=pid_to_info[text_id]#['title', 'abstract', 'keywords', 'authors', 'venue', 'year']try:train_feats.append([len(feat['title']),len(feat['abstract']),len(feat['keywords']),len(feat['authors']),len(feat['keywords']),int(feat['year'])])except:train_feats.append([len(feat['title']),len(feat['abstract']),len(feat['keywords']),len(feat['authors']),len(feat['keywords']),2000])labels.append(0)   
train_feats=np.array(train_feats)
labels=np.array(labels)
print(f"train_feats.shape:{train_feats.shape},labels.shape:{labels.shape}")
print(f"np.mean(labels):{np.mean(labels)}")
train_feats=pd.DataFrame(train_feats)
train_feats['label']=labels
train_feats.head()valid_feats=[]
for id,person_info in valid_author.items():for text_id in person_info['papers']:feat=pid_to_info[text_id]#['title', 'abstract', 'keywords', 'authors', 'venue', 'year']try:valid_feats.append([len(feat['title']),len(feat['abstract']),len(feat['keywords']),len(feat['authors']),len(feat['keywords']),int(feat['year'])])except:valid_feats.append([len(feat['title']),len(feat['abstract']),len(feat['keywords']),len(feat['authors']),len(feat['keywords']),2000])
valid_feats=np.array(valid_feats)
print(f"valid_feats.shape:{valid_feats.shape}")
valid_feats=pd.DataFrame(valid_feats)
valid_feats.head()choose_cols=[col for col in valid_feats.columns]
def fit_and_predict(model,train_feats=train_feats,test_feats=valid_feats,name=0):X=train_feats[choose_cols].copy()y=train_feats[Config.TARGET_NAME].copy()test_X=test_feats[choose_cols].copy()oof_pred_pro=np.zeros((len(X),2))test_pred_pro=np.zeros((Config.num_folds,len(test_X),2))#10折交叉验证skf = StratifiedKFold(n_splits=Config.num_folds,random_state=Config.seed, shuffle=True)for fold, (train_index, valid_index) in (enumerate(skf.split(X, y.astype(str)))):print(f"name:{name},fold:{fold}")X_train, X_valid = X.iloc[train_index], X.iloc[valid_index]y_train, y_valid = y.iloc[train_index], y.iloc[valid_index]model.fit(X_train,y_train,eval_set=[(X_valid, y_valid)],callbacks=[log_evaluation(100),early_stopping(100)])oof_pred_pro[valid_index]=model.predict_proba(X_valid)#将数据分批次进行预测.test_pred_pro[fold]=model.predict_proba(test_X)print(f"roc_auc:{roc_auc_score(y.values,oof_pred_pro[:,1])}")return oof_pred_pro,test_pred_pro
#参数来源:https://www.kaggle.com/code/daviddirethucus/home-credit-risk-lightgbm
lgb_params={"boosting_type": "gbdt","objective": "binary","metric": "auc","max_depth": 12,"learning_rate": 0.05,"n_estimators":3072,"colsample_bytree": 0.9,"colsample_bynode": 0.9,"verbose": -1,"random_state": Config.seed,"reg_alpha": 0.1,"reg_lambda": 10,"extra_trees":True,'num_leaves':64,"verbose": -1,"max_bin":255,}lgb_oof_pred_pro,lgb_test_pred_pro=fit_and_predict(model= LGBMClassifier(**lgb_params),name='lgb')
test_preds=lgb_test_pred_pro.mean(axis=0)[:,1]cnt=0
for id,names in submission.items():for name in names:submission[id][name]=test_preds[cnt]cnt+=1
with open('baseline.json', 'w', encoding='utf-8') as f:json.dump(submission, f, ensure_ascii=False, indent=4)

lightgbm做分类

python import pandas as pd#导入csv文件的库 import numpy as np#进行矩阵运算的库 import json#用于读取和写入json数据格式#model lgb分类模型,日志评估,早停防止过拟合 from lightgbm import LGBMClassifier,log_evaluation,early_stopping #metric from sklearn.metrics …...

编程日记 2025/5/24 4:16:29

下载Visual Studio Community 2019

官方链接如下：Visual Studio Community 2019下载链接 https://learn.microsoft.com/zh-cn/visualstudio/releases/2019/system-requirements#download 目前官方仅建议2022版，已经关闭vs2019等旧版本，哪天开放了，记得踢我一下。 …...

编程日记 2025/5/25 3:28:07

深入理解MySQL事务（万字详）

文章目录什么是事务为什么会出现事务事务的版本支持事务的提交方式事务常见操作方式正常演示 - 证明事务的开始与回滚非正常演示1 - 证明未commit，客户端崩溃，MySQL自动会回滚（隔离级别设置为读未提交）非正常演示2 - 证明commit了…...

编程日记 2025/5/25 2:49:52

FFPlay命令全集合

FFPlay是以FFmpeg框架为基础，外加渲染音视频的库libSDL构建的媒体文件播放器。 ffplay工具下载并播放视频，可以辅助卡看流信息。官网下载地址：http://ffmpeg.org/download.html#build-windows 下载build好的exe程序： 此处下载…...

编程日记 2025/5/20 3:46:34

AI编程工具使用技巧：在Visual Studio Code中高效利用阿里云通义灵码

AI编程工具使用技巧：在Visual Studio Code中高效利用阿里云通义灵码前言一、通义灵码介绍1.1 通义灵码简介1.2 主要功能1.3 版本选择1.4 支持环境二、Visual Studio Code介绍1.1 VS Code简介1.2 主要特点三、安装VsCode3.1下载VsCode3.2.安装VsCode3.3 打开VsCod…...

编程日记 2025/5/19 15:34:23

开源的Text-to-SQL工具WrenAI

WrenAI是一个开源的Text-to-SQL工具，旨在通过自然语言交互界面，帮助用户更便捷地查询数据库。以下是对WrenAI的详细介绍： 一、主要功能自然语言交互：用户可以通过对话方式提出问题，WrenAI能够理解和解析复杂的查询需…...

编程日记 2025/5/20 10:33:01

python创建一个httpServer网页上传文件到httpServer

一、代码 1.server.py import os from http.server import SimpleHTTPRequestHandler, HTTPServer import cgi # 自定义请求处理类 class MyRequestHandler(SimpleHTTPRequestHandler):# 处理GET请求def do_GET(self):if self.path /:# 响应200状态码self.send_response(2…...

编程日记 2025/5/25 2:13:39

Linux中page、buffer_head、bio的关系

在Linux中，page、buffer_head、bio这三个概念紧密相关，共同构成了块设备I/O和内存管理的重要部分，它们的联系主要体现在以下方面： page与buffer_head 基于page构建：buffer_head通常是基于page来构建的，一…...

编程日记 2025/5/25 2:06:51

C++11新特性之decltype

1.decltype的作用 decltype是C11新增的一个关键字，与auto的功能一样，都是在编译期间推导变量类型的。不了解auto的可以转到——C11新特性之auto。为什么引入decltype？看过上边那篇博客的读者应该知道auto在有些场景中并不适用,所以引入declt…...

编程日记 2025/5/21 23:04:42

对神经网络基础的理解

目录一、《python神经网络编程》二、一些粗浅的认识 1） 神经网络也是一种拟合 2）神经网络不是真的大脑 3）网络构建需要反复迭代三、数字图像识别的实现思路 1）建立一个神经网络类 2）权重更新的具体实现 3&am…...

编程日记 2025/5/21 7:02:00

后端开发Web

Maven Maven是apache旗下的一个开源项目，是一款用于管理和构建java项目的工具 Maven的作用依赖管理方便快捷的管理项目依赖的资源（jar包），避免版本冲突问题统一项目结构提供标准、统一的项目结构项目构建标准跨平台(…...

编程日记 2025/5/25 1:42:35

QT 通过ODBC连接数据库的好方法：

效果图： PWD使用自己的，我的这是自己的，所以你用不了。以下是格式。 // 1. 设置数据库连接 QSqlDatabase db QSqlDatabase::addDatabase("QODBC");// 建立和QMYSQL数据库的连接 // 设置数据库连接名称（DSN&am…...

编程日记 2025/5/25 3:22:18

【Feature Scaling】：加速梯度下降法的利器

目录特征缩放的目的常见的特征缩放方法1. 最小-最大缩放（Min-Max Scaling）2. 标准化（Standardization 或 Z-Score Normalization）3. 最大绝对值缩放（Max Abs Scaling） Rescale的使用场景结论在机器学习中…...

编程日记 2025/5/21 6:46:55

QT：控件属性及常用控件(3)-----输入类控件（正则表达式）

输入类控件既可以进行显示，也能让用户输入一些内容！ 文章目录 1.Line Edit1.1 用户输入个人信息1.2 基于正则表达式的文本限制1.3 验证两次输入的密码是否一致1.4 让输入的密码可以被查看 2.Text Edit2.1 输入和显示同步2.1 其他信号出发情况 3.ComboBox…...

编程日记 2025/5/25 2:57:45

计算机网络（59）无线个人区域网WPAN

前言无线个人区域网（WPAN，Wireless Personal Area Network）是一种以个人为中心，采用无线连接方式的个人局域网。一、定义与特点定义：WPAN是以个人为中心，实现活动半径小、业务类型丰富、面向特定群体的无…...

编程日记 2025/5/20 13:08:30

Python Typing: 实战应用指南

文章目录 1. 什么是 Python Typing？2. 实战案例：构建一个用户管理系统2.1 项目描述2.2 代码实现 3. 类型检查工具：MyPy4. 常见的 typing 用法5. 总结在 Python 中，静态类型检查越来越受到开发者的重视。typing 模块提供了一种方式…...

编程日记 2025/5/25 2:16:39

Redis存储③Redis基本命令+内部编号和架构

目录 1. Redis 命令行客户端 1.1 与 Redis 服务器交互 1.2 set 和 get 命令 2. 基本全局命令 2.1 keys 2.2 exists 2.3 del 2.4 expire 2.5 ttl 2.6 type 3. 数据结构和内部编码 4. 单线程架构本篇完。 1. Redis 命令行客户端 1.1 与 Redis 服务器交互根据上篇…...

编程日记 2025/5/25 2:05:30

Vivado生成X1或X4位宽mcs文件并固化到flash

1.生成mcs文件 01.在vivado里的菜单栏选择"tools"工具栏 02.在"tools"里选择"生成内存配置文件" 03.配置参数按照FPGA板上的flash型号进行选型，相关配置步骤可参考下图。注意：Flash数据传输位宽如果需要选择X4位宽&am…...

编程日记 2025/5/25 2:13:32

07 区块链安全技术

概述区块链的安全特性区块链解决了在不可靠网络上可靠地传输信息的难题，由于不依赖与中心节点的认证和管理，因此防止了中心节点被攻击造成的数据泄露和认证失败的风险。区块链安全防护的三大特点共识机制代替中心认证机制数据篡改“一发动全身”…...

编程日记 2025/5/23 10:33:22

第84期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找…...

编程日记 2025/5/22 18:17:21

柔性数组与c/c++程序中内存区域的划分

1.柔性数组 1.1柔性数组的定义柔性数组是指在结构体中定义的，其大小在编译时未确定，而在运行时动态分配的数组。这种数组允许结构体的大小根据需要动态变化。语法如下： struct D {int a;int arry1[0]; };struct F {int a;int arry2[]; };…...

编程日记 2025/5/24 10:50:42

react页面定时器调用一组多个接口，如果接口请求返回令牌失效，清除定时器不再触发这一组请求

为了实现一个React页面使用定时器调用一组多个接口，并在任意一个接口请求返回令牌失效时清除定时器且不再触发这一组请求，可以遵循以下步骤： 1. 定义API调用函数：创建一个函数来处理一组API调用。每个API调用都应该检查响应状态以…...

编程日记 2025/5/21 13:48:19

使用 .NET Core 6.0 Web API 上传单个和多个文件

示例代码： https://download.csdn.net/download/hefeng_aspnet/90138968 介绍我们将在 IFormFile 接口和 .NET 提供的其他接口的帮助下，逐步讨论单个和多个文件上传。 .NET 提供了一个 IFormFile 接口，代表 HTTP 请求中传输的文件。此外…...

编程日记 2025/5/19 20:24:01

AJAX笔记入门篇

黑马程序员视频地址： 黑马程序员前端AJAX入门到实战全套教程https://www.bilibili.com/video/BV1MN411y7pw?vd_source0a2d366696f87e241adc64419bf12cab&spm_id_from333.788.videopod.episodes&p2 目录 AJAX 概念和axios 使用什么是AJAX？ …...

编程日记 2025/5/21 13:42:48

RoHS 简介

RoHS（Restriction of Hazardous Substances Directive，限制有害物质指令）是欧盟制定的一项环保法规，旨在限制电气和电子设备中某些有害物质的使用，以减少这些产品对环境和人体健康的危害。 RoHS限制的有害物质及其限量…...

编程日记 2025/5/21 22:31:16

C# 中 default 使用详解

总目录前言在C#中，default 关键字用于表示类型默认值。它可以根据上下文推断出适用的类型，并返回该类型的默认值。随着C#版本的发展，default 的用法也变得更加丰富和灵活。本文将详细介绍 default 在不同场景下的使用方法及其最佳实践。一…...

编程日记 2025/5/20 13:16:46

无人机在城市执法监管中的应用：技术革新与监管挑战

随着科技的不断进步，无人机技术在城市管理中的应用越来越广泛。无人机以其灵活性、高效性和低成本的优势，正在逐渐成为城市执法监管的得力助手。本文将探讨无人机在城市执法监管中的应用现状、技术优势以及面临的挑战。无人机技术在城市执法监管中的应用…...

编程日记 2025/5/24 17:31:55

[ACTF2020 新生赛]Upload1

题目以为是前端验证，试了一下PHP传不上去可以创建一个1.phtml文件。对.phtml文件的解释: 是一个嵌入了PHP脚本的html页面。将以下代码写入该文件中 <script languagephp>eval($_POST[md]);</script><script languagephp>system(cat /flag);&l…...

编程日记 2025/5/11 21:40:45

ASP.NET代码审计 SQL注入篇(简单记录)

sql注入，全局搜索 Request QueryString ToString() select select * aspx是设计页面，而aspx.cs是类页面，也就是说设计页面用到的类信息在这个页面里面，其实就是把设计和实现分离开来。源码 using System; using System.Collect…...

编程日记 2025/5/24 10:32:12

数据结构链表2

目录前言： 一，反转一个链表(迭代) 二，打印一个链表（递归） 三，反转一个链表(递归) 四，双向链表总结前言： 我们根据 [文章链表1] 可以知道链表相比较于数组的优缺点和计算机…...

编程日记 2025/5/23 21:48:22

【leetcode100】二叉树的层序遍历

1、题目描述给你二叉树的根节点 root ，返回其节点值的层序遍历。 （即逐层地，从左到右访问所有节点）。示例 1： 输入：root [3,9,20,null,null,15,7] 输出：[[3],[9,20],[15,7]] 2、初始思路…...

编程日记 2025/5/22 5:53:05

MyBatis进阶

1. 动态SQL 1.1 <if>标签的使用(xml版本) 动态 SQL 是Mybatis的强⼤特性之⼀，能够完成不同条件下不同的 sql 拼接。现在有一个需求.注册分为两种字段：必填字段和⾮必填字段，那如果在添加用户的时候有不确定的字段传⼊，程…...

编程日记 2025/5/21 0:52:03

迅为RK3568开发板驱动指南Linux中通用SPI设备驱动

在前面的章节中我们从0开始编写了一个mcp2515的驱动程序，而跟I2C设备类似，在Linux内核中也有着通用SPI设备驱动，在本章节将会讲解通用SPI设备驱动的使用，并讲解如何在应用程序中通过ioctl对SPI进行配置和使用。硬件：迅…...

编程日记 2025/5/22 15:10:18

DDD架构实战第五讲总结：将领域模型转化为代码

云架构师系列课程之DDD架构实战第五讲总结：将领域模型转化为代码一、引言在前几讲中，我们讨论了领域模型的重要性及其在业务分析中的渐进获得方法。本讲将聚焦于如何将领域模型转化为代码，使得开发人员能够更轻松地实现用户的领域模型。二、从模型到代码：领域驱动设计…...

编程日记 2025/5/25 0:59:14

C++----STL(list)

介绍 list的数据结果是一个带头双向链表。使用有了前面string、vector的基础，后续关于list使用的讲解主要提及与string和vector的不同之处。使用文档：cplusplus.com/reference/list/list/?kwlist 迭代器问题 insert以后迭代器不失效 #include…...

编程日记 2025/5/22 21:24:34

软件测试 —— 性能测试（jmeter）

软件测试 —— 性能测试（jmeter） 什么是jmeter安装jmeterjmeter常用组件线程组取样器结果树我们之前学习了接口测试工具Postman，我们今天要学习的是性能测试工具——jmeter 什么是jmeter Apache JMeter 是一个开源的性能测试工具&#xff…...

编程日记 2025/5/22 7:35:32

Zemax 非序列模式下的颜色检测器和颜色混合

在 Zemax 的非序列模式中，探测器用于捕获系统中射线的信息。可以使用各种类型的探测器来捕获光学系统性能的不同方面，例如矩形探测器，它存储撞击它的 NSC 源射线的能量数据。另一种经常使用的探测器类型是 Detector Color，它是一…...

编程日记 2025/5/24 9:35:28

DBO优化最近邻分类预测matlab

蜣螂优化算法（Dung Beetle Optimizer，简称 DBO）作为一种新兴的群智能优化算法，于 2022 年末被提出，其灵感主要来源于蜣螂的滚球、跳舞、觅食、偷窃以及繁殖等行为。本次使用的数据为 Excel 格式的分类数据集。该数据…...

编程日记 2025/5/21 14:36:23

【第二天】零基础入门刷题Python-算法篇-数据结构与算法的介绍-五种常见的排序算法（持续更新）

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、Python数据结构与算法的详细介绍1.Python中的常用的排序算法1.排序算法的介绍2.五种详细的排序算法代码总结前言提示：这里可以添加本文要记…...

编程日记 2025/5/22 0:22:01

合并两个有序数组（Leetcode）

解题思路： 三个指针： $p1: 指向 nums1 中的最后一个非零元素。$p2: 指向 nums2 的最后一个元素。$p: 指向 nums1 的最后一位，用于存储合并后的元素。从后往前填充： 比较 nums1[$p1] 和 nums2[$p2]，较大的放入 nums1[…...

编程日记 2025/5/18 0:15:32

特殊类设计

[本节目标] 掌握常见特殊类的设计方式 1.请设计一个类，不能被拷贝拷贝只会放生在两个场景中：拷贝构造函数以及赋值运算符重载，因此想要让一个类禁止拷贝，只需让该类不能调用拷贝构造函数以及赋值运算符重载即可。 C98 将拷贝构…...

编程日记 2025/5/20 13:13:35

2025.1.20——一、[RCTF2015]EasySQL1 二次注入|报错注入|代码审计

题目来源：buuctf [RCTF2015]EasySQL1 目录一、打开靶机，整理信息二、解题思路 step 1：初步思路为二次注入，在页面进行操作 step 2：尝试二次注入 step 3：已知双引号类型的字符型注入，构造…...

编程日记 2025/5/6 18:20:35

【esp32-uniapp】uniapp小程序篇02——引入组件库

一、引入组件库（可自行选择其他组件库） 接下来介绍colorUI、uview plus的安装，其他的安装可自行查找教程 1.colorUI weilanwl/coloruicss: 鲜亮的高饱和色彩，专注视觉的小程序组件库下载之后解压，将\coloruicss-ma…...

编程日记 2025/5/20 3:07:41

基于单片机的智能小区门禁系统设计（论文+源码）

1总体架构智能小区门禁系统以STM32单片机和WiFi技术为核心，STM32单片机作为主控单元，通过WiFi模块实现与手机APP的连接，构建整个门禁系统。系统硬件包括RFID模块、指纹识别模块、显示屏、按键以及继电器。通过RFID绑定IC卡、APP面部识别、指…...

编程日记 2025/5/24 10:08:08

tkinter绘制组件（44）——浮出ui控件

tkinter绘制组件（44）——浮出ui控件引言布局函数结构ui框架对齐方向绑定已有控件出现和隐藏逻辑出现和隐藏动画完整代码函数效果测试代码最终效果 github项目pip下载引言 TinUI的浮出ui控件（flyout）其实是一个之间创建在UI框架…...

编程日记 2025/5/24 22:01:09

CDSN 2024博客之星总评选-主题文章创作，我的AI之路-起手篇

CDSN 2024博客之星总评选-主题文章创作，我的AI之路-起手篇一. 回顾自己的机器学习之路二. 2024年的大模型学习三. 对自己的期望一. 回顾自己的机器学习之路自2019年起，我开始涉足机器学习领域，最初接触的是通过模型实现自动化的任务&…...

编程日记 2025/5/20 22:30:30

LLM基础知识

代替你的不是ai，而是会使用ai的人。而在这之上还有会打造ai的人。 1、大语言模型的大体现在哪里 LLM（Large Language Model 大语言模型）的大不仅仅是指训练数据巨大，更指参数数量巨大。参数即模型内部的变量，…...

编程日记 2025/5/23 10:02:15

Linux 网络：交换芯片 EDSA 以太网帧简介

文章目录 1. 前言2. EDSA 协议以太网帧的发送和接收2.1 什么是 EDSA ？2.2 EDSA 以太网帧的发送2.3 EDSA 以太网帧的接收 3. 验证 1. 前言限于作者能力水平，本文可能存在谬误，因此而给读者带来的损失，作者不做任何承诺。 2. EDS…...

编程日记 2025/5/19 1:11:07

【Git版本控制器--3】Git的远程操作

目录理解分布式版本控制系统创建远程仓库仓库被创建后的配置信息克隆远程仓库 https克隆仓库 ssh克隆仓库向远程仓库推送拉取远程仓库忽略特殊文件为什么要忽略特殊文件？ 如何配置忽略特殊文件？ 配置命令别名标签管理理…...

编程日记 2025/5/3 3:49:11

深入理解GPT底层原理--从n-gram到RNN到LSTM/GRU到Transformer/GPT的进化

从简单的RNN到复杂的LSTM/GRU,再到引入注意力机制,研究者们一直在努力解决序列建模的核心问题。每一步的进展都为下一步的突破奠定了基础,最终孕育出了革命性的Transformer架构和GPT大模型。 1. 从n-gram到循环神经网络(RNN)的诞生 1.1 N-gram 模型在深度学习兴起之前,处理…...

编程日记 2025/5/24 21:11:50

相关文章：