Laravel 对接阿里云 OSS 说明文档
Laravel 对接阿里云 OSS 说明文档
一、 简介
将 Laravel 应用与阿里云对象存储服务 (OSS) 对接,可以利用 OSS 提供的高可用、高可靠、可扩展的存储能力来管理应用中的文件,例如用户上传的图片、视频、文档等。这有助于减轻应用服务器的存储压力,提高文件访问速度,并简化文件的管理和备份。
二、 对接逻辑概述
对接的核心逻辑主要分为以下几个部分:
- 引入 SDK: 使用 PHP 的包管理工具 Composer 安装阿里云官方提供的 OSS PHP SDK。
- 配置凭证: 在 Laravel 应用中安全地配置访问 OSS 所需的凭证信息(Access Key ID, Access Key Secret)以及相关的 Bucket 信息(Endpoint, Bucket Name)。
- 初始化客户端: 在 Laravel 启动时,根据配置信息实例化 OSS SDK 的核心客户端 (
OssClient
)。推荐通过 Laravel 的服务提供者 (Service Provider) 将客户端实例绑定到服务容器中,方便后续依赖注入和复用。 - 封装服务 (推荐): 创建一个专门的服务类 (Service Class) 来封装具体的 OSS 操作逻辑(如文件上传、删除等)。这样做可以使代码结构更清晰,提高可重用性和可测试性。
- 调用服务: 在需要进行文件操作的地方(通常是控制器 Controller),通过依赖注入获取封装好的服务实例,并调用其提供的方法来与 OSS 进行交互。
三、 前提条件
- 拥有一个阿里云账号。
- 已开通对象存储 OSS 服务。
- 已创建一个 OSS Bucket (存储空间)。
- 获取了用于访问 OSS 的 AccessKey ID 和 AccessKey Secret。请务必妥善保管这些密钥,不要泄露。
- 了解你的 Bucket 的 Endpoint (访问域名,例如
oss-cn-hangzhou.aliyuncs.com
)。 - 知道你的 Bucket 名称。
四、 详细配置步骤
步骤一:安装 OSS PHP SDK
在你的 Laravel 项目根目录下,打开终端,执行以下 Composer 命令:
composer require aliyuncs/oss-sdk-php
步骤二:配置环境变量 (.env 文件)
打开项目根目录下的 .env
文件,添加以下配置项,并将等号右侧的值替换为你自己的信息:
OSS_ACCESS_KEY_ID=你的AccessKeyId
OSS_ACCESS_KEY_SECRET=你的AccessKeySecret
OSS_ENDPOINT=你的Bucket对应的Endpoint # 例如: oss-cn-hangzhou.aliyuncs.com
OSS_BUCKET=你的Bucket名称
OSS_URL= # 你的Bucket的公共访问域名 (可选,如果需要生成公开URL或按URL删除时配置)
OSS_ACCESS_KEY_ID
: 阿里云提供的 AccessKey ID。OSS_ACCESS_KEY_SECRET
: 阿里云提供的 AccessKey Secret。OSS_ENDPOINT
: 你的 Bucket 所在地域的访问域名。注意:不要包含http://
或https://
前缀。OSS_BUCKET
: 你创建的 Bucket 名称。OSS_URL
: (可选) 如果你的 Bucket 设置为公共读,或者你希望生成不带签名的公开访问链接,可以配置此项为你的 Bucket 的外网访问域名 (例如https://your-bucket.oss-cn-hangzhou.aliyuncs.com
)。如果需要通过完整 URL 删除文件,此项也是必需的。
步骤三:创建配置文件 (config/oss.php)
为了方便在代码中获取配置,建议创建一个专门的配置文件。在 config
目录下创建一个新文件 oss.php
,内容如下:
<?phpreturn ['access_key_id' => env('OSS_ACCESS_KEY_ID'),'access_key_secret' => env('OSS_ACCESS_KEY_SECRET'),'endpoint' => env('OSS_ENDPOINT'),'bucket' => env('OSS_BUCKET'),'url' => env('OSS_URL'), // 读取 .env 中的可选配置// 你可以在这里添加其他 OSS 相关配置,例如默认上传目录等
];
这个文件通过 env()
辅助函数读取 .env
文件中的对应值。
步骤四:创建服务提供者 (ServiceProvider)
服务提供者是初始化 OssClient
并将其绑定到 Laravel 服务容器的理想场所。
- 在终端执行以下 Artisan 命令来创建服务提供者(例如命名为
OssServiceProvider
):php artisan make:provider OssServiceProvider
- 打开新创建的
app/Providers/OssServiceProvider.php
文件。 - 在
register
方法中,添加初始化OssClient
并将其绑定为单例 (singleton) 的逻辑。你需要引入OSS\OssClient
类,并使用config('oss.access_key_id')
等方式读取配置。确保对配置不完整或客户端创建失败的情况进行异常处理。
步骤五:注册服务提供者
为了让 Laravel 加载并执行你的 OssServiceProvider
,需要将其注册到应用中。
- 打开
config/app.php
文件。 - 找到
providers
数组。 - 在数组的应用服务提供者 (Application Service Providers) 部分,添加你的服务提供者类的完整命名空间路径:
'providers' => [// ... 其他服务提供者App\Providers\OssServiceProvider::class, // 添加这一行 ],
五、 使用方式 (概念)
完成以上配置后,你就可以在应用中使用 OSS 服务了:
- 创建服务类 (推荐): 创建一个例如
App\Services\OssStorageService
的类。 - 注入
OssClient
: 在OssStorageService
的构造函数中,通过类型提示注入OssClient
(public function __construct(OssClient $ossClient)
)。Laravel 会自动从服务容器中解析并传入我们在OssServiceProvider
中绑定的实例。 - 封装方法: 在服务类中创建具体的操作方法,如
uploadFile(UploadedFile $file, ?string $directory = 'uploads')
、deleteFile(string $objectName)
、deleteFileByUrl(string $fileUrl)
等。这些方法内部调用$this->ossClient
的相应方法 (putObject
,deleteObject
等) 来执行操作。你可以在这些方法中加入路径构建(例如根据APP_ENV
添加环境目录)、错误记录等逻辑。 - 在控制器中使用: 在需要进行文件操作的控制器(例如
UploadController
)的构造函数中,注入你创建的服务类 (public function __construct(OssStorageService $ossService)
)。 - 调用服务方法: 在控制器的方法中,调用注入的服务实例的方法来完成上传或删除等操作 (
$result = $this->ossService->uploadFile($request->file('file'));
)。控制器负责处理 HTTP 请求验证和返回 HTTP 响应,而具体的存储逻辑由服务类处理。
六、 关键注意事项
- Bucket 权限: 根据你的需求设置 Bucket 的读写权限。如果是私有 Bucket,访问文件需要生成带签名的 URL (
OssClient::signUrl()
)。 - 错误处理: 务必在服务类和控制器中添加健壮的错误处理逻辑,捕获可能发生的
OssException
以及其他异常(如网络超时、配置错误、文件读取失败等),并进行日志记录和用户友好的错误提示。 - 大文件上传: 对于非常大的文件,直接读取全部内容再上传 (
putObject
配合file_get_contents
) 可能导致内存不足。应考虑使用 OSS SDK 提供的分片上传功能 (uploadFile
或multiuploadFile
)。 - 安全性: 永远不要将 AccessKey ID 和 Secret 硬编码在代码中或提交到版本控制系统(如 Git)。务必使用
.env
文件管理,并将.env
文件添加到.gitignore
中。 - 配置缓存: 在生产环境中,记得运行
php artisan config:cache
命令来缓存配置文件,提高性能。修改.env
文件后需要重新运行此命令。
遵循以上步骤和逻辑,你就可以顺利地在 Laravel 应用中集成阿里云 OSS,实现高效、可靠的文件存储管理。
相关代码:https://gitee.com/luxiaofeng16/laravel-10-oss
相关文章:
Laravel 对接阿里云 OSS 说明文档
Laravel 对接阿里云 OSS 说明文档 一、 简介 将 Laravel 应用与阿里云对象存储服务 (OSS) 对接,可以利用 OSS 提供的高可用、高可靠、可扩展的存储能力来管理应用中的文件,例如用户上传的图片、视频、文档等。这有助于减轻应用服务器的存储压力&#x…...
嘻游电玩三端客户端部署实战:PC + Android + iOS 环境全覆盖教程
本篇文章将针对“网狐系列嘻游电玩组件”的三端客户端(PC端、安卓端、iOS端)进行详细部署实操讲解。文章将以实测部署为核心,提供资源结构说明、平台适配调整、打包配置、常见问题修复,并辅以必要的关键配置代码。 一、客户端资源…...
mockMvc构建web单元测试学习笔记
web应用本来需要依靠tomcat这个环境运行 现在用mockMvc是为了模拟这个web环境,简化测试 什么是mock(模拟) 模拟对象---mock object是以可控方式模拟真实对象行为的假对象,通过模拟输入数据,验证程序达到预期结果 为什么使用mock对象 因为…...
ffmpeg av_buffer_unref的逻辑实现; av_freep 和 av_freep函数的区别
av_buffer_unref 是 FFmpeg 中用于管理引用计数和内存释放的核心函数,其内部实现机制如下: 一、核心流程 引用计数递减 函数首先对 AVBufferRef 的 buffer->refcount 进行原子递减操作(通过 atomic_fetch_add_explicit 等机制保证…...
Flutter IOS 真机 Widget 错误。Widget 安装后系统中没有
错误信息: SendProcessControlEvent:toPid: encountered an error: Error Domaincom.apple.dt.deviceprocesscontrolservice Code8 "Failed to show Widget com.xxx.xxx.ServerStatus error: Error DomainFBSOpenApplicationServiceErrorDomain Code1 "T…...
Jenkins plugin 的用法和示例
今天介绍一下比较常见的Jenkins plugin 的使用方法 1. 通过AWS s3 upload 插件上传文件到AWS S3 存储桶 前提条件: 安装AWS pipeline step插件在Jenkins 中创建credentials,包含access_key_id和secret_key_id创建S3 存储桶 脚本: pipeli…...
利用java语言,怎样开发和利用各种开源库和内部/自定义框架,实现“提取-转换-加载”(ETL)流程的自动化
一、ETL 架构设计的核心要素 在企业级数据处理场景中,ETL(Extract-Transform-Load)流程自动化是数据仓库、数据湖建设的核心环节。基于 Java 生态的技术栈,我们可以构建分层解耦的 ETL 架构,主要包含以下四层结构&am…...
人工智能在PET-CT中的应用方向探析
人工智能(AI)在正电子发射断层扫描-计算机断层扫描(PET-CT)中的应用正逐步改变医学影像诊断的格局,其核心价值体现在提升诊断效率、优化成像质量、促进精准医疗等方面。近年来,随着深度学习、计算机视觉以及多模态数据融合技术的迅猛发展,AI技术在PET-CT全流程中的渗透愈…...
pod 创建私有库指南
步骤 参考:iOS Pod 私有库创建指南-百度开发者中心 下面主要是对参考链接里面的解释: 创建两个仓库: 一个叫podframe.git,用来存放自定义的framework,比如TestPodFrame.framework一个叫podspec.git,用来…...
操作系统之shell实现(下)
🌟 各位看官好,我是maomi_9526! 🌍 种一棵树最好是十年前,其次是现在! 🚀 今天来学习C语言的相关知识。 👍 如果觉得这篇文章有帮助,欢迎您一键三连,分享给更…...
【设计模式】深入解析代理模式(委托模式):代理模式思想、静态模式和动态模式定义与区别、静态代理模式代码实现
代理模式 代理模式,也叫委托模式。 Spring AOP 是基于动态代理来实现 AOP 的 定义 为其他对象提供一种代理 以控制对这个对象的访问。它的作用就是通过提供一个代理类,让我们在调用目标方法的时候,不再是直接对目标方法进行调用,而…...
Element Plus表格组件深度解析:构建高性能企业级数据视图
一、架构设计与核心能力 Element Plus的表格组件(el-table)基于Vue 3的响应式系统构建,通过声明式配置实现复杂数据渲染。其核心设计理念体现在三个层级: 数据驱动:通过data属性绑定数据源,支持动态更新与…...
Mongodb分布式文件存储数据库
文章目录 一、MongoDB 简介基本信息特点内部组件 二、MongoDB 部署1. 安装依赖2. 解压部署并配置环境变量3. 修改配置文件以及启动服务4.数据库权限管理 三、MongoDB 管理1. 角色权限2. 操作命令用户管理命令常用命令(Mongo4.2.8)数据库相关用户相关集合…...
UML 通信图对象协作:共享汽车系统交互脉络
目录 一、通信图的定义与特点 二、通信图的构成要素 三、通信图的优势 四、通信图的实践应用 五、以共享汽车系统通信图为例 (一)参与者及交互起点 (二)预订环节交互 (三)支付流程交互 ࿰…...
安宝特分享|AR智能装备赋能企业效率跃升
AR装备开启智能培训新时代 在智能制造与数字化转型浪潮下,传统培训体系正面临深度重构。安宝特基于工业级AR智能终端打造的培训系统,可助力企业构建智慧培训新生态。 AR技术在不同领域的助力 01远程指导方面 相较于传统视频教学的单向输出模式&#x…...
中间系统-基础
OSI七层模型,TCP/IP四层模型。 在OSI模型中我们将具有报文转发的网络节点叫做IS,即中间系统的意思,类似于TCP/IP模型中的路由器。 在OSI模型中我们将没有路由能力或者转发能力的设备叫做ES,即端系统的意思,类似于TCP/I…...
【Linux】用户权限
shell命令 1. Linux本质上是一个操作系统,但是一般的用户不能直接使用它,而是需要通过外壳程序shell,来与Linux内核进行沟通。 2. shell的简单定义:命令行解释器。主要包含以下作用: 将使用者的命令翻译给核心处理。将…...
晶振详解:原理、作用、种类、应用与选型要点
一、晶振的基本定义 晶振(Crystal Oscillator) 是利用石英晶体的压电效应产生稳定频率的电子元件,其核心功能是为数字系统提供高精度时钟信号。 核心公式: 串联谐振频率(fs) 1 / (2π√(L1C1)) ÿ…...
【数字图像处理】立体视觉基础(2)
相机标定 【1】相机标定的概念 相机参数:相机成像的几何模型的参数 相机标定:求解参数的过程 【2】相机标定的作用 (1)求出相机的内、外参数,以及畸变参数 (2)校正镜头畸变影响,…...
智能座舱测试内容与步骤
智能座舱的测试步骤通常包括以下环节: 1.测试环境搭建与准备 • 硬件需求分析:准备测试车辆、服务器与工作站、网络设备以及传感器和执行器模拟器等硬件设备。 • 软件需求分析:选择测试管理软件、自动化测试工具、模拟软件和开发调试工具等。…...
每日算法-250422
每日算法 - 250422 1561. 你可以获得的最大硬币数目 题目 思路 贪心 解题过程 根据题意,我们想要获得最大的硬币数目。每次选择时,有三堆硬币:最大的一堆会被 Alice 拿走,最小的一堆会被 Bob 拿走,剩下的一堆…...
XSS的应用
免责声明,本博客只是用来自身学习记录,不要运用里面的代码去进行违法犯罪行为。 XSS 首先需要知道的是xss误区,就是在不确定是否有XSS的情况下,不应该是直接上攻击payload,例如<script>alert(123)</script&…...
FastAPI WebSocket 聊天应用详细教程
项目简介 这是一个基于 FastAPI 和 WebSocket 实现的实时聊天应用,支持一对一聊天、离线消息存储等功能。 技术栈 后端:FastAPI (Python)前端:HTML、JavaScript、CSS通信:WebSocket认证:简单的 token 认证 项目结构…...
【C语言】动态内存的常见错误
前言: 在上章节中讲解了动态内存的概念和管理的核心函数。 在本章节继续为大家介绍动态内存的常见错误,让大家更好的理解运用。 补充:使用内存函数需要头文件<stdlib.h> 对NULL指针的解引用操作 当使用malloc、calloc或realloc等函…...
Missashe考研日记-day24
Missashe考研日记-day24 1 专业课408 学习时间:2h30min学习内容: 今天把剩下的两个经典同步问题和管程部分的课看了,然后做课后习题。这部分的重点在PV大题,很多很经典,不过第一轮不打算做大题,把选择题做…...
精益数据分析(13/126):洞察数据关系,灵活调整创业方向
精益数据分析(13/126):洞察数据关系,灵活调整创业方向 大家好!在创业和数据分析的探索之路上,每一次的学习都是成长的宝贵机会。今天,咱们接着深入学习《精益数据分析》,一起探索相…...
常用python爬虫框架介绍
文章目录 前言1. Scrapy2. BeautifulSoup 与 Requests 组合3. Selenium4. PySpider 前言 Python 有许多优秀的爬虫框架,每个框架都有其独特的特点和适用场景。以下为你详细介绍几个常用的 Python 爬虫框架: Python 3.13.2 安装教程(附安装包…...
HarmonyOS:网络HTTP数据请求
导读 场景介绍接口说明request接口开发步骤requestInStream接口开发步骤证书锁定预置应用级证书预置证书公钥哈希值JSON配置文件示例 场景介绍 通过HTTP发起一个数据请求,支持常见的GET、POST、OPTIONS、HEAD、PUT、DELETE、TRACE、CONNECT方法 接口说明 HTTP数据…...
CoinNexus Chain 推出泰利风暴,开启 Web3.0 智能金融元宇宙科技新时代
4月25日,CoinNexusChain 区块链正式推出开创性的“泰利风暴”(Terry Storm),再次展现了其前瞻性的视野和非凡的潜力。这标志着 CoinNexusChain 在 Web3.0 创新浪潮中迈出了重要一步。 Terry是一种创新的 RWA 金融激励机制&…...
编译opencv源码使得opencv-python获得gstreamer支持
我个人习惯在miniconda中使用python版本的opencv,使用pip进行安装时,默认的包并不会有gstreamer支持,我尝试过自己编译opencv-python,编出的包有各种各样的问题。最终还是决定自己从opencv仓库源码自行编译。 安装gstreamer apt…...
眼镜眨巴眨巴-一步几个脚印从头设计数字生命2——仙盟创梦IDE
import cv2 import mediapipe as mp import numpy as np import timemp_drawing mp.solutions.drawing_utils mp_face_mesh mp.solutions.face_mesh# 加载图片 image cv2.imread(wlzc.jpg) # image_height, image_width, _ image.shape# 初始化面部网格模型 with mp_face_…...
django之数据的翻页和搜索功能
数据的翻页和搜素功能 目录 1.实现搜素功能 2.实现翻页功能 一、实现搜素功能 我们到bootstrap官网, 点击组件, 然后找到输入框组, 并点击作为额外元素的按钮。 我们需要使用上面红色框里面的组件, 就是搜素组件, 代码部分就是下面红色框框出来的部分。 把这里的代码复制…...
linux复习
1.关于进程 1.1 概念 用户角度:进程是程序的一次执行实例,也就是正在运行的程序 内核角度:操作系统分配内存和cpu资源的实体 操作系统使用内核数据结构 程序的代码及数据 描述进程,Linux中对应的内核数据结构就是task_struct…...
Post-Processing PropertySource instance详解 和 BeanFactoryPostProcessor详解
PropertySourcesBeanFactoryPostProcessor详解 1. 核心概念 BeanFactoryPostProcessor 是 Spring 框架中用于在 BeanFactory 初始化阶段 对 Environment 中的 PropertySource 进行后处理的接口。它允许开发者在 Bean 创建之前 对属性源进行动态修改,例如添加、删除…...
go 编译的 windows 进程(exe)以管理员权限启动(UAC)
引言 windows 系统,在打开某些 exe 的时候,会弹出“用户账户控制(UAC)”的弹窗 “你要允许来自xx发布者的此应用对你的设备进行更改吗?” UAC(User Account Control,用户账户控制)是 Windows 操作系统中的…...
Elasticsearch性能优化实践
一、背景与挑战 基金研报搜索场景中,我们面临以下核心挑战: 数据规模庞大:单索引超500GB原始数据,包含300万份PDF/Word研报文档查询性能瓶颈:复杂查询平均响应时间超过10秒,高峰期CPU负载达95%存储…...
【Web API系列】Web Shared Storage API 深度解析:WindowSharedStorage 接口实战指南
前言 在当今 Web 应用日益复杂的背景下,跨页面数据共享与隐私保护已成为现代浏览器技术演进的重要命题。传统 Web 存储方案(如 Cookies、LocalStorage)在应对多维度用户特征存储、跨上下文数据共享等场景时,逐渐暴露出技术瓶颈与…...
Eureka、LoadBalance和Nacos
Eureka、LoadBalance和Nacos 一.Eureka引入1.注册中心2.CAP理论3.常见的注册中心 二.Eureka介绍1.搭建Eureka Server 注册中心2.搭建服务注册3.服务发现 三.负载均衡LoadBalance1.问题引入2.服务端负载均衡3.客户端负载均衡4.Spring Cloud LoadBalancer1).快速上手2)负载均衡策…...
智能体MCP 实现数据可视化分析
参考: 在线体验 https://www.doubao.com/chat/ 下载安装离线体验 WPS软件上的表格分析 云上创建 阿里mcp:https://developer.aliyun.com/article/1661198 (搜索加可视化) 案例 用cline 或者cherry studio实现 mcp server:excel-mcp-server、quickchart-mcp-server...
3小时速通Python-Python学习总部署、总预览(一)
目录 Python的关键字有哪些: 编辑 代码:1-5: 代码:6-10: 代码:11-15: 代码:16-20: 代码:21-25: 代码:26-27: Pyt…...
机器学习基础 - 分类模型之决策树
决策树 文章目录 决策树简介决策树三要素1. 特征的选择1. ID32. C4.53. CART2. 剪枝处理0. 剪枝的作用1. 预剪枝2. 后剪枝QA1. ID3, C4.5, CART 这三种决策树的区别2. 树形结构为何不需要归一化?3. 分类决策树与回归决策树的区别4. 为何信息增益会偏向多取值特征?4. 为何信息…...
Java面向对象的三大特性
## 1. 封装(Encapsulation) 封装是将数据和操作数据的方法绑定在一起,对外部隐藏对象的具体实现细节。通过访问修饰符来实现封装。 示例代码: java public class Student { // 私有属性 private String name; private int age; …...
【Pandas】pandas DataFrame truediv
Pandas2.2 DataFrame Binary operator functions 方法描述DataFrame.add(other)用于执行 DataFrame 与另一个对象(如 DataFrame、Series 或标量)的逐元素加法操作DataFrame.add(other[, axis, level, fill_value])用于执行 DataFrame 与另一个对象&…...
GTS-400 系列运动控制器板(六)----修改编码器计数方向
运动控制器函数库的使用 运动控制器驱动程序、 dll 文件、例程、 Demo 等相关文件请通过固高科技官网下载,网 址为: www.googoltech.com.cn/pro_view-3.html 1 Windows 系统下动态链接库的使用 在 Windows 系统下使用运动控制器,首先要安装驱动程序。在安装前需要提…...
卷积神经网络迁移学习:原理与实践指南
引言 在深度学习领域,卷积神经网络(CNN)已经在计算机视觉任务中取得了巨大成功。然而,从头开始训练一个高性能的CNN模型需要大量标注数据和计算资源。迁移学习(Transfer Learning)技术为我们提供了一种高效解决方案,它能够将预训练模型的知识…...
Django 入门实战:从环境搭建到构建你的第一个 Web 应用
Django 入门实战:从环境搭建到构建你的第一个 Web 应用 恭喜你选择 Django 作为你学习 Python Web 开发的起点!Django 是一个强大、成熟且功能齐全的框架,非常适合构建中大型的 Web 应用程序。本篇将通过一个简单的例子,带你走完…...
【后端】构建简洁的音频转写系统:基于火山引擎ASR实现
在当今数字化时代,语音识别技术已经成为许多应用不可或缺的一部分。无论是会议记录、语音助手还是内容字幕,将语音转化为文本的能力对提升用户体验和工作效率至关重要。本文将介绍如何构建一个简洁的音频转写系统,专注于文件上传、云存储以及…...
http通信之axios vs fecth该如何选择?
在HTTP通信中,axios和fetch都是常用的库或原生API用于发起网络请求。两者各有特点,适用于不同的场景。下面详细介绍它们的差异和各自的优势: fetch 特点: 原生支持:fetch是现代浏览器内置的API,不需要额外…...
iostat指令介绍
文章目录 1. 功能介绍2. 语法介绍3. 应用场景4. 示例分析 1. 功能介绍 iostat (input/output statistics),是 Linux/Unix 系统中用于监控 CPU 使用率和 磁盘 I/O 性能的核心工具,可实时展示设备负载、吞吐量、队列状态等关键指标。 可以使用 man iostat查…...
NLP高频面试题(五十)——大模型(LLMs)分词(Tokenizer)详解
在自然语言处理(NLP)任务中,将文本转换为模型可处理的数字序列是必不可少的一步。这一步通常称为分词(tokenization),即把原始文本拆分成一个个词元(token)。对于**大型语言模型(LLM,Large Language Model,大型语言模型)**而言,选择合适的分词方案至关重要:分词的…...