Xinference推理框架
概述
GitHub,官方文档。
核心优势
- 性能优化:通过vLLM、SGLang等引擎实现低延迟推理,吞吐量提升2-3倍;
- 企业级支持:支持分布式部署、国产硬件适配及模型全生命周期管理;
- 生态兼容:无缝对接LangChain、LlamaIndex等开发框架,加速AI应用构建。
特性:
- 全面且高效的模型管理
提供模型全生命周期管理功能,从模型导入、版本控制到部署上线,一切尽在掌握。还支持100+最新开源模型,涵盖文本、语音、视频以及embedding/rerank等多个领域,确保用户能够快速适配并使用最前沿的模型。 - 多推理引擎与硬件兼容
为了最大化推理性能,优化多种主流推理引擎,包括vLLM、SGLang、TensorRT等。广泛支持多种硬件平台,无论是国际品牌还是国产GPU(如华为昇腾、海光等),都能实现无缝对接,共同服务于AI推理任务。 - 高性能与分布式架构
借助底层算法优化和硬件加速技术,实现高性能推理。其原生分布式架构更是如虎添翼,支持水平扩展集群,轻松应对大规模数据处理需求。多种调度策略的应用使得Xinference能够灵活适应低延迟、高上下文、高吞吐等不同场景。 - 丰富的企业级特性
除了强大的推理能力外,提供众多企业级特性以满足复杂业务需求。这包括用户权限管理、单点登录、批处理、多租户隔离、模型微调以及全面的可观测性等。这些特性使得Xinference在保障数据安全与合规性的同时,也大大提升业务运营的效率与灵活性。
核心功能模块:
- 聊天&生成:大语言模型(LLM)
- 内置模型:支持Qwen、ChatGLM3、Vicuna、WizardLM等主流开源模型,涵盖中英文及多语言场景;
- 长上下文处理:优化高吞吐量推理,支持超长文本对话、代码生成及复杂逻辑推理;
- 函数调用:为Qwen、ChatGLM3等模型提供结构化输出能力,支持与外部API交互(如天气查询、代码执行),赋能智能体开发。
- 多模态处理
- 视觉模块
图像生成:集成Stable Diffusion等模型,支持文本到图像生成;
图文理解:通过多模态大模型(如Qwen-VL)实现图像描述、视觉问答等任务。 - 音频模块
语音识别:支持Whisper模型,实现语音转文字及多语言翻译;
语音生成(实验):探索文本到语音(TTS)能力,支持自定义音色生成。 - 视频模块(实验)
视频理解:基于多模态嵌入技术解析视频内容,支持片段检索与摘要生成。
- 视觉模块
- 嵌入&重排序
- 嵌入模型
文本/图像向量化:支持BGE、M3E等模型,生成跨模态统一语义向量;
应用场景:优化搜索、推荐系统的召回精度,支持混合模态检索。 - 重排序模型
精细化排序:通过交叉编码器优化检索结果排序,提升Top-K准确率。
- 嵌入模型
内置模型清单
模型类型 | 代表模型 | 关键特性 |
---|---|---|
大语言模型 | Qwen-72B、ChatGLM3-6B、Vicuna-7B | 支持函数调用、长上下文、多轮对话 |
嵌入模型 | BGE-Large、M3E-Base | 跨模态语义对齐、低延迟推理 |
图像模型 | Stable Diffusion XL、Qwen-VL | 文生图、图像描述、视觉问答 |
音频模型 | Whisper-Large、Bark(实验) | 语音识别、多语言翻译、TTS生成 |
重排序模型 | bge-reranker-large | 动态调整检索结果排序 |
视频模型 | CLIP-ViT(实验) | 视频内容解析、跨模态检索 |
版本
功能 | 企业版本 | 开源版本 |
---|---|---|
用户权限管理 | 用户权限、单点登录、加密认证 | tokens授权 |
集群能力 | SLA调度、租户隔离、弹性伸缩 | 抢占调度 |
引擎支持 | 优化过的vLLM、SGLang、TensorRT | vLLM、SGLang |
批处理 | 支持大量调用的定制批处理 | 无 |
微调 | 支持上传数据集微调 | 无 |
国产GPU支持 | 昇腾、海光、天数、寒武纪、沐曦 | 无 |
模型管理 | 可私有部署的模型下载和管理服务 | 依赖ModelScope和HuggingFace |
故障检测和恢复 | 自动检测节点故障并进行故障复位 | 无 |
高可用 | 所有节点都是冗余部署支持服务高可用 | 无 |
监控 | 监控指标API接口,和现有系统集成 | 页面显示 |
运维 | 远程cli部署、不停机升级 | 无 |
服务 | 远程技术支持和自动升级服务 | 社区支持 |
安装
# 安装所有
pip install "xinference[all]"
# Transformers 引擎
pip install "xinference[transformers]"
# vLLM引擎
pip install "xinference[vllm]"
# Llama.cpp 引擎
pip install xinference
pip install xllamacpp --force-reinstall --index-url https://xorbitsai.github.io/xllamacpp/whl/cu124
CMAKE_ARGS="-DLLAMA_CUBLAS=on" pip install llama-cpp-python
# SGLang 引擎
pip install "xinference[sglang]"
# MLX引擎
pip install "xinference[mlx]"
运行
本地运行:
conda create --name xinference python=3.10
conda activate xinference
# 启动命令
xinference-local --host 0.0.0.0 --port 9997
# 启动模型命令
xinference engine -e http://0.0.0.0:9997 --model-name qwen-chat
# 其他参考
xinference launch --model-name <MODEL_NAME> \[--model-engine <MODEL_ENGINE>] \[--model-type <MODEL_TYPE>] \[--model-uid <MODEL_UID>] \[--endpoint "http://<XINFERENCE_HOST>:<XINFERENCE_PORT>"]
集群部署:
# 启动 Supervisor 用当前节点的 IP 来替换`${supervisor_host}`
xinference-supervisor -H "${supervisor_host}"
# 启动Worker
xinference-worker -e "http://${supervisor_host}:9997" -H "${worker_host}"
Docker部署:
# 英伟达显卡机器
docker run -e XINFERENCE_MODEL_SRC=modelscope -p 9998:9997 --gpus all xprobe/xinference:<your_version> xinference-local -H 0.0.0.0 --log-level debug
# 只有CPU机器
docker run -e XINFERENCE_MODEL_SRC=modelscope -p 9998:9997 xprobe/xinference:<your_version>-cpu xinference-local -H 0.0.0.0 --log-level debug
启动完成可在http://${supervisor_host}:9997/ui
访问Web UI:
打开http://${supervisor_host}:9997/docs
访问API文档:
部分API截图:
API
如上图,接口列表中包含大量接口,不仅有LLM模型的接口,还有其他模型(如Embedding或Rerank)的接口,都是兼容OpenAI API的接口。可使用Curl工具来调用其接口,示例如下:
curl -X 'POST' \'http://localhost:9997/v1/chat/completions' \-H 'Content-Type: application/json' \-d '{"model": "chatglm3","messages": [{"role": "user","content": "hello"}]}'
不同模型可使用不同的requestBody参数,但是大多都是类似的:
{"model": "deepseek-r1-distill-qwen-32b-awq","messages": [{"role": "user","content": "你是谁"}],"temperature": 0.1,"top_p": 0.6,"stream": true,"stop": ["<|im_end|>","<|endoftext|>"]
}
模型部署
注:版本为v0.14.2
在Launch Model菜单中选择LANGUAGE MODELS标签,输入关键字,比如chatglm3:
点击第一个:
可选参数:
- Model Engine:模型引擎,可选择Transformers和vLLM。选择Transformers后,截图如上。
- Model Format:模型格式,可选择量化和非量化的格式,非量化的格式是pytorch,量化格式有ggml、gptq等。不同的模型支持不同的格式。
- Model Size:模型的参数量大小,不同的模型,其可选择的参数量候选列表不一样。比如ChatGLM3只有6这个选项(表示6B,60亿参数);Llama2,有7、13、70等选项。
- Quantization:量化精度,4-bit、8-bit、none等。
- N-GPU:选择使用第几个GPU。
- Replica:副本数。
选择vLLM后,支持填入副本数:
和使用的GPU卡个数:
不管是Transformers还是vLLM,都支持填写其他可选参数:
包括:
- Model UID:模型自定义名称,不填的话就默认用原始模型名称。
参数填写完成后,点击左边的火箭图标按钮即开始部署模型,后台会根据参数选择下载LLM模型。部署完成后,界面会自动跳转到Running Models菜单。
部署Embedding模型,只需要在Launch Model菜单中选择Embedding标签,然后选择相应模型,不像LLM模型一样需要选择参数,直接部署模型即可。
通过Curl命令调用API接口来验证部署好的Embedding模型:
curl -X 'POST' \'http://localhost:9997/v1/embeddings' \-H 'Content-Type: application/json' \-d '{"model": "bge-base-en-v1.5","input": "hello"
}'
验证rerank模型:
curl --location 'http://192.168.0.106:9997/v1/rerank' \
--header 'Content-Type: application/json' \
--data '{"model":"bge-reranker-v2-m3","query":"智能家居系统如何帮助提高家庭能源效率?","documents":["智能家居系统如何帮助提高家庭能源效率?213","fsdf"]
}'
对比
Feature | Xinference | FastChat | OpenLLM | RayLLM |
---|---|---|---|---|
OpenAI-Compatible RESTful API | ✅ | ✅ | ✅ | ✅ |
vLLM Integrations | ✅ | ✅ | ✅ | ✅ |
More Inference Engines (GGML, TensorRT) | ✅ | ❌ | ✅ | ✅ |
More Platforms (CPU, Metal) | ✅ | ✅ | ❌ | ❌ |
Multi-node Cluster Deployment | ✅ | ❌ | ❌ | ✅ |
Image Models (Text-to-Image) | ✅ | ✅ | ❌ | ❌ |
Text Embedding Models | ✅ | ❌ | ❌ | ❌ |
Multimodal Models | ✅ | ❌ | ❌ | ❌ |
Audio Models | ✅ | ❌ | ❌ | ❌ |
More OpenAI Functionalities (Function Calling) | ✅ | ❌ | ❌ | ❌ |
相关文章:
Xinference推理框架
概述 GitHub,官方文档。 核心优势 性能优化:通过vLLM、SGLang等引擎实现低延迟推理,吞吐量提升2-3倍;企业级支持:支持分布式部署、国产硬件适配及模型全生命周期管理;生态兼容:无缝对接LangC…...
技术更新频繁,团队如何适应变化
构建持续学习机制、引入技术雷达与预研机制、通过敏捷方法快速响应变化、推动跨团队知识协作与传承 是应对技术更新频繁、团队保持适应力的核心策略。其中,构建持续学习机制尤为关键。通过制度化、场景化的学习安排,团队可以主动追踪新技术趋势ÿ…...
解密企业级大模型智能体Agentic AI 关键技术:MCP、A2A、Reasoning LLMs-MCP大模型上下文解析
解密企业级大模型智能体Agentic AI 关键技术:MCP、A2A、Reasoning LLMs-MCP大模型上下文解析 我们首先来看一下 整个MCP的一个基本的一个流程,他解决的一个问题。我们回到这里,他解决的一个问题是什么呢?他解决这个问题就是你的大…...
游戏代码混淆的作用与应用分析
1. 防止逆向工程 核心保护对象:游戏引擎、算法(如物理模拟、AI行为树)、加密逻辑等。实例:Unity游戏使用 ConfuserEx 混淆C#代码,使反编译工具(如dnSpy)只能显示杂乱命名,难以理解逻…...
信息系统运行管理员:临阵磨枪版
信息系统运行管理员考试 - 全覆盖详细背诵大纲 (根据考情分析和原始材料,力求完整覆盖考点细节) 第一部分:基础知识与运维概览 Chapter 1: 信息系统运维概述 (上午题 5分) 信息: 含义:香农 - 减少随机不确定性的东西;…...
PWM(脉宽调制)的配置参数[预分频器\自动重载值]的自动计算
文章目录 前言一、数据结构二、二分法搜索最佳预分频器和自动重载值三、示例 前言 pwm是嵌入式开发过程中很常见的一个模块,而配置pwm的过程中就少不了频率参数的计算,大多数32位机的pwm频率都由时钟、预分频器(prescaler)、自动…...
manuskript开源程序是面向作家的开源工具
一、软件介绍 文末提供程序和源码下载 manuskript开源程序是面向作家的开源工具,Manuskript 可在 GNU/Linux、Mac OS X 和 Windows 上运行。 二、Features 特征 Manuskript provides a rich environment to help writers create their first draft and then furt…...
antd 主题色定制
定制方案: 1. 全局定制 整个应用范围内的组件都生效 全局文件 theme.css :root:root {--adm-color-primary: #a062d4; } antd-mobile 中的主题变量也是在 :root 下声明的,所以在有些情况会由于优先级的问题无法覆盖。通过 :root:root 显式地让你所…...
召回11:地理位置召回、作者召回、缓存召回
GeoHash 召回 属于地理位置召回,用户可能对附近发生的事情感兴趣。GeoHash 是一种对经纬度的编码,地图上每个单位矩形的 GeoHash 的前几位是相同的,GeoHash 编码截取前几位后,将相同编码发布的内容按时间顺序(先是时间…...
leetcode0767. 重构字符串-medium
1 题目:重构字符串 官方标定难度:中 给定一个字符串 s ,检查是否能重新排布其中的字母,使得两相邻的字符不同。 返回 s 的任意可能的重新排列。若不可行,返回空字符串 “” 。 示例 1: 输入: s “aab” 输出: “…...
vue基本介绍
Vue是一款流行的JavaScript前端框架,以下是其基本介绍: 发展历程 - 2014年,尤雨溪发布了Vue的第一个版本。 - 此后,Vue不断发展和完善,陆续发布了多个版本,功能逐渐强大,社区也日益活跃。 …...
【vue】【环境配置】项目无法npm run serve,显示node版本过低
解决方案:安装高版本node,并且启用高版本node 步骤: 1、查看当前版本 node -v2、配置nvm下载镜像源 1)查看配置文件位置 npm root2)找到settings.txt文件 修改镜像源为: node_mirror: https://npmmirro…...
第35周Zookkeeper+Dubbo JDK不同版本介绍
一、JDK 新特性全解析 JDK9 - 模块化:化繁为简的魔法 模块化特性:JDK9 给 Java 程序带来模块化特性,就像把一个大公司划分成多个部门,每个部门(模块)各司其职。模块比包更大,一个模块包含多个…...
【ORB-SLAM3】CreateNewKeyFrame()函数阅读
void Tracking::CreateNewKeyFrame() void Tracking::CreateNewKeyFrame() {// 如果局部建图线程正在初始化且没做完或关闭了,就无法插入关键帧if(mpLocalMapper->IsInitializing() && !mpAtlas->isImuInitialized())return;if(!mpLocalMapper->SetNotStop(t…...
腾讯开源实时语音大模型VITA-audio,92mstoken极速响应,支持多语言~
简介 VITA-Audio 是一个由腾讯优图实验室(Tencent Youtu Lab)、南京大学和厦门大学的研究人员共同开发的项目,旨在解决现有语音模型在流式生成(streaming)场景下生成第一个音频令牌(token)时的高…...
使用 TypeScript + dhtmlx-gantt 在 Next.js 中实现
1. 安装依赖(确保已安装) npm install dhtmlx-gantt2. 创建 pages/gantt.tsx use clientimport { useRef, useEffect } from react import { gantt } from dhtmlx-gantt import dhtmlx-gantt/codebase/dhtmlxgantt.cssinterface Task {id: number | st…...
web第四次课后作业--页面操作实现数据库的增删查改
一、环境配置 1. 创建一个java web(maven构建)的项目2. 配置tomcat3. 连接数据库二、页面呈现 登录页面 详细信息 删除一条信息后 更新 更新后的信息 三、目录结构 四、代码实现 4.1 denglu.jsp <% page language"java" cont…...
DeepSearch:字节新一代 DeerFlow 框架
项目地址:https://github.com/bytedance/deer-flow/ 【全新的 Multi-Agent 架构设计】独家设计的 Research Team 机制,支持多轮对话、多轮决策和多轮任务执行。与 LangChain 原版 Supervisor 相比,显著减少 Tokens 消耗和 API 调用次数&#…...
uniapp中vue3和pinia安装依赖npm install失败
目录 一、问题描述 二、问题原因 三、问题解析及解决方案 一、问题描述 用uni-app开发小程序的时候,使用了vue3pinia,安装依赖的时候发现vue和pinia的版本问题,安装失败, npm ERR! code ERESOLVE npm ERR! ERESOLVE could not resolve np…...
【java】synchronized关键字详解
目录 一、线程同步与线程安全问题线程不安全Demo线程不安全的原因 二、synchronized关键字关键字锁粒度修饰对象修饰代码块修饰方法修饰静态方法修饰类 synchronized 锁总结 synchronized加锁原理MarkWordsynchronized锁升级synchronized锁原理synchronized关键字总结 其他同步…...
使用 `perf` 和火焰图(Flame Graph)进行性能分析
在现代软件开发中,性能优化是提升应用程序响应速度和资源利用率的关键步骤。当一个进程的 CPU 占用率异常高时,识别并优化性能瓶颈显得尤为重要。本文将详细介绍如何使用 Linux 下强大的性能分析工具 perf 以及火焰图(Flame Graph)…...
Cocos Creator 3.8.5 构建依赖环境配置文档
Cocos Creator 3.8.5 构建依赖环境配置文档 文章目录 Cocos Creator 3.8.5 构建依赖环境配置文档✅ 构建依赖汇总表✅ 构建平台配置说明👉 Windows 构建👉 Android 构建 ✅ 推荐构建环境组合(稳定)✅ 常见问题提示 适用于打包 An…...
# FlyEnv 环境下 MySQL 操作全攻略:从基础到字段修改
在使用 FlyEnv 搭建开发环境时,MySQL 数据库的操作是开发过程中不可或缺的一环。无论是修改字段结构,还是执行其他常见操作,都需要熟练掌握相关技能。下面将为你详细介绍 FlyEnv 环境下 MySQL 的操作,以及修改字段的多种方法。 一…...
C语言_自动义类型:联合和枚举
1. 联合体 1.1 联合体类型的声明 与结构体相似,联合体也是有一个或多个成员(可以是不同类型)构成;但是编译器只为最大的成员分配足够的内存空间 联合体的特点是所有成员共用同一块内存空间,所以联合体也叫ÿ…...
Golang基础知识—cond
cond 通常指 sync.Cond,它是标准库 sync 包中用于实现 条件变量 的同步原语。条件变量在多 goroutine 协作场景中非常有用,尤其在需要根据特定条件协调多个 goroutine 的执行顺序时。 sync.Cond 的核心作用 条件变量用于 等待某个条件满足 或 通知其他等…...
深入探索向量数据库:构建智能应用的新基础
📌 友情提示: 本文内容由银河易创AI(https://ai.eaigx.com)创作平台的gpt-4-turbo模型辅助生成,旨在提供技术参考与灵感启发。文中观点或代码示例需结合实际情况验证,建议读者通过官方文档或实践进一步确认…...
实验5 DNS协议分析与测量
实验5 DNS协议分析与测量 1、实验目的 了解互联网的域名结构、域名系统DNS及其域名服务器的基本概念 熟悉DNS协议及其报文基本组成、DNS域名解析原理 掌握常用DNS测量工具dig使用方法和DNS测量的基本技术 2、实验环境 硬件要求:阿里云云主机ECS 一台。 软件要…...
1200/1500 PID 学习笔记
一 准备 1. 仿真库文件,下载链接放在最后 2.PID仿真,不支持1200.所以组CPU需要1500. 3.PID必须在循环中断里面调用。 二 试水 1. 拉一个PID指令 2. 库文件拉入 3 仿真试水,可以看到已经开始调节了。 、 三 组态设置 1. Input: 输入值&a…...
深度学习中--模型调试与可视化
第一部分:损失函数与准确率的监控(Loss / Accuracy Curve) 1. 为什么要监控 Loss 与 Accuracy? Loss 是模型优化的依据,但它可能下降了 Accuracy 反而没变(过拟合信号) Accuracy 才是评估效果的…...
tomcat项目重构踩坑易错点
是的,没错,弄了一个特别老的项目。重构真是头疼啊。其实好吧,还是用的太少。 前提条件:用idea工具非社区版。注意是非社区版。点击设置- project Structure 1.配置Modules 点击import module 添加好模块后。 重点来了࿰…...
如何安全擦除 SSD 上的可用空间
无论您是要处理旧 SSD 还是只是想确保敏感信息的私密性,擦除可用空间都是至关重要的一步。那么,您可以擦除 SSD 上的可用空间吗?是的,可以擦除 SSD 上的可用空间,我们在本指南中提供了两种有效的方法。是的,…...
增强 HTNN 服务网格功能:基于 Istio 的BasicAuth 与 ACL 插件开发实战
目录 1.引言 什么是HTNN? 为什么开发 BasicAuth 和 ACL 插件? 2.技术背景 技术栈概览 Istio 与服务网格简述 HTNN 框架与插件机制概览 3.插件开发详解:BasicAuth 与 ACL 3.1 BasicAuth插件 功能点 实现细节 3.2 ACL插件 功能点 …...
从概念到可工程化智能体的转变路径——以“知识奇点工程师”为例
产品部门定义了一个如下概念性的“知识奇点工程师”,他们构建的不仅仅是一个数据库或知识图谱,而是一个活的、能自我进化的知识生态系统,是整个“Neuralink for Education”宏伟蓝图的基石。他们的工作难度和重要性,不亚于为AI引擎…...
docker(四)使用篇一:docker 镜像仓库
前文我们已经介绍了 docker 并安装了 docker,下面我们将正式步入使用环节,本章是第一个使用教学:docker 镜像仓库。 一、什么是镜像仓库 所谓镜像仓库,其实就是负责存储、管理和分发镜像的仓库,并且建立了仓库的索引…...
S7-1500 与 IM60 进行 PROFINET 通信
S7-1500 与 IM60 进行 PROFINET 通信 本文档介绍使用 S7-1500 CPU 与 IM 60 进行 PROFINET 通信,实现对 IM60 及 AM03 的控制。 使用软件及硬件 软件:工控人加入PLC工业自动化精英社群 TIA Portal V19 ET 200 SMART IM60 GSD 文件下载链接ÿ…...
车载诊断架构 ---车载总线对于功能寻址的处理策略
我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 钝感力的“钝”,不是木讷、迟钝,而是直面困境的韧劲和耐力,是面对外界噪音的通透淡然。 生活中有两种人,一种人格外在意别人的眼光;另一种人无论…...
观QFramework框架底层逻辑有感
拿QFramework(以下简称QF)第一个案例简单理解框架底层代码逻辑。 使用QF框架重构后的代码,给我这种小白一种很抽象的感觉,但好的代码就是抽象的,这是不可否认的。于是想掌握一下这个框架的基础部分,至少能…...
ExecutorService详解:Java 17线程池管理从零到一
简介 在现代高并发应用中,线程池管理已成为提升系统性能与稳定性的关键核心技术。ExecutorService作为Java并发编程的核心接口,提供了对线程池的强大抽象与管理能力,相比直接管理线程,它能显著降低资源消耗、提高响应速度并增强系统可维护性。随着Java 17的发布,线程池管…...
Go 中闭包的常见使用场景
在 Go 中,闭包(Closure) 是一个函数值,它引用了其定义时所在作用域中的变量。也就是说,闭包可以访问并修改外部作用域中的变量。 Go 中闭包的常见使用场景 ✅ 1. 封装状态(无须结构体) 闭包可…...
养生:打造健康生活的四大支柱
饮食养生:吃对食物,滋养生命根基 饮食是健康的物质基础,需遵循 “均衡、天然、顺应时节” 原则: 三餐科学搭配: 早餐以高蛋白 膳食纤维为主,如燕麦粥配水煮蛋、蓝莓,快速激活代谢;…...
OpenCV 图像直方图:从原理剖析到实战应用
在数字图像处理领域,图像直方图是一种强大而基础的工具,它以直观的方式展示了图像中像素值的分布情况。OpenCV 作为广泛应用的计算机视觉库,提供了丰富的函数来处理图像直方图。本文将深入讲解图像直方图的原理、OpenCV 中的实现方法…...
springboot+vue实现在线书店(图书商城)系统
今天教大家如何设计一个图书商城 , 基于目前主流的技术:前端vue,后端springboot。 同时还带来的项目的部署教程。 视频演示 在线书城 图片演示 一. 系统概述 商城是一款比较庞大的系统,需要有商品中心,库存中心,订单…...
LLM Text2SQL NL2SQL 实战总结
目录 尽量全面的描述表的功能 尽量全面的描述字段的功能 适当放弃意义等价的字段 放弃业务上无用的字段 对于LLM来说,由于它没有什么行业经验,所以我们需要尽可能的给予它恰当的“背景信息”,才能使它更好的工作。所谓恰当,不是越多越好,因为太多的信息会消耗掉LLM的可…...
SQLPub:一个提供AI助手的免费MySQL数据库服务
给大家介绍一个免费的 MySQL 在线数据库环境:SQLPub。它提供了最新版本的 MySQL 服务器测试服务,可以方便开发者和测试人员验证数据库功能,也可以用于学习 MySQL。 免费申请 在浏览器中输入以下网址: https://sqlpub.com/ SQLP…...
EasyExcel集成使用总结与完整示例
EasyExcel集成使用总结与完整示例 一、EasyExcel简介 EasyExcel是阿里巴巴开源的Java库,专注于简化Excel文件的读写操作。它基于Apache POI进行了优化,采用流式处理,具有低内存占用和高性能的特点,非常适合处理大规模数据的导入…...
【hot100-动态规划-139.单词拆分】
力扣139.单词拆分 本题要求判断给定的字符串 s 是否可以被空格拆分为一个或多个在字典 wordDict 中出现的单词,且不要求字典中出现的单词全部都使用,并且字典中的单词可以重复使用,这是一个典型的动态规划问题。 动态规划思路 定义状态: 定义一个布尔类型的数组 dp,其中…...
人工神经网络(ANN)模型
一、概述 人工神经网络(Artificial Neural Network,ANN),是一种模拟生物神经网络结构和功能的计算模型,它通过大量的神经元相互连接,实现对复杂数据的处理和模式识别。从本质上讲,人工神经网络是…...
2025ICPC陕西省赛题解
L. easy 每行选能选的最小的两个,注意处理奇数的情况。 #include <bits/stdc.h> #define x first #define y second #define int long longusing namespace std; typedef unsigned long long ULL ; typedef pair<int,int> PII ; typedef pair<lon…...
不同进制的数据展示(十进制、十六进制、编码方式)
目录 1、十六进制的数值转为十进制(可能是补码) 2、十进制转为十六进制(负数要转为补码) 背景: (1) 接收到通讯的数据,把数据读取出来,并转成自己想要的格式。 &#x…...
贝叶斯优化Transformer融合支持向量机多变量回归预测,附相关性气泡图、散点密度图,Matlab实现
贝叶斯优化Transformer融合支持向量机多变量回归预测,附相关性气泡图、散点密度图,Matlab实现 目录 贝叶斯优化Transformer融合支持向量机多变量回归预测,附相关性气泡图、散点密度图,Matlab实现效果一览基本介绍程序设计参考资料…...