FastAPI-MCP
介绍
开源地址: https://github.com/tadata-org/fastapi_mcp
FastAPI-MCP 是一个开源项目,旨在简化 FastAPI 应用与现代 AI 代理(如基于大语言模型的系统)之间的集成。它通过自动将 FastAPI 的所有 API 端点暴露为符合 Model Context Protocol(MCP)标准的工具,使得 AI 代理能够直接调用和理解这些接口,整个过程无需额外配置,极大地降低了开发者的集成难度。
主要功能
-
零配置自动化:无需手动配置,FastAPI-MCP 会自动发现 FastAPI 应用中的所有端点,并将它们转换为 MCP 工具。
-
直接集成:可以将 MCP 服务器直接挂载到现有的 FastAPI 应用中,或者选择单独部署 MCP 服务器,灵活适应不同架构需求。
-
保持模型和文档完整性:自动保留请求和响应模型的 JSON Schema,以及原有的 Swagger/OpenAPI 文档,确保 AI 代理能够准确理解接口的调用方式和数据结构。
-
支持 ASGI 传输:默认通过 FastAPI 的 ASGI 接口高效通信,无需额外的 HTTP 请求,提升性能。
-
灵活的端点筛选:可以通过操作 ID 或标签来包含或排除特定的 API 端点,方便控制暴露给 MCP 的工具集合。
-
支持动态更新:在添加新的 FastAPI 端点后,可刷新 MCP 服务器以包含新增接口。
-
fastapi-mcp 插件是为了支持 MCP 大模型上下文协议 的 OpenAPI 扩展。
-
如果你想让多个 LLM 工具(如通义、智谱)可以自动理解你的 API,用这个是很合适的。
-
要让 MCP 生效,关键在于:
- 所有路由必须要有 operation_id
- 接口请求/响应最好都带 description、summary
运行说明
服务端:
from fastapi import FastAPI
from fastapi_mcp import FastApiMCP
from pydantic import BaseModel
app = FastAPI()# ✅ 请求体模型
class ItemRequest(BaseModel):item_id: int# ✅ POST 接口 + operation_id + 请求体
@app.post("/mcp/get_item", operation_id="get_item")
async def get_item_mcp(req: ItemRequest):return {"item_id": req.item_id, "name": f"Item {req.item_id}"}
# MCP 实例化
mcp = FastApiMCP(app)mcp.mount(mount_path="/mcp") # 👈 挂载 MCP endpoint 到 /mcp
# 如果你想暴露 openapi 文档
@app.get("/mcp/openapi.json", include_in_schema=False)
async def get_openapi():return app.openapi()
if __name__ == '__main__':import uvicornuvicorn.run(app, host="0.0.0.0", port=8000)
operation_id 是每个 API 接口的唯一标识符
代表这个接口在 OpenAPI 文档中是唯一识别为 “get_item” 的操作。
✅ 为什么 operation_id 很重要?
因为 MCP 协议、Coze、通义、百川等大模型对接平台,都依赖 operation_id 来知道你要调用哪个接口!
客户端:
from fastapi_mcp_client import MCPClient
import asyncioasync def main():async with MCPClient("http://localhost:8000/mcp") as client:result = await client.call_operation("get_item", {"item_id": 123})print(result)asyncio.run(main())
🔧 MCP 调用时长这样:
👉 这里 “get_item” 对应的就是你 FastAPI 中的,如果你没写 operation_id,FastAPI 默认会自动生成一个,比如:“operationId”: "get_mcp_get_item_mcp_get_item_post”,但是大模型不知道怎么调用了。
client.call_operation("get_item", {"item_id": 123})
你必须满足 MCP 的接口结构要求:
项目 | 要求说明 |
---|---|
请求方法 | POST(MCP 默认使用) |
请求体(body) | ✅ 使用 Pydantic 模型接收 |
operation_id | ✅ 必须与 call_operation 保持一致 |
🚨 MCP 接口一定要你自己手动指定 operation_id
项目名 | 意义说明 |
---|---|
operation_id | 接口唯一代号,供外部调用识别使用 |
和路由无关 | 和 @app.post(“/path”) 的路径、函数名都可无关 |
对接必须有 | MCP、Coze、千问等大模型调用你接口时就靠它识别 |
拆解MCP
这个 MCPClient 究竟干了什么,以及 MCP 协议到底是个“什么鬼”——为什么它虽然走的还是 HTTP,却变成了大模型通用对接的标准。
✅ 本质还是 HTTP,但它封装了调用协议 + 结构化文档 + 标准化调用方式
MCP(Model Context Protocol)不是新协议,而是为大模型定制的 OpenAPI 子集标准,让模型能「看得懂、调得对、调得稳」你的接口。
✅ 1. HTTP 是传输协议(干活的快递员)
- 确实所有请求最终走的都是 HTTP,比如:
POST /mcp/get_item
Body: {"item_id": 123}
✅ 2. OpenAPI 是接口描述文档(接口说明书)
- 帮助工具了解你这个接口长什么样:
- 接口路径
- 请求参数
- 响应结构
- operation_id
✅ 3. MCP 是大模型「能读懂」的 OpenAPI 子集标准
- 它是为大模型设计的接口文档格式,比如:
- 增加了 x-modelcontext 扩展字段
- 精简了 OpenAPI 的复杂内容
- 强调每个接口都要 operation_id、description、参数结构清晰
✅ MCPClient就是个“模拟大模型”的客户端
async with MCPClient("http://localhost:8000/mcp") as client:result = await client.call_operation("get_item", {"item_id": 123})
等价于下面这几步自动化操作:
- 发请求到:
GET http://localhost:8000/mcp/openapi.json
- 读取到这个 JSON 文件中的内容,找到 operation_id = get_item 的接口:
{"operationId": "get_item","path": "/mcp/get_item","method": "POST","parameters": ...
}
- 自动生成一个 HTTP 请求并发送:
POST /mcp/get_item
Content-Type: application/json{"item_id": 123
}
- 返回响应
本质客户端就是封了一层!!!
这就是 Coze / 通义 / 百川 / 智谱对接你 API 的方式!
使用openai来测试:
import openai
import json
import requests
import os
from dotenv import load_dotenv
load_dotenv()client = openai.OpenAI(api_key=os.getenv("OPENAI_API_KEY"),base_url=os.getenv("OPENAI_BASE_URL"),
)tools = [{"type": "function","function": {"name": "get_item","description": "根据 item_id 获取商品信息","parameters": {"type": "object","properties": {"item_id": {"type": "integer","description": "商品 ID"}},"required": ["item_id"]}}}
]# 发起 Tool Call 请求
response = client.chat.completions.create(model="moonshot-v1-8k",messages=[{"role": "user", "content": "请获取 item_id 为 123 的商品信息"}],tools=tools,tool_choice={"type": "function", "function": {"name": "get_item"}},
)# 提取函数调用内容
tool_call = response.choices[0].message.tool_calls[0]
func_name = tool_call.function.name
args = json.loads(tool_call.function.arguments)# 实际调用你本地 MCP 接口
mcp_result = requests.post(f"http://localhost:8000/mcp/{func_name}", json=args)
print("🟢 MCP 响应:", mcp_result.json())
❓现在有没有一个“完全自动化 MCP 接口调用”的服务?
结论:
❌ OpenAI / Moonshot / 通义 等大模型
当前都不内建自动调用你接口的能力
-
它们可以识别你的 openapi.json
-
可以生成 tool_call
-
但 不会真的“帮你发请求去调接口”,你必须自己中转调用
✅ 所以“闭环”仍需你在中间处理 tool_call ➝ 实际 HTTP 请求 ➝ 再补 messages ➝ 再发一轮
大模型 = 调用建议器(Tool Caller)
你 = Tool Executor(工具执行者)
✅ 那有没有“自动 MCP 执行”的系统?
系统/平台 | 是否支持自动调用 | 说明 |
---|---|---|
🔵 LangChain | ✅ ✅ ✅ | 可以集成 OpenAPI Toolkit + tool 调用自动发 HTTP 请求 |
🟣 Flowise | ✅(需要配置) | 可加载 openapi 并自动调接口 |
🟢 自建 LLM 代理服务 | ✅(推荐) | 自己封装 tool_call → HTTP 调用 → 补回 → 完整闭环 |
🔴 OpenAI 官方 | ❌ | 不负责接口调用,tool_call 只是调用计划 |
🟡 Moonshot Kimi | ❌ | 行为和 OpenAI 相同 |
可自己封装一个自动执行的:
用户说:请获取 item_id 为 123 的商品⬇️大模型返回:
tool_call = {"name": "get_item", "args": {"item_id": 123}}⬇️代理服务自动识别 → 请求 http://localhost:8000/mcp/get_item⬇️再构造:
messages = [{"role": "user", "content": "..."},{"role": "assistant", "tool_calls": [...]},{"role": "tool", "tool_call_id": "...", "content": "{实际返回值}"},
]⬇️再继续调用一次 LLM → 得到最终文本回复
相关文章:
FastAPI-MCP
介绍 开源地址: https://github.com/tadata-org/fastapi_mcp FastAPI-MCP 是一个开源项目,旨在简化 FastAPI 应用与现代 AI 代理(如基于大语言模型的系统)之间的集成。它通过自动将 FastAPI 的所有 API 端点暴露为符合 Model Co…...
Matlab 复合模糊PID
1、内容简介 Matlab 209-复合模糊PID 可以交流、咨询、答疑 2、内容说明 略摘 要:在并联型模糊 PID 复合控制器设计中,必须根据偏差大小及时地调整模糊控制部分和 PID 控制 部分的比例,而这种较为复杂的控制策略利用普通的 Simulink 模块是很难实现的.采用S-函数来解决 这个问…...
javaSE.队列
链表:屁股入队,头部出队 链尾入队👇 是while(tail.next!null) 👇 链首出队(head.next)👇 仅获取队首👇...
c++基础·左值右值
一、左值与右值的本质特征 1. 基础定义 左值 (lvalue) ✅ 可出现在赋值运算符左侧 ✅ 可被取地址(有明确存储位置) ✅ 通常为具名变量(如int a 10;中的a) 右值 (rvalue) ❌ 不可出现在赋值左侧 ❌ 不可取地址(无持久…...
From RAG to Memory: Non-Parametric Continual Learning for Large Language Models
从RAG到记忆:大语言模型的无参数持续学习 原文链接:https://arxiv.org/pdf/2502.14802 Code: https://github.com/OSU-NLP-Group/HippoRAG 🧠 HippoRAG 2 流程概述 1. 离线索引(Offline Indexing) 在此阶段,HippoRAG 2 构建一个开放式知识图谱(Open KG)以存储知识…...
STM32配置系统时钟
1、STM32配置系统时钟的步骤 1、系统时钟配置步骤 先配置系统时钟,后面的总线才能使用时钟频率 2、外设时钟使能和失能 STM32为了低功耗,一开始是关闭了所有的外设的时钟,所以外设想要工作,首先就要打开时钟,所以后面…...
Docker 安装配置教程(配置国内源)
## 一、Windows 安装 Docker Desktop 1. 系统要求: - Windows 10 64位:专业版、企业版或教育版 - 必须开启 Hyper-V 和容器功能 - 至少 4GB 内存 2. 安装步骤: - 访问 Docker 官网下载 Docker Desktop - 双击安装程序 - 按照向导完成安装 - 重启电脑 ## 二、macOS 安装 Dock…...
016-C语言内存函数
C语言内存函数 文章目录 C语言内存函数1. memcpy2. memmove3. memset4. memcmp 注意: 使用这些函数需要包含 string.h头文件。 1. memcpy void * memcpy ( void * destination, const void * source, size_t num );从source指向的位置开始,向后复制num…...
[FPGA]设计一个DDS信号发生器
一、DDS DDS(Data Distribution Service) 是一种面向实时分布式系统的通信中间件标准,专为高性能、高可靠性、低延迟的数据传输场景设计。它由对象管理组织(OMG) 制定并维护,广泛应用于物联网(…...
MySQL 线上大表 DDL 如何避免锁表(pt-online-schema-change)
文章目录 1、锁表问题2、pt-online-schema-change 原理3、pt-online-schema-change 实战3.1、准备数据3.2、安装工具3.3、模拟锁表3.4、解决锁表 1、锁表问题 在系统研发过程中,随着业务需求千变万化,避免不了调整线上MySQL DDL数据表的操作,…...
脚本中**通配符用法解析
在文件路径匹配中,** 是一种特殊的通配符(Glob Pattern),主要用于表示递归匹配任意层级的子目录。这种语法常见于以下场景: 1. 典型应用场景 .gitignore 文件: **/__pycache__ 表示匹配项目根目录下所有层…...
5 提示词工程指南-计划与行动
5 提示词工程指南-计划与行动 计划与行动 Cline 有两种模式: Plan 描述目标和需求、提问与回答、讨论、抽象项目的各个方面、确定技术路线、确定计划 计划与确认相当于架构师,不编写代码Act 按计划编写代码 按照计划编码Plan 模式的本质是构建实际编码前的上下文,Act 的本…...
62页华为IPD-MM流程:市场调研理论与实践方案精读【附全文阅读】
本文围绕市场调研展开,介绍其是联系市场和企业的纽带,具有收集陈述事实、解释信息、预测市场变化的作用,在 IPD 产品开发流程各阶段有不同应用。市场调研类型包括定性和定量研究,一般程序涵盖定义问题、拟定计划、抽样设计等多个环节。常用调研方法多样,各有特点和适用项目…...
(一)mac中Grafana监控Linux上的CPU等(Node_exporter 安装使用)
机器状态监控(监控服务器CPU,硬盘,网络等状态) Node_exporter安装在被测服务器上,启动服务 各步骤的IP地址要换为被测服务器的IP地址Prometheus.yml的 targets值网页访问的ip部分grafana添加数据源的URL 注意:只需要在被监听的服务器安装 n…...
STM32单片机入门学习——第44节: [13-1] PWR电源控制
写这个文章是用来学习的,记录一下我的学习过程。希望我能一直坚持下去,我只是一个小白,只是想好好学习,我知道这会很难,但我还是想去做! 本文写于:2025.04.20 STM32开发板学习——第44节: [13-1] PWR电源控制 前言开发板说明引用解答和科普一…...
Windows 10 上安装 Spring Boot CLI详细步骤
在 Windows 10 上安装 Spring Boot CLI 可以通过以下几种方式完成。以下是详细的步骤说明: 1. 手动安装(推荐) 步骤 1:下载 Spring Boot CLI 访问 Spring Boot CLI 官方发布页面。下载最新版本的 .zip 文件(例如 sp…...
WEMOS LOLIN32 开发板引脚布局和技术规格
🔗 快速链接ESP32 Development Boards, Sensors, Tools, Projects and More https://megma.ma/wp-content/uploads/2021/08/Wemos-ESP32-Lolin32-Board-BOOK-ENGLISH.pdf WEMOS LOLIN32 Development Board Details, Pinout, Specs WEMOS LOLIN32 Development Board …...
【AI 加持下的 Python 编程实战 2_07】第七章:基于 Copilot 完整演示问题分解能力在实际问题中的落地应用
【全新第二版《Learn AI-assisted Python Programming》封面】 写在前面 问题分解能力在 AI 辅助编程中具有举足轻重的作用。但是怎样分解才算合理有效呢?本章从一个具体的案例切入,完整展示了 GitHub Copilot 在自顶而下设计论的指导下圆满完成既定任务…...
React 路由入门秘籍:BrowserRouter 的江湖之道
前言 各位江湖中人,今日咱们聊一门流传在前端江湖的神秘绝学:<BrowserRouter>。此技出自 React 路由门派,专修客户端路由之道,擅长在 Web 世界中轻功跳转、闪转腾挪,悄无声息间掌控页面切换。 若你是构建现代 Web 应用的侠客,这篇秘籍堪比九阳真经,一经参悟,便…...
软件安装,systemctl命令,软连接
yum是centos里面的(apt是Ubuntu的) yum:RPM软件管理器,用于自动化安装配置Linux软件,并可以自动解决依赖问题 语法:yum 【-y】【install | remove | search | restart 】软件名称 -y:自动确…...
SpringBoot Actuator健康检查:自定义HealthIndicator
文章目录 引言一、Spring Boot Actuator健康检查概述二、自定义HealthIndicator的必要性三、实现自定义HealthIndicator四、高级健康检查配置五、实现自定义健康状态和响应码总结 引言 Spring Boot Actuator是Spring Boot框架中用于监控和管理应用程序的强大功能模块。它提供了…...
注意力机制(np计算示例)单头和多头
为了更好理解注意力机制里面的qkv矩阵,使用np来演示。 单头注意力 import numpy as np import math# 初始化输入 X X np.array([[[1, 2, 3], [4, 5, 6]]])# 初始化权重矩阵 WQ、WK、WV WQ np.array([[1, 0], [0, 1], [0, 0]])WK np.array([[1, 0], [0, 1], [0,…...
生成对抗网络(Generative adversarial network——GAN)
文章目录 1. 前言1.1 判别器和生成器的作用?2.2 个人总结 2. 核心代码示例2.1 训练判别器网络2.2 训练生成器网络 参考文章 1. 前言 生成对抗网络的原文:Generative Adversarial Nets,该论文的精读视频:生成对抗网络GAN开山之作论…...
CSGHub开源版本v1.6.0更新
CSGHub v1.6.0 带来了多项核心功能升级与性能优化,显著增强了对大模型推理、微调、评估等流程的支持,并进一步完善了推理服务与用户交互体验。 插件化推理与训练引擎框架 推理、微调和评估引擎现已全面模块化,支持通过配置文件灵活接入多种引…...
Redis日常学习(一)
我的Redis学习笔记:从命令行到性能调优 Redis Redis(Remote Dictionary Server)本质上是一个基于内存的键值存储系统. 安装配置Redis的过程非常简单: # Ubuntu/Debian安装Redis sudo apt-get update sudo apt-get install red…...
Unity3D仿星露谷物语开发37之浇水动画
1、目标 当点击水壶时,实现浇水的动画。同时有一个水从水壶中流出来的特效。 假如某个grid被浇过了,则不能再浇水了。。 如果某个grid没有被dug过,也不能被浇水。 2、优化Settings.cs脚本 增加如下内容: public static float…...
JavaScript 一维数组转不含零的两个数
问题描述: /*** param {number} n* return {number[]}*/ var getNoZeroIntegers function(n) {for(let i 1;i<n;i){if(String(i).indexOf(0) -1&&String(n-i).indexOf(0) -1){return [i,n-i]}}};String类型indexOf()函数如果找不到字串则返回-1&…...
抽象工厂模式及其在自动驾驶中的应用举例(c++代码实现)
模式定义 抽象工厂模式(Abstract Factory Pattern)是一种创建型设计模式,用于封装一组具有共同主题的独立对象创建过程。该模式通过提供统一接口创建相关对象家族,而无需指定具体实现类,特别适合需要保证系统组件兼容…...
知乎十四载:从精英问答到AI时代的知识灯塔
一、起源:Quora 的火种与周源的执念 2010 年,互联网浪潮正汹涌澎湃,各种新兴平台如雨后春笋般不断涌现。就在这一年的一个夜晚,周源像往常一样在网上浏览着各类信息,当他打开美国问答网站 Quora 时,瞬间被…...
Linux文件时间戳详解:Access、Modify、Change时间的区别与作用
在 Linux 系统中,文件的这三个时间戳(Access、Modify、Change)分别表示不同的文件状态变更时间,具体含义如下: 1. Access Time (Access) 含义:文件最后一次被访问的时间(读取内容或执行…...
Doris + Iceberg 构建冷热分层数据湖架构:架构设计与实战指南
在海量数据治理与存储演进中,冷热数据分层 已成为降本增效的关键策略。本篇将深入探讨如何结合 Apache Doris 与 Apache Iceberg 构建一套高性能、可扩展的数据湖架构,支持冷热数据自动分层、快速查询与灵活扩展。 一、背景:为什么需要冷热数…...
顺序表和链表的区别(C语言)
前言 线性表是最基础的数据结构之一,其中顺序表与链表分别代表两种存储方式: 顺序表(Sequential List):底层用数组实现,要求内存连续,典型代码以 int data[N] 或动态分配的 malloc/realloc 数…...
【Redis】Redis中的常见数据类型(一)
文章目录 前言一、Redis前置知识1. 全局命令2、数据结构和内部编码3. 单线程架构 二、String 字符串1. 常见命令2. 计数命令3.其他命令4. 内部编码5. 典型使用场景 三、Hash哈希1. 命令2.内部编码3. 使用场景4. 缓存方式对比 结语 前言 Redis 提供了 5 种数据结构,…...
Vue3 + TypeScript,使用祖先传后代模式重构父传子模式
父传子模式 父组件 SampleInput.vue <script setup lang"ts" name"SampleInput"> import { ref } from "vue"; import type { ApplyBasicInfo, Apply, ApplySample } from "/interface"; import CommonApplySampleTable from …...
MySQL:9.表的内连和外连
9.表的内连和外连 表的连接分为内连和外连 9.1 内连接 内连接实际上就是利用where子句对两种表形成的笛卡儿积进行筛选,之前查询都是内连 接,也是在开发过程中使用的最多的连接查询。 语法: select 字段 from 表1 inner join 表2 on 连接…...
(mac)Grafana监控系统之监控Linux的Redis
Grafana安装-CSDN博客 普罗米修斯Prometheus监控安装(mac)-CSDN博客 1.Redis_exporter安装 直接下载 wget https://github.com/oliver006/redis_exporter/releases/download/v1.0.3/redis_exporter-v1.0.3.linux-amd64.tar.gz 解压 tar -xvf redis_…...
Multisim使用教程详尽版--(2025最新版)
一、Multisim14前言 1.1、主流电路仿真软件 1. Multisim:NI开发的SPICE标准仿真工具,支持模拟/数字电路混合仿真,内置丰富的元件库和虚拟仪器(示波器、频谱仪等),适合教学和竞赛设计。官网:艾…...
python pdf转图片再OCR
先pdf转图片 import os from pdf2image import convert_from_path# PDF文件路径 pdf_path /Users/xxx/2022.pdf # 输出图片的文件夹 output_folder ./output_images2022 # 输出图片的命名格式 output_name page# 如果输出文件夹不存在,创建它 if not os.path.ex…...
npm link 使用指南
npm link 使用指南 npm link 是一个非常有用的命令,主要用于在开发过程中将本地 npm 包链接到全局 npm 目录,从而可以在其他项目中使用这个本地包,而不需要发布到 npm 仓库。 基本用法 1. 创建全局链接 进入你要链接的本地包的根目录&…...
免费图片软件,可矫正倾斜、调整去底效果
软件介绍 有个超棒的软件要给大家介绍一下哦,它就是——ImgTool,能实现图片漂白去底的功能,而且重点是,它是完全免费使用的呢,功能超强大! 软件特点及使用便捷性 这软件是绿色版本的哟,就像一…...
5G网络切片:精准分配资源,提升网络效率的关键技术
5G网络切片:精准分配资源,提升网络效率的关键技术 随着5G技术的广泛应用,网络切片(Network Slicing)作为其核心创新之一,正在改变传统网络架构。它通过将物理网络划分为多个逻辑网络(切片&…...
seate TCC模式案例
场景描述 用户下单时,需要创建订单并从用户账户中扣除相应的余额。如果订单创建成功但余额划扣失败,则需要回滚订单创建操作。使用 Seata 的 TCC 模式来保证分布式事务的一致性。 1. 项目结构 假设我们有两个微服务: Order Service&#x…...
Transfomer的本质
Transformer是一个基于自注意力机制的深度学习模型,用于处理序列数据,主要结构包括编码器和解码器,每个部分由多头自注意力和前馈网络组成,加上残差连接和层归一化,以及位置编码。它解决了RNN的并行处理问题࿰…...
final修饰变量的注意
在Java中,使用final修饰变量时,需注意以下关键事项: 1. 初始化规则 实例变量: 必须在声明时、构造器或实例初始化块中初始化。所有构造器分支必须保证初始化。 class Example {final int x; // 实例变量final int y;public Exampl…...
前端与传统接口的桥梁:JSONP解决方案
1.JSONP原理 1.1.动态脚本注入 说明:通过创建 <script> 标签绕过浏览器同源策略 1.2.回调约定 说明:服务端返回 函数名(JSON数据) 格式的JS代码 1.3.自动执行 说明:浏览器加载脚本后立即触发前端预定义的回调函数(现代开…...
SQL注入 01
0x01 用户、脚本、数据库之间的关系 首先客户端发出了ID36的请求,脚本引擎收到后将ID36的请求先代入脚本的sql查询语句Select * from A where id 36 , 然后将此代入到数据库中进行查询,查到后将返回查询到的所有记录给脚本引擎,接…...
Java之封装(学习笔记)
封装定义(个人理解:) 封装就像电视遥控器的按钮,比如音量键,对于我们使用者来说就是可以直接按下去调控音量,对于代码写作者来说就是封装了调控音量的方法,使得我们只能去调控,不能改…...
每天学一个 Linux 命令(27):head
可访问网站查看,视觉品味拉满: http://www.616vip.cn/27/index.html head 是 Linux 中用于查看文件开头部分内容的命令,默认显示文件前 10 行,适合快速预览文件结构或日志头部信息。 命令格式 head [选项] [文件]常用选项 选项说明-n <行数>指定显示前 N 行(如…...
山东大学软件学院创新项目实训开发日志(20)之中医知识问答自动生成对话标题bug修改
在原代码中存在一个bug:当前对话的标题不是现有对话的用户的第一段的前几个字,而是历史对话的第一段的前几个字。 这是生成标题的逻辑出了错误: 当改成size()-1即可...
论文阅读:2024 ICML Is DPO Superior to PPO for LLM Alignment? A Comprehensive Study
Is DPO Superior to PPO for LLM Alignment? A Comprehensive Study https://www.doubao.com/chat/3506902534329346 https://arxiv.org/pdf/2404.10719 速览 这篇论文主要探讨了大语言模型对齐中两种主流方法——**DPO(直接偏好优化)和PPO…...