当前位置：首页 > news >正文

samout llm解码幻觉更低更稳定

news 来源：原创 2025/9/18 12:29:58

这段代码定义了一个简单的对话生成系统，包括模型加载、词汇表加载、以及基于给定提示生成文本的功能。下面是对代码的解析：

load_model_and_voc(device="cpu"):
- 该函数用于加载预训练的模型和词汇表（vocabulary）。它首先从文件 total_voc.pkl 中加载词汇表，并创建一个名为 SamOut 的神经网络实例。
- 模型参数的数量被打印出来以供参考。
- 然后尝试加载指定路径下的预训练权重到模型中，并将模型移动到指定的设备（CPU 或 GPU）上。
- 最后设置模型为评估模式（.eval()），并返回模型和词汇表。
gen_token(voc, model, prompt, max_len, rp=1.2, temp=0.13, top_k=16, device="cpu"):
- 这个函数负责根据提供的提示（prompt）生成新的文本序列。
- 它接受多个参数，包括词汇表、模型、初始提示、最大生成长度等。
- 函数内部实现了重复抑制、温度调整和top-k采样等技术来控制生成文本的质量。
- 使用softmax函数对模型输出进行处理，并通过多类别抽样选择下一个token。
- 如果生成了特殊的开始标记 <|sos|>，则停止生成过程。
- 生成的每个token会立即打印在屏幕上，形成即时响应的效果。
t_infre():
- 此函数是交互式推理循环，允许用户输入文本，然后调用 gen_token 函数来生成回应。
- 它是一个无限循环，持续等待用户的输入直到程序被手动终止。
if __name__ == '__main__':
- 这部分代码确保当脚本作为主程序运行时，会执行某些特定的操作或测试。
- 注释掉的代码可能是之前用于数据预处理、训练或其他实验的部分。
- 最终调用了 t_infre() 函数来启动交互式推理。

需要注意的是，这里使用的 SamOut 类并没有在给出的代码片段中定义，因此你可能需要确保这个类已经被正确实现并在其他地方导入。此外，为了使代码能够正常工作，你需要确保所有依赖库（如 PyTorch 和 pandas）已经安装，并且所有提及的数据文件和模型权重文件都存在于正确的路径下。

def load_model_and_voc(device="cpu"):voc = pd.read_pickle("total_voc.pkl")net = SamOut(len(voc["voc"]), 1024 + 512, 64, 16)# net = SamOut(len(voc["voc"]), 512, 32, 8)print(sum([i.shape[0] * i.shape[1] for i in net.parameters() if len(i.shape) > 1]) + sum([i.shape[0] for i in net.parameters() if len(i.shape) == 1]))# net.load_state_dict(torch.load("pretrain_768.pth", map_location=device))# net.load_state_dict(torch.load("pretrain_sft_single.pth", map_location=device))net.load_state_dict(torch.load("pretrain_sft_single_1024.pth", map_location=device))# net.load_state_dict(torch.load("pretrain.pth", map_location=device))net.to(device)net.eval()return net, vocdef gen_token(voc, model, prompt, max_len, rp=1.2, temp=0.13, top_k=16, device="cpu"):print("agent:", end="", flush=True)for _ in range(max_len):prompt_list = []for i in prompt:if i not in voc["voc"]:prompt_list += [voc["voc"].index(ii) for ii in voc["voc0"].get(i)]else:prompt_list.append(voc["voc"].index(i))out, _ = model(torch.Tensor([prompt_list]).to(device).long())out = out[:, -1:]# 重复抑制for token_id in enumerate(prompt_list):out[:, :, token_id] /= rpscore = torch.softmax(out, -1)[0, 0]score, score_index = torch.sort(score,descending=True)score=score.detach().numpy()score_sum = np.cumsum(score)score_index = score_index.detach().numpy()score1=score[score_sum<0.8]if score1.size==0:score=score[:1]else:score=score1score_index=score_index[:score.size]out = score / tempv= out[:min(top_k, score.size)]idx_next = torch.multinomial(torch.Tensor(v), num_samples=1, generator=None)if voc["voc"][score_index[idx_next.item()]] == "<|sos|>":breakprompt += [voc["voc"][score_index[idx_next.item()]]]print(prompt[-1], end="", flush=True)def t_infre():model, voc = load_model_and_voc()while True:text = input("user:")gen_token(voc, model, ["<|user|>"] + list("{}".format(text)) + ["<|agent|>"], 64)print()if __name__ == '__main__':# print(pd.read_pickle("loss916"))# gen_one_voc()# gen_voc()# for i in range(17,18):#     gen_pre_data_align(i, 16)# train()# gen_sft_single_data_align()# train_single()# sft 推理  一本正经的胡说八道已练成t_infre()

samout llm解码幻觉更低更稳定

这段代码定义了一个简单的对话生成系统，包括模型加载、词汇表加载、以及基于给定提示生成文本的功能。下面是对代码的解析： load_model_and_voc(device"cpu"): 该函数用于加载预训练的模型和词汇表（vocabulary）。它首先…...

编程日记 2025/9/18 12:29:58

python学opencv|读取图像（十六）修改HSV图像HSV值

【1】引言前序学习进程中，我们已经掌握了对HSV通道和BGR通道的拆分和合并，并通过自由组合的形式，获得了和初始图像完全不一样的新图像，相关文章可以参考下述链接： python学opencv|读取图像（十四&#xf…...

编程日记 2025/9/18 12:25:25

nginx自定义错误页面

一、Nginx 自定义错误页面笔记 error_page 指令语法：error_page error_code [|answer-code] uri;作用：用于定义当特定的 HTTP 错误发生时，Nginx 应该返回给客户端的自定义页面。error_code 是需要自定义页面的 HTTP 错误码，例如 …...

编程日记 2025/9/17 21:07:02

通过枚举值调用函数

在做业务的时候，需要根据前端传递的不同枚举参数（比如说0，1）返回对应固定的值。但是这个值需要根据时间又有所变化。我们可以使用if-else去实现对应的逻辑，比如说，当前端传递参数为0是，需要返回…...

编程日记 2025/9/18 12:22:22

[手机Linux] 六，ubuntu18.04私有网盘(NextCloud)安装

一，LNMP介绍 LNMP一键安装包是一个用Linux Shell编写的可以为CentOS/RHEL/Fedora/Debian/Ubuntu/Raspbian/Deepin/Alibaba/Amazon/Mint/Oracle/Rocky/Alma/Kali/UOS/银河麒麟/openEuler/Anolis OS Linux VPS或独立主机安装LNMP(Nginx/MySQL/PHP)、LNMPA(Nginx/MySQ…...

编程日记 2025/9/18 12:22:22

powershell(1)

免责声明学习视频来自 B 站up主泷羽sec，如涉及侵权马上删除文章。笔记的只是方便各位师傅学习知识，以下代码、网站只涉及学习内容，其他的都与本人无关，切莫逾越法律红线，否则后果自负。泷羽sec官网：http…...

编程日记 2025/9/18 12:25:26

Message Processing With Spring Integration高级应用：自定义消息通道与端点

一、Spring Integration 简介 Spring Integration 是 Spring 框架的扩展，支持企业集成模式（EIP），提供轻量级的消息处理功能，帮助开发者构建可维护、可测试的企业集成解决方案。核心目标： 提供简单的模型…...

编程日记 2025/9/18 12:27:23

CUDA从入门到精通（六）——CUDA编程模型（二）

1. 核函数类型限定符 CUDA 核函数的常用函数类型限定符及其相关信息的表格： 限定符执行端调用方式备注__global__设备端（GPU）从主机代码使用 <<<...>>> 调用核函数用于声明核函数，在 GPU 上执行。只能从主机代…...

编程日记 2025/9/18 12:27:39

*【每日一题基础题】 [蓝桥杯 2023 省 B] 飞机降落

题目描述 N 架飞机准备降落到某个只有一条跑道的机场。其中第 i 架飞机在 Ti 时刻到达机场上空，到达时它的剩余油料还可以继续盘旋 Di 个单位时间，即它最早可以于 Ti 时刻开始降落，最晚可以于 Ti Di 时刻开始降落。降落过程需要 Li个单位时间…...

编程日记 2025/9/18 8:25:36

作业Day4: 链表函数封装；思维导图

目录作业：实现链表剩下的操作： 任意位置删除按位置修改按值查找返回地址反转销毁运行结果思维导图作业：实现链表剩下的操作： 1>任意位置删除 2>按位置修改 3>按值查找返回地址 4>反转 5>销毁任意…...

编程日记 2025/9/17 16:06:07

线性规划中的几种逻辑表达式

线性规划中的几种逻辑表达式注意： 摘录字刘博士的《数学建模与数学规划》， 以便用时可查。实际上Gurobi API 中自身放啊变的逻辑表达式函数，下面列出自定义的实现方式。 1 逻辑与如果 x 1 1 x_1 1 x11, x 2 1 x_2 1 x21, 那…...

编程日记 2025/9/15 3:24:23

NX二次开发通过内部函数获取面的面积MW_face_ask_area

获取动态库libmold.dll的路径 void TcharToChar(const TCHAR* tchar, char* _char) {int iLength; #if UNICODE//获取字节长度 iLength WideCharToMultiByte(CP_ACP, 0, tchar, -1, NULL, 0, NULL, NULL);//将tchar值赋给_char WideCharToMultiByte(CP_ACP, 0, tchar, -…...

编程日记 2025/9/18 0:29:05

初学stm32 ——— 串口通信

目录 STM32的串口通信接口 UART异步通信方式特点： 串口通信过程 STM32串口异步通信需要定义的参数: USART框图： 常用的串口相关寄存器串口操作相关库函数编辑串口配置的一般步骤 STM32的串口通信接口 UART：通用异步收发器USART&am…...

编程日记 2025/9/18 12:24:34

分割双声道音频-Audacity和ffmpeg

双声道音频资源： https://download.csdn.net/download/yudelian/90135217 1、ffmpeg分割双声道音频 ffmpeg -i input.wav -map_channel 0.0.0 left.wav -map_channel 0.0.1 right.wav 2、audacity分割双生音频并且播放选择分离立体声轨可以看出分离出了两个音频…...

编程日记 2025/9/18 9:27:35

在 Spring Boot 3 中实现基于角色的访问控制

基于角色的访问控制 (RBAC) 是一种有价值的访问控制模型，可增强安全性、简化访问管理并提高效率。它在管理资源访问对安全和运营至关重要的复杂环境中尤其有益。我们将做什么我们有一个包含公共路由和受限路由的 Web API。受限路由需要数据库中用户的有效 JWT。现在用户…...

编程日记 2025/9/18 12:27:22

MySQL追梦旅途之慢查询分析建议

一、找到慢查询查询是否开启慢查询记录 show variables like "%slow%";log_slow_admin_statements： 决定是否将慢管理语句（如 ALTER TABLE 等）记录到慢查询日志中。 log_slow_extra ： MySQL 和 MariaDB 中的一个系…...

编程日记 2025/9/18 12:27:21

电子应用设计方案-60：智能床垫系统方案设计

智能床垫系统方案设计一、引言智能床垫作为智能家居的一部分，旨在为用户提供更舒适的睡眠体验和健康监测功能。本方案将详细描述智能床垫系统的设计理念、功能模块及技术实现。二、系统概述 1. 系统目标 - 实时监测睡眠状态，包括心率、呼吸、体动等…...

编程日记 2025/9/18 12:23:04

聊聊航空航天软件中常用的SIFT（Software-Implemented Fault Tolerance）三版本方案

一、SIFT技术在软件程序控制流程中，特别是在SIFT（Software-Implemented Fault Tolerance）系统中使用三版本编程（Three-Version Programming, 3VP）意味着为同一个任务创建三个独立的软件版本。每个版本由不同的开发团…...

编程日记 2025/9/18 6:30:58

智能座舱进阶-应用框架层-Jetpack主要组件

Jetpack的分类 1. DataBinding：以声明方式将可观察数据绑定到界面元素，通常和ViewModel配合使用。 2. Lifecycle：用于管理Activity和Fragment的生命周期，可帮助开发者生成更易于维护的轻量级代码。 3. LiveData: 在底层数据库更…...

编程日记 2025/9/18 10:04:24

2024年底-Sre面试回顾

前言背景: 2024.11月底公司不大行了, 裁员收缩, 12月初开始面试, 2周大概面试了十几家公司, 3个2面要去线下, 有1个还不错的offer, 想结束战斗但还没到时候个人情况: base上海 5年经验(2年实施3年运维半年开发) 面试岗位: Sre、云原生运维、驻场运维、高级运维、实施交付 …...

编程日记 2025/9/18 12:21:51

vue2使用render，js中写html

1、js部分table.js export default {name: "dadeT",data() {return {dades: 6666};},render(h) {return h(div, [h(span, 组件数据：${this.dades}), // 利用data里的dades数据，展示在页面上h(span, 89855545)]);} };2、vue部分 <templat…...

编程日记 2025/9/15 13:17:05

L2tp环境搭建笔记- Openwrt平台

L2tp环境搭建笔记- Openwrt平台安装L2tp服务配置L2tp serverL2TP客户端配置（使用配置文件）L2TP客户端配置（LUCI)客户端拔号（命令行方式）defaultroute路由问题L2TP（Layer 2 Tunneling Protocol）是一种工作在二层的隧道协议，是一种虚拟专用网络（VPN）协议。L2TP通常基…...

编程日记 2025/9/18 6:30:05

解决Nginx + Vue.js (ruoyi-vue) 单页应用(SPA) 404问题的指南

问题描述在使用Vue.js构建的单页应用（SPA）中，特别是像ruoyi-vue这样的框架，如果启用了HTML5历史记录模式进行路由管理，那么用户直接访问子路径或刷新页面时可能会遇到404错误。这是因为当用户尝试访问一个非根路径时…...

编程日记 2025/9/18 12:25:25

Leetcode打卡：找到稳定山的下标

执行结果：通过题目： 3258 找到稳定山的下标有 n 座山排成一列，每座山都有一个高度。给你一个整数数组 height ，其中 height[i] 表示第 i 座山的高度，再给你一个整数 threshold 。对于下标不为 0 的一座山&#xf…...

编程日记 2025/9/18 12:25:24

51c嵌入式~单片机~合集3

我自己的原文哦~ https://blog.51cto.com/whaosoft/12362395 一、STM32代码远程升级之IAP编程 IAP是什么有时项目上需要远程升级单片机程序，此时需要接触到IAP编程。 IAP即为In Application Programming，解释为在应用中编程，用户自己的…...

编程日记 2025/9/18 12:21:52

基于vue3实现小程序手机号一键登录

在Vue 3中实现小程序手机号一键登录，你需要结合小程序的API和Vue 3的框架特性。以下是一个基本的实现步骤和示例代码： 步骤创建Vue 3项目：如果你还没有Vue 3项目，你需要先创建一个。这可以通过Vue CLI或者其他方式来完成。集成…...

编程日记 2025/9/18 12:25:26

车辆重识别代码笔记12.19

1、resnet_ibn_a和resnet网络的区别 ResNet-IBN-A 是在 ResNet 基础上进行了一些改进的变种，具体来说，它引入了 Instance Batch Normalization (IBN) 的概念，这在某些任务中（如图像识别、迁移学习等）有显著的性能提升。…...

编程日记 2025/9/16 9:00:05

c语言---预处理

预处理的概念预处理是C语言编译过程的第一个阶段。在这个阶段，预处理器会根据预处理指令对源程序进行处理，这些指令以#开头，比如#include、#define等。预处理的主要目的是对源程序进行文本替换和文件包含等操作，为后续的编译步骤…...

编程日记 2025/9/18 12:29:22

Spring Cloud Sleuth 分布式链路追踪入门

您好，我是今夜写代码,今天学习下分布式链路组件Spring Cloud Sleuth。本文内容介绍了分布式链路的思想 Sleuth 和 Zipkin 简单集成Demo,并不涉及 Sleuth原理。为什么要用链路追踪？ 微服务架构下，一个复杂的电商应用，完成下…...

编程日记 2025/9/18 12:24:34

无人机航测系统技术特点！

一、无人机航测系统的设计逻辑无人机航测系统的设计逻辑主要围绕实现高效、准确、安全的航空摄影测量展开。其设计目标是通过无人机搭载相机和传感器，利用先进的飞行控制系统和数据处理技术，实现对地表信息的全方位、高精度获取。需求分析&#xff1…...

编程日记 2025/9/17 14:11:59

uniapp使用腾讯地图接口的时候提示此key每秒请求量已达到上限或者提示此key每日调用量已达到上限问题解决

要在创建的key上添加配额点击配额之后进入分配页面，分配完之后刷新uniapp就可以调用成功了。...

编程日记 2025/9/18 12:27:39

【Prompt Engineering】3.文本概括

一、引言文本信息量大，LLM在文本概括任务上展现出强大能力。本章介绍如何通过编程方式调用API接口实现文本概括功能。首先，我们需要引入 zhipuAI 包，加载 API 密钥，定义 getCompletion 函数。 from zhipuai import ZhipuAIke…...

编程日记 2025/9/18 12:26:56

5G 模组初始化状态检测

5G 模组上电检测 5G 模组上电检测 #终端上电后，待模组正常启动，再进入控制台。 #vim /etc/profile##新增 until [ -c /dev/ttyUSB1 ] doecho -e "Wait module[5G] up ... "sleep 5 done ##新增The End....

编程日记 2025/9/18 12:25:10

常用的前端框架介绍

在前端开发中，有几个常用的框架技术，它们各自具有独特的特点和优势。 1. React： • 组件化开发：React 鼓励将 UI 拆分成可复用的组件，每个组件负责渲染 UI 的一部分。 • 虚拟 DOM：React 使用虚拟 DOM 来提…...

编程日记 2025/9/18 12:25:24

python飞机大战游戏.py

python飞机大战游戏.py import pygame import random# 游戏窗口大小 WINDOW_WIDTH 600 WINDOW_HEIGHT 800# 颜色定义 BLACK (0, 0, 0) WHITE (255, 255, 255)# 初始化Pygame pygame.init()# 创建游戏窗口 window pygame.display.set_mode((WINDOW_WIDTH, WINDOW_HEIGHT))…...

编程日记 2025/9/18 12:29:24

PPO: 一种通过近端策略优化提高模型性能的方法

PPO: 一种通过近端策略优化提高模型性能的方法 PPO（Proximal Policy Optimization）是一种强化学习中的策略优化算法，主要用于训练智能体以改善在环境中表现的能力。PPO通过以下几个关键点来提高模型性能： 近端优化：PP…...

编程日记 2025/9/17 18:51:19

Docker创建一个mongodb实例，并用springboot连接 mongodb进行读写文件

一、通过Docker 进行运行一个 mongodb实例 1、拉取镜像 docker pull mongo:5.0.5 2、创建 mongodb容器实例 docker run -d --name mongodb2 \-e MONGO_INITDB_ROOT_USERNAMEsalaryMongo \-e MONGO_INITDB_ROOT_PASSWORD123456 \-p 27017:27017 \mongo:5.0.5 3、进入容器&am…...

编程日记 2025/9/15 15:20:01

[IT项目管理]九．项目质量管理

九．项目质量管理 9.1项目质量管理的重要性对于很多IT项目的差劲，大多数人只可以忍受。项目质量管理是IT项目管理的重要组成部分，对于提高项目成功率、降低项目成本、提升客户满意度至关重要。尽管很多人对IT项目的质量问题感到无奈&#x…...

编程日记 2025/9/15 14:29:51

Unity中的委托和事件（UnityAction、UnityEvent）

委托和事件 🎒什么是委托，委托的关键字是Delegate，委托是一种函数的容器，运行将函数做为变量来进行传递通过Delegate关键字我们声明了一个无参无返回的委托，通过这个委托我们可以存储无参无返回的函数 public deleg…...

编程日记 2025/9/14 6:06:25

图像生成工具WebUI

介绍 Stable Diffusion WebUI（AUTOMATIC1111，简称A1111）是一个为高级用户设计的图形用户界面（GUI），它提供了丰富的功能和灵活性，以满足复杂和高级的图像生成需求。如今各种人工智能满天飞&…...

编程日记 2025/9/14 12:14:53

Python面试常见问题及答案12

问题： 请解释Python中的GIL（全局解释器锁）是什么？ ○ 答案： GIL是Python解释器中的一种机制，用于确保任何时候只有一个线程在执行Python字节码。这在多线程场景下可能影响性能优化，但对于单线程…...

编程日记 2025/9/11 20:56:17

javalock（六）CyclicBarrier

注意：CyclicBarrier不是AQS的派生类，而是CyclicBarrier内部使用了ReentrantLock.Condition 和CountDownLatch一样，都是计数减为0就可以成功获取锁和CountDownLatch不同的是： 1：CountDownLatch的await和countdown操作…...

编程日记 2025/9/11 17:48:48

React 19有哪些新特性？

写在前面 2024.12.5，React 团队在 react.dev/blog 上发表了帖子 react.dev/blog/2024/1… React 19 正式进入了 stable 状态 React 团队介绍了一些新的特性和 Breaking Changes，并提供了升级指南， React 19: 新更新、新特性和新Hooks Reac…...

编程日记 2025/9/11 1:56:09

大数据治理：构建数据驱动的智慧教学体系

随着大数据技术在教育领域的逐渐渗透，大数据治理在教学中的应用日益广泛，它为提升教学质量、优化教学资源配置以及实现个性化教学提供了有力支持。一、大数据治理在教学数据管理中的应用在教学过程中，会产生海量的数据，如学生的…...

编程日记 2025/9/15 13:47:36

梳理你的思路(从OOP到架构设计)_浅尝架构师的滋味03

目录 1、分与合： 强龙与地头蛇的分工分工 & 合作分工的时间点客人来之前做「分」，客人来之后做「合」 2、结语肯德基餐厅火锅店汽车从分工到外包模式 1、分与合： 强龙与地头蛇的分工 EIT造形用来表达架构师的先「分」与买…...

编程日记 2025/9/17 17:22:48

ChatGPT与领域特定语言的集成

用ChatGPT做软件测试领域特定语言（Domain-Specific Language，DSL）是一种编程语言，专门设计用于满足特定领域或问题领域的需求。它是一种定制的语言，通常包括特定领域的专业术语以及相应的语法规则。DSL的设计旨在让领…...

编程日记 2025/9/10 17:36:39

sql server msdb数据库备份恢复

备份 BACKUP DATABASE [msdb] TO DISK ND:\liyuanshuai\test\sqlserver_bakfile\msdb20241219.bak WITH NOFORMAT, NOINIT, NAME Nlys-完整数据库备份, SKIP, NOREWIND, NOUNLOAD, COMPRESSION, STATS 10 GO然后删除2个测试的job，停止 SQL Server 代理…...

编程日记 2025/9/11 18:35:53

MyBatis（二）

一、MyBatis 和 JDBC 有什么区别？ JDBC 是 Java 访问数据库的基础 API，它需要大量的样板代码。比如，使用 JDBC 进行查询时，需要加载驱动、建立连接、创建语句、执行查询、处理结果集和关闭资源等操作。代码比较繁琐且容易出错。M…...

编程日记 2025/9/13 20:57:09

Docker：Dockerfile(补充四)

这里写目录标题 1. Dockerfile常见指令1.1 DockerFile例子 2. 一些其他命令 1. Dockerfile常见指令简单的dockerFile文件 FROM openjdk:17LABEL authorleifengyangCOPY app.jar /app.jarEXPOSE 8080ENTRYPOINT ["java","-jar","/app.jar"]# 使…...

编程日记 2025/9/16 21:46:57

Hexo博客生成标签和分类页

个人博客地址：Hexo博客生成标签和分类页 | 一张假钞的真实世界。标签页默认情况下，Hexo站点创建后，需手动生成标签页。如不生成，在点击“标签”菜单时会出现以下错误： Cannot GET /tags/ 执行以下命令创建标签页…...

编程日记 2025/9/17 11:28:08

相关文章：