Edge-TTS在广电系统中的语音合成技术的创新应用
Edge-TTS在广电系统中的语音合成技术的创新应用
作者:本人是一名县级融媒体中心的工程师,多年来一直坚持学习、提升自己。喜欢Python编程、人工智能、网络安全等多领域的技术。
摘要
随着人工智能技术的快速发展,文字转语音(Text-to-Speech, TTS)系统已成为多种应用的重要组成部分,尤其在广播电视领域。本文介绍了一种基于Edge-TTS大模型的文字转语音工具,该工具结合了现代文本处理和语音合成技术,为用户提供了高效的音频生成解决方案。通过对该工具的设计与实现进行分析,本文探讨了其在广播电视行业中的潜在应用场景及未来发展方向。
引言
文字转语音技术使得计算机能够将书面文字转换为自然的人声,这对于广播电视行业至关重要。它可以用于生成新闻播报、广告配音、教育培训等多种场景,以提高信息传达的效率和生动性。随着神经网络技术的发展,现代TTS模型已经能够生成接近人类自然声音质量的语音。
Edge-TTS 模型介绍
Edge-TTS是一个基于微软 Azure Cognitive Services 的开源文本转语音(Text-to-Speech,TTS)工具,它利用微软的语音合成技术,将文本转换为自然流畅的语音输出。以下是关于 Edge-TTS 的详细介绍:
1.功能特点
• 高质量语音合成:
• Edge-TTS 能够生成非常自然和清晰的语音,通过对语音的韵律、语调、重音等方面进行精细模拟,使得合成的语音接近人类自然发音。
• 支持多种语言和方言,能够根据语言特点调整发音规则。
• 丰富的语言和语音风格支持:
• 支持超过40种语言和300多种声音选项。
• 提供多种语音风格,包括男性、女性、年轻、成熟等,用户可以根据场景选择合适的语音。
• 易于使用:
• 提供简单易用的接口,支持命令行和编程接口。
• 开发者可以通过 Python 等编程语言调用 Edge-TTS,实现个性化的文本转语音应用。
• 开源免费:
• Edge-TTS 是开源项目,用户可以免费使用。
• 源代码在 GitHub 上公开,社区成员可以贡献代码和进行功能扩展。
2.技术原理
• 文本到语音转换:
• 将文本信息转换为语音输出,包括文本分析、分词、音素转换等步骤。
• 语音合成引擎:
• 利用微软 Azure Cognitive Services 的语音合成 API,生成高质量的语音。
• 自然语音流:
• 通过先进的语音合成技术,生成流畅自然的语音流,包括适当的语调、节奏和强度变化。
• 参数调整:
• 用户可以调整语音的参数,如语速、音量、语调等,以获得最佳的语音输出效果。
3.应用场景
• 语音助手:为用户提供自然便捷的语音交互方式。
• 电子书阅读器:将电子书内容转换为语音,方便用户听书。
• 视频制作:为视频添加语音旁白,提高视频质量。
• 教育领域:帮助教师制作教学课件,为视力障碍学生提供学习支持。
• 智能客服:将客服回复的文本转换为语音,提高服务效率。
4.使用方法
• 命令行使用:
• 安装 Edge-TTS:
pip install edge-tts
• 将文本转换为语音文件:
edge-tts --text "Hello, world!" --voice en-US-JennyNeural --write-media output.wav
• 编程接口:
• 使用 Python 调用 Edge-TTS:
import asyncioimport edge_ttsasync def generate_audio(text, voice, output_file):tts = edge_tts.Communicate(text, voice)await tts.save(output_file)asyncio.run(generate_audio("Hello, world!", "en-US-JennyNeural", "output.wav"))
5.优势
• 自然流畅的语音输出:通过精细的语音合成技术,生成自然流畅的语音。
• 多样化的语音选择:支持多种语言和语音风格,满足不同用户的需求。
• 易于集成和使用:提供简单易用的接口,方便开发者在应用程序中集成语音功能。
• 开源免费:开源项目,用户可以免费使用并进行定制。
文本转语音工具概述
本文中所展示的代码实现了一个简单而有效的文字转语音工具,其主要功能包括:
-
文本输入:用户可以在界面上输入或粘贴需要转换为语音的文本。文本框支持多行输入,适用于长篇文章或复杂内容。
-
语音选择:用户可以从多种可用的语音角色中选择合适的声音,以满足不同的内容需求。该工具集成了多种音色,包括男性和女性的不同口音,使得用户可以根据目标受众选择最合适的语音风格。
-
语速调整:用户可以根据需要调整语音的播放速度,从而增强节目的灵活性和可读性。通过下拉菜单,用户可选择从-100%到+100%的各个速度级别,使得生成的音频更符合特定场合的需求。
-
输出目录选择:用户可以自定义输出目录以便于管理生成的音频文件。通过文件选择对话框,用户可以轻松选择个人设备上的任意文件夹,提升了使用便利性。
-
右键菜单操作:在文本输入框中,用户可以使用右键菜单进行文本复制、剪切和粘贴等常用操作。这一功能不仅简化了文本输入过程,也提升了用户体验,尤其对于长文本的编辑。
-
异步任务处理:为了提高程序的响应速度,工具采用了异步编程模式。在合成音频的过程中,主线程不会被阻塞,这意味着用户仍然可以进行其他操作,而不会感到延迟。此设计显著提高了用户体验。
-
文件管理:工具自动管理文件输出,包括创建必要的目录结构和命名规则。用户可以方便地选择输出目录,并自定义文件名称,使得生成的音频文件易于查找和管理。同时,系统会确保生成的文件不与已有文件冲突。
运行环境
操作系统: Windows系统、Mac系统、Linux系统(本事例是Mac系统)
IDE:Pycharm 2024.1
开发语言:Python 3.12
代码实现分析
源代码如下:
import os
import tempfile
import asyncio
import pygame.mixer
import customtkinter as ctk
from tkinter import filedialog
from tkinter import messagebox
from edge_tts import Communicate
from tkinter import Menu
import tkinter as tkpygame.mixer.init()# 用于异步执行 my_function 函数,以提高响应速度
async def my_function(text, output, voice, rate):volume = '+0%'tts = Communicate(text=text, voice=voice, rate=rate, volume=volume)await tts.save(output)# 将训练好的语言模型以字典的形式存储,字典的键为神经网络的汉字名,字典的值为神经网络的训练模型名
# 这样做是为了给使用者更直观、更容易理解的界面菜单
voice_dict = {'(女)小小神经网络': 'zh-CN-XiaoxiaoNeural', '(女)小一神经网络': 'zh-CN-XiaoyiNeural','(男)云健神经网络': 'zh-CN-YunjianNeural', '(男)云熙神经网络': 'zh-CN-YunxiNeural','(女)云霞神经网络': 'zh-CN-YunxiaNeural', '(男标准话)云阳神经网络': 'zh-CN-YunyangNeural','(女)辽宁-小贝神经网络': 'zh-CN-liaoning-XiaobeiNeural','(女)陕西-小妮神经网络': 'zh-CN-shaanxi-XiaoniNeural', '(女)香港-HiuGa神经网络': 'zh-HK-HiuGaaiNeural','(女)香港-HiuMa神经网络': 'zh-HK-HiuMaanNeural', '(男)香港-万隆神经网络': 'zh-HK-WanLungNeural','(女)台湾-Hsiao陈神经网络': 'zh-TW-HsiaoChenNeural', '(女)台湾-Hsiao于神经网络': 'zh-TW-HsiaoYuNeural','(男普通话)台湾-云J何神经网络': 'zh-TW-YunJheNeural'}def show_context_menu(event):context_menu.post(event.x_root, event.y_root)# 定义 synthesize_text 函数:这个函数是主要的功能实现部分。
# 首先从文本输入框中获取要转换的文本。
def synthesize_text():text = text_entry.get("1.0", ctk.END).strip()voice = voice_dict[voice_var.get()]rate = rate_var.get()# 生成输出的文件目录out_dir = output_dir_entry.get()output_dir = os.path.join(out_dir, "mp3")if not os.path.exists(output_dir):os.makedirs(output_dir)# 选择的语音模式作为文件名filename_save = text_entry_filename.get("1.0", ctk.END).strip() + '-' + voice_var.get()filename = os.path.join(output_dir, filename_save + ".mp3")with tempfile.NamedTemporaryFile(delete=False, suffix=".mp3", dir=output_dir) as temp_file:temp_filename = temp_file.nameloop = asyncio.get_event_loop()loop.run_until_complete(my_function(text, temp_filename, voice, rate))os.rename(temp_filename, filename)messagebox.showinfo("成功", "音频文件生成成功!")# 定义 select_output_directory 函数, 这个函数用于打开文件选择对话框,让用户选择输出目录。
def select_output_directory():output_dir = filedialog.askdirectory()if output_dir:output_dir_entry.delete(0, ctk.END)output_dir_entry.insert(ctk.END, output_dir)# 设置 CustomTkinter 主题
ctk.set_appearance_mode("System")
ctk.set_default_color_theme("blue")# 创建主窗口
root = tk.Tk()
# root = ctk.CTk()
root.title("文字转语音工具--微信公众号:强壮Python")
root.geometry("730x700")
root.resizable(False, False)# 创建标题
title_label = ctk.CTkLabel(root, text="文字转语音工具", font=("Arial", 24, "bold"), pady=20)
title_label.pack()# 创建文本输入框
text_label = ctk.CTkLabel(root, text="请输入要转换为语音的文本:", font=("Arial", 14))
text_label.pack()text_entry = tk.Text(root, height=15, width=100, font=("Arial", 12))
text_entry.pack()# 创建右键菜单
context_menu = Menu(root, tearoff=0)
context_menu.add_command(label="复制", command=lambda: text_entry.event_generate("<<Copy>>"))
context_menu.add_command(label="剪切", command=lambda: text_entry.event_generate("<<Cut>>"))
context_menu.add_command(label="粘贴", command=lambda: text_entry.event_generate("<<Paste>>"))# 绑定右键菜单到文本输入框# # 自添代码,保存文件的名称
text_label_filename = ctk.CTkLabel(root, text="请输入保存的文件名称:", font=("Arial", 14))
text_label_filename.pack()# text_entry_filename = ctk.CTkTextbox(root, height=20, width=210, font=("Arial", 12))
text_entry_filename = tk.Text(root, height=3, width=30, font=("Arial", 12))
text_entry_filename.pack()# 绑定右键菜单到文本输入框
text_entry.bind("<Button-2>", show_context_menu)
# 创建输出目录选择框
output_dir_label = ctk.CTkLabel(root, text="选择输出目录:", font=("Arial", 14))
output_dir_label.pack()output_dir_frame = ctk.CTkFrame(root)
output_dir_frame.pack()output_dir_entry = ctk.CTkEntry(output_dir_frame, font=("Arial", 12), width=50)
output_dir_entry.pack(side=ctk.LEFT)output_dir_button = ctk.CTkButton(output_dir_frame, text="选择目录", font=("Arial", 12),command=select_output_directory)
output_dir_button.pack(side=ctk.LEFT)# 创建语音选择下拉框
voice_label = ctk.CTkLabel(root, text="请选择要使用的语音角色:", font=("Arial", 14))
voice_label.pack()voice_var = ctk.StringVar()
# voice_var.set(voice_dict["(女)小小神经网络"])
if not voice_var:print('请选择语音模式')
voice_select = ctk.CTkOptionMenu(root, variable=voice_var, values=list(voice_dict.keys()),font=("Arial", 12), width=20)
voice_select.pack()# 创建语速选择下拉框
rate_label = ctk.CTkLabel(root, text="调整语速:", font=("Arial", 14))
rate_label.pack()rate_var = ctk.StringVar()
rate_var.set("+0%")rate_select = ctk.CTkOptionMenu(root, variable=rate_var,values=["-100%", "-90%", "-80%", "-70%", "-60%", "-50%", "-40%", "-30%","-20%", "-10%", "+0%", "+10%", "+20%", "+30%", "+40%", "+50%", "+60%", "+70%","+80%", "+90%", "+100%"], font=("Arial", 12), width=20)
rate_select.pack()# 创建合成按钮
synthesize_button = ctk.CTkButton(root, text="合成音频", font=("Arial", 16, "bold"), command=synthesize_text, width=150,height=50)
synthesize_button.pack(pady=20)root.mainloop()
界面设计
工具的用户界面采用customtkinter
框架构建,支持多种操作,包括文本输入、文件选择以及右键菜单操作。用户友好的界面设计能够有效降低使用门槛,使得即使是非技术人员也能轻松操作。整体布局简洁明了,每一项功能模块都进行了合理的分组与标注,确保了良好的用户交互体验。
运行界面如下图所示:
运行程序,文本框的文字可以通过点击鼠标右键(粘贴、复制、剪切),如下图所示:
将文本内容粘贴或者直接输入到上图中的文本框,选择输出目录,如下图所示:
选择语音角色,如下图所示:
选择需要的语速,默认是0,也就是正常语速,如下图所示:
点击合成音频按钮,转换成功,会自动弹窗音频文件生成成功。如下图所示:
异步任务处理
为了提高程序的响应速度,工具采用了异步编程模式。通过使用asyncio
库,合成音频的任务在后台运行,确保界面持续响应用户的其他操作。这种设计方式不仅增强了程序的流畅性,还避免了在较大文本量处理时可能出现的“卡顿”现象。
文件管理
工具的文件管理功能非常健全。首先,用户可以选择生成的音频文件保存的目录,系统会检查该目录是否存在,如不存在则自动创建。此外,音频文件命名方面,工具支持用户自定义文件名,确保生成的音频文件易于识别和分类。最终,所有生成的文件均以.mp3
格式存储,以保证广泛的兼容性。
应用场景
本工具的设计理念和实现方式使其在广播电视行业具有广泛的应用前景:
-
新闻播报:通过快速生成新闻稿件的音频版本,提升新闻传播的效率。媒体机构可以在紧急情况下迅速将消息以语音形式发布,提高信息传递的时效性。
-
广告制作:为广告文案提供音频支持,增强广告的吸引力和传播效果。企业在制作广告时,可以根据目标受众选择合适的声音角色,提升广告的亲和力。
-
教育培训:为在线教育平台提供课程内容的音频化服务,提高学生的学习兴趣和效果。教师可以利用此工具将教学材料转化为声音,让学习变得更加生动。
未来发展方向
随着深度学习和自然语言处理技术的不断进步,TTS系统将朝着更高的音质、更丰富的声音特征和更自然的表达方式发展。未来,本工具可以进一步集成情感识别、个性化声音合成等高级功能,以更好地服务于广播电视行业的多样化需求。例如,通过分析文本的情感因素,生成情感丰富的语音输出,以增强听众的参与感和沉浸感。
结论
基于Edge-TTS大模型的文字转语音工具展现了强大的潜力,在广播电视领域具有实际应用价值。通过不断优化和扩展工具的功能,可以为行业提供更加高效、灵活的音频合成解决方案,助力信息传播的全面升级。本文的研究不仅为当前技术的应用提供了一定的参考,也为未来的研究方向指明了道路。
以上是对Edge-TTS大模型在广播电视领域应用的详细解释和说明,旨在深化理解并完善论文内容。通过这些具体的功能描述和应用场景分析,希望能够为相关领域的研究者和开发者提供有益的参考和启示。
原创不易,欢迎点赞、关注、转发、收藏!!!
相关文章:
Edge-TTS在广电系统中的语音合成技术的创新应用
Edge-TTS在广电系统中的语音合成技术的创新应用 作者:本人是一名县级融媒体中心的工程师,多年来一直坚持学习、提升自己。喜欢Python编程、人工智能、网络安全等多领域的技术。 摘要 随着人工智能技术的快速发展,文字转语音(Te…...
python学opencv|读取图像(四十七)使用cv2.bitwise_not()函数实现图像按位取反运算
【0】基础定义 按位与运算:两个等长度二进制数上下对齐,全1取1,其余取0。按位或运算:两个等长度二进制数上下对齐,有1取1,其余取0。 按位取反运算:一个二进制数,0变1,1变0。 【1】…...
一文讲解Java中Object类常用的方法
在Java中,经常提到一个词“万物皆对象”,其中的“万物”指的是Java中的所有类,而这些类都是Object类的子类; Object主要提供了11个方法,大致可以分为六类: 对象比较: public native int has…...
【算法篇·更新中】C++秒入门(附练习用题目)
一.二分 1.二分查找 我们来看这样一道题: 有一个保证有序的数组a,它的长度为n。现在我们需要知道这个序列是否含有x。 数据范围:保证n<1e9 我们看到这道题之后,第一时间想到的就是暴力枚举了,可是我们发现直接枚举…...
面向对象编程 vs 面向过程编程
面向对象编程 vs 面向过程编程:深入解析这两种编程范式的区别 在当今软件开发领域,编程范式的选择对于项目的可维护性和可扩展性至关重要。面向对象编程(OOP)和面向过程编程(POP)是两种根本的编程思想。本…...
【Rust自学】16.2. 使用消息传递来跨线程传递数据
喜欢的话别忘了点赞、收藏加关注哦(加关注即可阅读全文),对接下来的教程有兴趣的可以关注专栏。谢谢喵!(・ω・) 16.2.1. 消息传递 有一种很流行而且能保证安全并发的技术(或者叫机制ÿ…...
【四川乡镇界面】图层shp格式arcgis数据乡镇名称和编码2020年wgs84无偏移内容测评
本文将详细解析标题和描述中提到的IT知识点,主要涉及GIS(Geographic Information System,地理信息系统)技术,以及与之相关的文件格式和坐标系统。 我们要了解的是"shp"格式,这是一种广泛用于存储…...
人物传记之新月篇
相关故事链接(及时更新):Python的那些事第四篇:编程中的智慧之光控制结构-CSDN博客 Python的那些事第五篇:数据结构的艺术与应用-CSDN博客 目录 1. C语言程序:增强版加密与解密工具 2. Python程序&#x…...
TypeScript中的函数:类型安全与高级特性
🤍 前端开发工程师、技术日更博主、已过CET6 🍨 阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1 🕠 牛客高级专题作者、打造专栏《前端面试必备》 、《2024面试高频手撕题》 🍚 蓝桥云课签约作者、上架课程《Vue.js 和 E…...
DDD 和 TDD
领域驱动设计(DDD) DDD 是一种软件开发方法,强调通过与领域专家的密切合作来构建一个反映业务逻辑的模型。其核心思想是将业务逻辑和技术实现紧密结合,以便更好地解决复杂的业务问题。 DDD 的关键概念: 1. 领域模型 …...
【C语言分支与循环结构详解】
目录 ---------------------------------------begin--------------------------------------- 一、分支结构 1. if语句 2. switch语句 二、循环结构 1. for循环 2. while循环 3. do-while循环 三、嵌套结构 结语 -----------------------------------------end----…...
FaceFusion
文章目录 一、关于 FaceFusion预览 二、安装三、用法 一、关于 FaceFusion FaceFusion 是行业领先的人脸操作平台 github : https://github.com/facefusion/facefusion官方文档:https://docs.facefusion.io/Discord : https://discord.com/invite/facefusion-1141…...
图论——单源最短路的扩展应用
acwing1137.选择最佳路线 本题有两个解决思路 1.建立虚拟源点,连接虚拟源点和 w w w个可作为起点的点,边权为0,这样只需要从虚拟源点开始做一遍最短路算法便可。 2.反向建边,把所有的add(a,b,c)变成add(b,a,c),这样只…...
Linux shell脚本笔记-One
前言 本文主要汇总有关shell脚本常用的知识点,有时候使用忘记某些用法指令,特此汇总方便后续查阅。 一.shell脚本编写的头部定义: 定义的shell脚本头部有多种写法,具体根基实际系统结构处理,如下: #!/bin/sh ÿ…...
【C语言----函数详解】
目录 ----------------------------------------begin-------------------------------------- 引言 一、函数是什么 二、函数的定义和声明 1. 函数的定义 2. 函数的声明 三、函数的调用 四、函数参数传递 五、函数的返回值 六、递归函数 七、函数指针 八、总结 ---…...
QT交叉编译环境搭建(Cmake和qmake)
介绍一共有两种方法(基于qmake和cmake): 1.直接调用虚拟机中的交叉编译工具编译 2.在QT中新建编译套件kits camke和qmake的区别:CMake 和 qmake 都是自动化构建工具,用于简化构建过程,管理编译设置&…...
Zemax 中的屋脊棱镜建模
光学棱镜是一种透明的光学元件,其表面平坦且抛光,可以折射光线。最常见的棱镜类型是三棱镜,它有两个三角形底座和三个矩形或略呈梯形的表面。棱镜通常由玻璃或丙烯酸等材料制成。当光线以一定角度进入棱镜时,它会在穿过棱镜时发生…...
CUDA学习-内存访问
一 访存合并 1.1 说明 本部分内容主要参考: 搞懂 CUDA Shared Memory 上的 bank conflicts 和向量化指令(LDS.128 / float4)的访存特点 - 知乎 1.2 share memory结构 图1.1 share memory结构 放在 shared memory 中的数据是以 4 bytes(即 32 bits)作为 1 个 word,依…...
Nginx 开发总结
文章目录 1. Nginx 基础概念1-1、什么是 Nginx1-2、Nginx 的工作原理1-3、Nginx 的核心特点1-4、Nginx 的常见应用场景1-5、Nginx 与 Apache 的区别1-6、 Nginx 配置的基本结构1-7、Nginx 常见指令 2. Nginx 配置基础2-1、Nginx 配置文件结构2-2、全局配置 (Global Block)2-3、…...
目标跟踪之sort算法(3)
这里写目录标题 1 流程1 预处理2 跟踪 2 代码 参考:sort代码 https://github.com/abewley/sort 1 流程 1 预处理 1.1 获取离线检测数据。1.2 实例化跟踪器。2 跟踪 2.1 轨迹处理。根据上一帧的轨迹预测当前帧的轨迹,剔除到当前轨迹中为空的轨迹得到当前…...
C++/stack_queue
目录 1.stack 1.1stack的介绍 1.2stack的使用 练习题: 1.3stack的模拟实现 2.queue的介绍和使用 2.1queue的介绍 2.2queue的使用 2.3queue的模拟实现 3.priority_queue的介绍和使用 3.1priority_queue的介绍 3.2priority_queue的使用 欢迎 1.stack 1.1stack…...
小程序电商运营内容真实性增强策略及开源链动2+1模式AI智能名片S2B2C商城系统源码的应用探索
摘要:随着互联网技术的不断发展,小程序电商已成为现代商业的重要组成部分。然而,如何在竞争激烈的市场中增强小程序内容的真实性,提高用户信任度,成为电商运营者面临的一大挑战。本文首先探讨了通过图片、视频等方式增…...
「Unity3D」在Unity中使用C#控制显示Android的状态栏
Unity打包的Android默认都是全屏,如果想要在真机上显示状态栏,就需要额外设置,有两种方式: 第一种,使用Android的Java代码去控制,然后以插件的方式放到Unity中,被C#调用。第二种,使…...
基于51单片机和ESP8266(01S)、LCD1602、DS1302、独立按键的WiFi时钟
目录 系列文章目录前言一、效果展示二、原理分析三、各模块代码1、延时2、定时器03、串口通信4、DS13025、LCD16026、独立按键 四、主函数总结 系列文章目录 前言 之前做了一个WiFi定时器时钟,用八位数码管进行显示,但是定时器时钟的精度较低࿰…...
AI 浪潮席卷中国年,开启科技新春新纪元
在这博主提前祝大家蛇年快乐呀!!! 随着人工智能(AI)技术的飞速发展,其影响力已经渗透到社会生活的方方面面。在中国传统节日 —— 春节期间,AI 技术也展现出了巨大的潜力,为中国年带…...
STM32 LED呼吸灯
接线图: 这里将正极接到PA0引脚上,负极接到GND,这样就高电平点亮LED,低电平熄灭。 占空比越大,LED越亮,占空比越小,LED越暗 PWM初始化配置 输出比较函数介绍: 用这四个函数配置输…...
机器学习day4
自定义数据集 使用pytorch框架实现逻辑回归并保存模型,然后保存模型后再加载模型进行预测 import numpy as np import torch import torch.nn as nn import torch.optim as optimizer import matplotlib.pyplot as pltclass1_points np.array([[2.1, 1.8],[1.9, 2…...
《哈佛家训》
《哈佛家训》是一本以教育为主题的书籍,旨在通过一系列富有哲理的故事和案例,传递积极的人生观、价值观和教育理念。虽然它并非直接由哈佛大学官方出版,但其内容深受读者喜爱,尤其是在家庭教育和个人成长领域。 以下是《哈佛家训…...
为什么redis会开小差?Redis 频繁异常的深度剖析与解决方案
文章目录 导读为什么redis会开小差?1.连接数过多2.bigkey3.慢命令操作4.内存策略不合理5.外部数据双写一致性6.保护机制未开启7. 数据集中过期8. CPU饱和9. 持久化阻塞10. 网络问题结论 导读 提起分布式缓存,想必大多数同学脑海中都会浮出redis这个名字…...
window中80端口被占用问题
1,查看报错信息 可以看到在启动项目的时候,8081端口被占用了,导致项目无法启动。 2,查看被占用端口的pid #语法 netstat -aon|findstr :被占用端口#示例 netstat -aon|findstr :8080 3,杀死进程 #语法 taikkill /pid…...
< OS 有关 > 阿里云:轻量应用服务器 的使用 :轻量化 阿里云 vpm 主机
原因: < OS 有关 > 阿里云:轻量应用服务器 的使用 :从新开始 配置 SSH 主机名 DNS Tailscale 更新OS安装包 最主要是 清除阿里云客户端这个性能杀手-CSDN博客 防止 I/O 祸害系统 操作: 查看进程&#x…...
解决报错“The layer xxx has never been called and thus has no defined input shape”
解决报错“The layer xxx has never been called and thus has no defined input shape”(这里写自定义目录标题) 报错显示 最近在跑yolo的代码时遇到这样一个错误,显示“the layer {self.name} has never been called”.这个程序闲置了很久,每次一遇到…...
Microsoft Visual Studio 2022 主题修改(补充)
Microsoft Visual Studio 2022 透明背景修改这方面已经有很多佬介绍过了,今天闲来无事就补充几点细节。 具体的修改可以参考:Microsoft Visual Studio 2022 透明背景修改(快捷方法)_material studio怎么把背景弄成透明-CSDN博客文…...
PyCharm接入DeepSeek实现AI编程
目录 效果演示 创建API key 在PyCharm中下载CodeGPT插件 配置Continue DeepSeek 是一家专注于人工智能技术研发的公司,致力于开发高性能、低成本的 AI 模型。DeepSeek-V3 是 DeepSeek 公司推出的最新一代 AI 模型。其前身是 DeepSeek-V2.5,经过持续的…...
C++ 包装器与绑定器的应用之回调函数的实现
回调函数的实现 在消息队列和网络库的框架中,当接收到消息(报文)时,回调用户自定义的函数对象,把消息(报文)参数传给它,由它决定如何处理。 queue参考文章:C queue(STL queue&…...
一文读懂DeepSeek-R1论文
目录 论文总结 摘要 1. 引言 1.1. 贡献 1.2. 评估结果总结 2. 方法 2.1. 概述 2.2. DeepSeek-R1-Zero:在基础模型上进行强化学习 2.2.1. 强化学习算法 2.2.2. 奖励建模 2.2.3. 训练模板 2.2.4. DeepSeek-R1-Zero 的性能、自我进化过程和顿悟时刻 2.3. …...
文献阅读 250128-Tropical forests are approaching critical temperature thresholds
Tropical forests are approaching critical temperature thresholds 来自 <Tropical forests are approaching critical temperature thresholds | Nature> 热带森林正在接近临界温度阈值 ## Abstract: The critical temperature beyond which photosynthetic machinery…...
【python】python基于机器学习与数据分析的二手手机特性关联与分类预测(源码+数据集)【独一无二】
👉博__主👈:米码收割机 👉技__能👈:C/Python语言 👉专__注👈:专注主流机器人、人工智能等相关领域的开发、测试技术。 python基于机器学习与数据分析的二手手机特性关联与…...
构建可靠的时间序列预测模型:数据泄露检测、前瞻性偏差消除与因果关系验证
在时间序列分析领域中,存在多种可能影响分析结果有效性的技术挑战。其中,数据泄露、前瞻性偏差和因果关系违反是最为常见且具有显著影响的问题。 数据泄露:隐蔽的系统性错误 数据泄露是指在预测时理论上无法获取的信息,通过某种…...
Spring Boot - 数据库集成05 - 集成MongoDB
Spring Boot集成MongoDB 文章目录 Spring Boot集成MongoDB一:使用前的准备1:依赖导入 & 配置2:实体类创建 二:核心 - MongoRepository三:核心 - MongoTemplate1:集合操作2:文档操作(重点)3&…...
计算机网络之运输层
本文章目录结构出自于《王道计算机考研 计算机网络_哔哩哔哩_bilibili》 04 传输层 在网上看到其他人做了相关笔记,就不再多余写了,直接参考着学习吧。 王道考研 计算机网络笔记 第五章:传输层_王道计算机网络传输层_Baret-H的博客-CSDN博…...
DeepSeekMoE:迈向混合专家语言模型的终极专业化
一、结论写在前面 论文提出了MoE语言模型的DeepSeekMoE架构,目的是实现终极的专家专业化(expert specialization)。通过细粒度的专家分割和共享专家隔离,DeepSeekMoE相比主流的MoE架构实现了显著更高的专家专业化和性能。从较小的2B参数规模开始&#x…...
知识库管理驱动企业知识流动与工作协同创新模式
内容概要 知识库管理在现代企业中扮演着至关重要的角色,其价值不仅体现在知识的积累,还在于通过优质的信息流动促进协作与创新。有效的知识库能够将分散的信息整合为有序、易于访问的资源,为员工提供实时支持,进而提升整体工作效…...
二叉树-堆(补充)
二叉树-堆 1.二叉树的基本特性2.堆2.1.堆的基本概念2.2.堆的实现2.2.1.基本结构2.2.2.堆的初始化2.2.3.堆的销毁2.2.4.堆的插入2.2.5.取出堆顶的数据2.2.6.堆的删除2.2.7.堆的判空2.2.8.堆的数据个数2.2.9.交换2.2.10.打印堆数据2.2.11.堆的创建2.2.12.堆排序2.2.13.完整代码 3…...
Java面试题2025-并发编程基础(多线程、锁、阻塞队列)
并发编程 一、线程的基础概念 一、基础概念 1.1 进程与线程A 什么是进程? 进程是指运行中的程序。 比如我们使用钉钉,浏览器,需要启动这个程序,操作系统会给这个程序分配一定的资源(占用内存资源)。 …...
【方法论】ChatGPT与DeepSeek的联合应用,提升工作效率的新解决方案
标题:ChatGPT与DeepSeek的联合应用,提升工作效率的新解决方案 【表格】ChatGPT与DeepSeek联合应用流程 阶段工具主要任务优势备注初稿生成ChatGPT基于用户输入生成初步内容高效、快速生成内容,适应多种主题适合生成长篇文章、报告、分析等验…...
RoboMaster- RDK X5能量机关实现案例(一)识别
作者:SkyXZ CSDN:https://blog.csdn.net/xiongqi123123 博客园:https://www.cnblogs.com/SkyXZ 在RoboMaster的25赛季,我主要负责了能量机关的视觉方案开发,目前整体算法已经搭建完成,实际方案上我使用的上…...
5分钟带你获取deepseek api并搭建简易问答应用
目录 1、获取api 2、获取base_url和chat_model 3、配置模型参数 方法一:终端中临时将加入 方法二:创建.env文件 4、 配置client 5、利用deepseek大模型实现简易问答 deepseek-v3是截止博文撰写之日,无论是国内还是国际上发布的大模型中…...
Ikigai是什么
Ikigai(生き甲斐) 是一个日语词语,意思是“生活的意义”或“生命的价值所在”。它是一种关于人生意义的哲学概念,源自日本文化,强调通过找到自己热爱、擅长、社会需要以及能带来经济回报的交集来实现幸福和满足感。 I…...
基于PyQt设计的智能停车管理系统
文章目录 一、前言1.1 项目介绍【1】项目开发背景【2】设计实现的功能【3】设计意义【4】国内外研究现状【6】摘要1.2 设计思路1.3 系统功能总结1.4 开发工具的选择【1】VSCODE【2】python【3】ptqt【4】HyperLPR31.5 参考文献二、安装Python环境1.1 环境介绍**1.2 Python版本介…...