当前位置：首页 > news >正文

从语音识别到图像识别：AI如何“看”和“听”

news 来源：原创 2025/8/1 15:29:10

引言

随着人工智能技术的不断进步，AI的“听”和“看”能力正变得越来越强大。从语音识别到图像识别，AI不仅能够通过声音与我们互动，还能通过视觉理解和分析周围的世界。这些技术不仅改变了我们与机器的交互方式，也在各行各业中带来了深远的影响。

语音识别和图像识别的成功，标志着AI技术在理解和处理感知信息方面迈出了重要步伐。无论是智能助手如Siri和Alexa，还是自动驾驶汽车，AI都在通过“听”和“看”来实现更加智能的行为与决策。这种发展不仅令人兴奋，也促使我们思考：AI如何通过这些感知能力变得更加智慧，并在未来为我们的生活带来更多可能性？

本文将带您探索AI如何从“听”到“看”，实现从语音到图像的识别，并探讨这些技术背后的原理、应用与挑战。

一、语音识别：让机器听懂语言

语音识别是人工智能技术的一个重要分支，它使得机器能够理解和处理人类的语言。这一过程涉及将语音信号转换为文字或指令，从而实现与计算机或其他设备的互动。语音识别不仅改变了我们与技术的交互方式，还推动了多个行业的创新与进步。

1、语音识别的基本原理

语音识别的工作原理可以分为几个关键步骤：

音频信号的捕捉与预处理

语音识别的第一步是将人类发出的声音转换为数字信号。这通常通过麦克风采集音频，然后进行去噪和信号增强处理，以便提取出清晰的语音信息。

特征提取

音频信号经过处理后，系统会提取语音的特征，如音素（构成语音的最小单位）、频率等。这些特征能够帮助计算机区分不同的语音元素。

模型训练与匹配

语音识别系统通过机器学习算法训练出一个模型，将语音特征与预定义的语言模型匹配。传统方法通常使用隐马尔可夫模型（HMM），而现代技术则广泛采用深度神经网络（DNN）来提高识别精度。

语言解码与输出

最终，系统会将识别到的语音信号转换为相应的文字或指令，并反馈给用户。

2、技术进展

过去的语音识别技术主要依赖于规则和模板匹配，准确性受限，尤其在噪音环境或口音较重的情况下，识别效果较差。随着深度学习和神经网络技术的发展，现代语音识别系统已经能够通过大量数据进行训练，实现更高精度的语音转文字。

近年来，深度神经网络（DNN）和卷积神经网络（CNN）的应用，使得语音识别的准确率大幅提升。通过深度学习，系统能够从海量数据中提取更加丰富的语音特征，进而提高在复杂环境中的表现，如远程语音识别、多说话人语音分离等。

3、应用场景

语音识别技术已被广泛应用于多个领域：

虚拟助手：如苹果的Siri、亚马逊的Alexa和谷歌助手，语音识别使得这些智能助手能够理解用户的语音命令并做出响应。用户可以通过语音来控制设备、查询信息或设置提醒。

自动语音转录：语音识别在新闻采访、法庭记录、会议纪要等场景中实现了自动化转录，极大提高了工作效率。

智能客服：越来越多的企业采用语音识别技术来优化客户服务，自动处理客户的语音请求，解放了人工客服，提升了响应速度和用户满意度。

语音翻译：语音识别与机器翻译结合，能够实现实时的跨语言沟通。像Google Translate这样的应用，能够直接识别并翻译语音内容，推动了全球交流的便捷性。

4、挑战与展望

尽管语音识别技术取得了显著进展，但仍面临一些挑战：

噪声干扰：在嘈杂环境中，语音识别的准确度可能大幅下降。如何处理背景噪声，提取清晰语音信号，是一个重要难题。

口音与方言差异：全球存在不同的语言和方言，语音识别系统往往在某些口音较重的用户面前表现不佳。未来，AI系统需要不断学习和适应多样化的语音特征。

情感与语气识别：人类的语音不仅包含文字信息，还有丰富的情感和语气成分。未来的语音识别系统需要更好地理解这些非语言的信息，以实现更加自然和富有表现力的交互。

随着技术的不断进步，语音识别系统的准确性和应用范围将不断扩大，未来可能会有更多创新应用出现，进一步推动人机互动的智能化进程。

二、图像识别：让机器看懂世界

图像识别是人工智能领域的另一个重要突破，它使得机器能够“看”和“理解”视觉信息。通过图像识别技术，计算机可以识别和分析图片或视频中的物体、场景、文字等元素，进而做出智能判断。与语音识别一样，图像识别技术在改善人机交互、提升生产力和推动创新方面发挥了重要作用。

1、图像识别的基本原理

图像识别的基本过程主要分为以下几个步骤：

图像采集与预处理

通过相机或其他设备获取图像后，系统首先对图像进行处理，包括去噪、亮度调整、色彩校正等，以便更好地进行后续分析。

特征提取

图像的特征提取是图像识别的关键一步。传统方法依赖于人工设计的特征（如边缘、角点、纹理等），而现代深度学习方法则利用卷积神经网络（CNN）自动从图像中学习复杂的特征。

模型训练与分类

图像识别的核心是通过大量已标注的图像数据进行训练，构建一个能够自动识别新图像的模型。深度神经网络特别是卷积神经网络（CNN），在这一过程中表现出了强大的学习能力。

结果输出与决策

一旦图像经过处理和分析，系统就会输出识别结果，如图像中包含的物体、场景类别或识别出的文字信息等，通常以标签或分类的方式展示。

2、技术进展

早期的图像识别技术基于简单的图像处理和特征匹配方法，但其识别准确率和应用范围有限。随着深度学习，尤其是卷积神经网络（CNN）的引入，图像识别技术发生了革命性变化。CNN能够自动提取图像中的多层次特征，大大提高了图像分类、物体识别和人脸识别等任务的准确性。

近年来，基于深度学习的图像识别系统已经能够处理更加复杂的任务，例如：图像中的细粒度分类（识别图像中的多个物体）、语义分割（区分图像中不同区域的内容）、以及实时视频分析等。

3、应用场景

图像识别技术的应用已经渗透到各行各业，改变了许多传统业务流程，以下是几个典型的应用场景：

自动驾驶

自动驾驶汽车依靠图像识别技术，能够实时识别路况、交通标志、行人、障碍物等，确保车辆安全行驶。视觉传感器与其他传感器协同工作，使汽车能够“看”到周围环境，做出反应。

安防监控

图像识别被广泛应用于安防监控领域，用于人脸识别、行为分析、入侵检测等。通过高效的图像识别，安防系统能够实时识别异常行为并作出响应，大大提高了监控系统的智能化水平。

医疗影像分析

在医疗领域，图像识别帮助医生分析医学影像（如X光片、CT扫描、MRI等），识别出潜在的病变或异常。例如，AI可以协助检测早期癌症，极大地提高了诊断的准确性与效率。

电子商务与图像搜索

图像识别也在电子商务中得到了应用，用户可以通过拍照识别商品，进行自动搜索。例如，亚马逊的视觉搜索工具使得用户能够通过图片找到相似商品，提升了购物体验。

人脸识别与身份验证

人脸识别已经成为智能手机、支付系统和公共安全领域的重要技术。通过比对人脸图像，系统能够进行身份认证，用于解锁设备、支付验证和安防监控等。

4、挑战与展望

尽管图像识别技术取得了巨大进展，但仍然面临一些挑战：

复杂背景与遮挡

在一些复杂的背景或物体被遮挡的情况下，图像识别系统可能会难以准确识别目标。未来，如何提升系统在复杂环境中的鲁棒性，仍然是一个研究热点。

低质量图像

在低分辨率或模糊图像的情况下，系统的识别准确率会下降。如何在图像质量不高的情况下仍然保持高效的识别，是技术发展的另一个难点。

多样性与跨领域应用

图像识别在不同领域和不同场景中的应用表现差异较大。如何将一个领域训练好的模型迁移到其他领域，尤其是需要处理跨域图像时，依然是当前技术的挑战。

随着AI技术的不断进步，图像识别将在更广泛的场景中发挥作用。未来，图像识别与其他技术（如自然语言处理、情感分析等）的结合，将进一步推动智能化社会的发展，给我们的生活带来更多可能性。

三、语音与图像识别的协同发展

随着人工智能技术的不断进步，语音识别与图像识别已经不再是孤立发展的领域。两者的协同作用不仅增强了AI系统的智能化水平，还为各类应用带来了更加丰富的交互体验。通过将语音与图像识别结合，AI能够实现多模态感知，从而更好地理解和适应复杂的环境。

1、多模态AI系统

多模态AI系统指的是能够同时处理并融合来自不同感知源（如语音、视觉、触觉等）的信息。这种系统能够实现跨领域的理解和决策，极大地提升了人工智能的应用能力。

语音与图像的结合

在传统的AI系统中，语音识别和图像识别分别处理各自的输入信息，而多模态AI则通过同时融合这两种感知信号，能够更加全面地理解环境。例如，当用户用语音命令与智能设备互动时，设备不仅可以识别语言，还能通过图像识别确认用户的动作或面部表情，从而提供更精准的反馈。

提高系统的自然交互能力

传统的单一感知模式（如仅依赖语音或图像）可能无法应对多变的现实情况，而多模态系统通过集成不同的感知能力，使AI能够像人类一样从多个维度理解世界。例如，在视频通话中，AI可以同时分析语音内容和表情、肢体语言，提供更加生动和自然的互动体验。

2、跨领域应用

智能家居

在智能家居场景中，语音识别与图像识别的结合提供了更加直观和智能的控制方式。用户不仅可以通过语音命令控制家电，还能通过图像识别技术使设备识别用户的动作或姿势。例如，当用户进入房间时，智能灯光系统可以通过图像识别自动识别房间内的人员，并根据语音指令调节光线强度或播放音乐。

自动驾驶

自动驾驶系统依赖于图像识别来处理来自车载摄像头的实时视觉信息，同时也需要语音识别来接收驾驶员的指令。在自动驾驶过程中，车辆不仅能够识别周围的行人、交通标志、其他车辆等，还能理解驾驶员的语音命令，比如调整导航或播放音乐。语音和图像识别的协同工作提高了系统的反应速度和准确性，使得自动驾驶更加安全和智能。

智能客服与远程支持

在智能客服和远程技术支持领域，语音识别与图像识别的结合可以极大提高服务质量。客户可以通过语音提问或描述问题，同时系统也可以通过图像识别分析客户提供的图片或视频，以帮助解决问题。例如，顾客在使用智能家电时，如果遇到故障问题，可以通过拍照并语音描述问题，AI系统就能同时分析图片中的问题并理解语音中的具体需求，从而提供精准的解决方案。

安防与监控

语音与图像识别在安防领域的结合尤为重要。监控系统通过图像识别技术检测到可疑人员或异常活动，同时也能通过语音识别捕捉到现场的声音信号（如警报声、争吵声等）。系统能够同时分析这两种信息，及时作出响应并通过语音指令通知安保人员或报警。

3、未来趋势

更精准的情感分析

通过将语音的情感成分与图像中的面部表情、肢体语言结合，AI能够更准确地识别人的情绪和意图。例如，虚拟客服可以根据用户的语气、语速以及面部表情判断客户的满意度，从而调整服务策略，提供个性化的回应。

增强现实与虚拟现实（AR/VR）

在AR/VR应用中，语音与图像识别的结合将使得用户与虚拟世界的交互更加自然和直观。通过语音命令控制虚拟场景中的对象，同时通过图像识别技术识别用户的动作和位置，AI能够实时反馈并适应用户的行为，提升沉浸式体验。

智能教育与培训

在教育领域，语音与图像识别结合能够提供更加互动和个性化的学习体验。例如，智能教育平台通过图像识别分析学生的书写或面部表情，同时结合语音识别来理解学生的提问，进而提供实时反馈和辅导。

结语

语音与图像识别的协同发展推动了AI技术的智能化与多样化，使得机器能够以更加全面和高效的方式理解和适应现实世界。未来，随着深度学习算法和硬件设备的不断进步，语音与图像识别的结合将进一步拓宽AI的应用场景，为人们的生活和工作带来更多便捷与创新。

四、技术前景与社会影响

随着语音与图像识别技术的不断进步，人工智能将在多个领域取得突破性进展。这些技术不仅带来更高效的业务流程和更加智能化的生活方式，还将对社会的各个方面产生深远的影响。本文将探讨语音与图像识别技术的未来前景，以及它们对社会的潜在影响。

1、技术前景

更高精度和更广泛的应用

随着深度学习、计算能力和大数据的不断发展，语音和图像识别的准确性和实时性将大幅提升。未来，AI将能够在更加复杂的环境中高效工作，例如在嘈杂环境中进行精准的语音识别，或者在低质量图像的情况下依然能够实现有效识别。

在医疗、教育、零售、金融等多个行业，语音和图像识别将得到更加广泛的应用。例如，医学影像识别将变得更加精确，帮助医生早期发现疾病；零售商将利用图像识别和语音识别为客户提供更加个性化的购物体验。

跨模态融合与更自然的用户体验

未来，语音与图像识别将不再是独立工作的模块，它们将通过深度融合，形成强大的跨模态AI系统。这种系统能够综合理解声音、视觉、甚至触觉等多维信息，为用户提供更加自然和直观的交互体验。

例如，在虚拟助手中，系统不仅能听懂用户的语音，还能通过摄像头观察用户的肢体语言或面部表情，从而更好地理解用户的需求并做出反应。这种技术的进步将使得AI变得更加“人性化”，能够更加灵活地与人类沟通。

智能硬件的普及

智能硬件的进步将推动语音与图像识别技术的广泛应用。从智能家居到智能穿戴设备，语音和图像识别将成为这些设备的核心功能。例如，智能眼镜能够通过图像识别显示信息，并通过语音识别进行控制；智能音响则能够识别语音命令并根据视觉信息做出调整。

随着硬件设备的普及，语音与图像识别将进一步融入日常生活，为用户提供便捷的服务和增强现实体验。

自学习与自适应能力的提升

未来的语音与图像识别系统将具备更强的自学习能力，能够根据用户的使用习惯、语言特征、环境变化等因素，自动调整识别精度和响应方式。这种系统能够通过不断学习和适应，提高与用户的交互质量和服务效率。

2、社会影响

改变工作方式与职业结构

AI的普及将推动工作场所的智能化，许多传统的人工工作将被自动化取代。例如，语音与图像识别技术可以自动处理客户服务、销售支持、数据录入等任务，从而提高工作效率和减少人为错误。

然而，随着自动化程度的提高，某些职业可能面临被取代的风险。这将要求社会加速职业转型与技能升级，特别是在数据分析、AI开发等新兴领域的就业机会。

隐私与数据安全的挑战

语音与图像识别技术的广泛应用将带来隐私和数据安全的重大挑战。尤其是在面部识别和语音监控等领域，个人信息的采集和存储可能引发隐私泄露的风险。如何保护用户隐私、确保数据的安全性和合法性，将成为亟待解决的问题。

此外，政府和企业需要制定相关法律法规，规范语音和图像识别技术的使用，避免技术滥用和侵犯个人权益。

提高生活质量与便捷性

语音与图像识别的应用将显著提高人们的生活质量和工作效率。老年人和残疾人士将能够借助语音和图像识别技术更好地进行日常生活，比如通过语音指令控制智能家居设备或通过图像识别辅助导航。

在交通、医疗、教育等领域，AI将能够提供更加智能化和个性化的服务，使人们的日常生活更加便捷和高效。

促进教育公平与个性化学习

在教育领域，语音与图像识别的结合将为个性化学习提供有力支持。AI可以分析学生的语言表达、情感波动、学习进度等多方面的数据，提供针对性的学习建议和辅助。通过智能教学平台，偏远地区的学生也可以享受到高质量的教育资源。

此外，AI还能够通过分析学生的面部表情、姿态等信息，及时发现学生的情绪变化，调整教学方式，优化学习效果。

伦理与道德问题

语音与图像识别技术的普及也带来了一些伦理与道德问题。例如，面部识别技术可能被滥用于监控和人群追踪，侵犯个人隐私；语音识别系统可能被用于监听个人对话，甚至侵犯言论自由。

在技术快速发展的同时，社会应加强对这些技术的伦理审视，确保其合规使用，避免对社会秩序和个人权益造成不良影响。

结语

语音与图像识别技术的快速发展正在推动社会的智能化进程。未来，这些技术将在多个领域发挥更大作用，带来更加便捷、高效的生活体验。然而，我们也需要警惕其带来的挑战，特别是在隐私保护、就业结构变化以及伦理道德方面的问题。只有在技术创新与社会规范相结合的基础上，AI才能真正造福全社会，推动人类文明的进步。

结论

语音与图像识别技术正以前所未有的速度发展，并逐渐成为人工智能领域的重要组成部分。通过让机器“听”和“看”，这两种技术不仅提升了人机交互的智能化水平，也为各行各业的变革提供了强大动力。从自动驾驶到智能家居，从医疗诊断到安防监控，语音与图像识别正在改变我们生活和工作的方式。

随着技术的不断进步，未来我们可以预见到更加精准、高效的识别能力，以及跨模态系统的广泛应用，这将进一步提升我们的生活质量并推动社会的智能化转型。然而，技术的进步也伴随着一些挑战，尤其是在隐私保护、数据安全、伦理问题以及就业结构变化方面。如何平衡创新与风险，确保技术为社会带来积极影响，成为我们必须面对的重要课题。

总体而言，语音与图像识别技术的未来前景广阔，将深刻影响我们的社会与经济结构。只有在技术、法规与伦理共同发展的框架下，人工智能才能真正实现其潜力，为社会创造更大的价值，改善人类的生活方式。

从语音识别到图像识别：AI如何“看”和“听”

引言随着人工智能技术的不断进步，AI的“听”和“看”能力正变得越来越强大。从语音识别到图像识别，AI不仅能够通过声音与我们互动，还能通过视觉理解和分析周围的世界。这些技术不仅改变了我们与机器的交互方式，也在各行各业中带…...

编程日记 2025/8/1 15:29:10

UML-对象图（Object Diagram）

定义在UML（统一建模语言）中，对象图用于描述在某一时刻，一组对象以及它们之间关系的图形。它是系统详细状态在某一时刻的快照，常用于表示复杂的类图的一个实例。关联、依赖和继承是对象图中常见的三种关系，下面将对这三种关系进行详细说明，并阐述它们之间的区别。 Pla…...

编程日记 2025/8/1 8:10:47

Pytorch - YOLOv11自定义资料训练

►前言本篇将讲解目前最新推出的YOLOv11搭配Roboflow进行自定义资料标注训练流程，透过Colab上进行实作说明，使大家能够容易的了解YOLOv11的使用。 ►YOLO框架下载与导入 ►Roboflow的资料收集与标注进行自定义资料集建置与上传透过Roboflow工具进行…...

编程日记 2025/7/30 3:10:13

大模型GUI系列论文阅读 DAY2续2：《使用指令微调基础模型的多模态网页导航》

摘要自主网页导航的进展一直受到以下因素的阻碍： 依赖于数十亿次的探索性交互（通常采用在线强化学习），依赖于特定领域的模型设计，难以利用丰富的跨领域数据进行泛化。在本研究中，我们探讨了基于视觉-语…...

编程日记 2025/7/30 20:38:38

Docker 搭建mysql 连接超时问题，xxl-job启动mysql连接报错，禁用dns

1.本地连接Navicat报错信息，猜测是navicat默认连接超时导致的，后面换成idea一个插件虽然慢但连接上了 2013 - Lost connection to MySQL server at reading initial communication packet 2.启动xxl-job会报错，网上有人mysql驱动与数据库不匹…...

编程日记 2025/7/30 23:47:15

SSM课设-学生管理系统

【课设者】SSM课设-学生管理系统技术栈: 后端: SpringSpringMVCMybatisMySQLJSP 前端: HtmlCssJavaScriptEasyUIAjax 功能: 学生端: 登陆学生信息管理个人信息管理老师端: 多了教师信息管理管理员端: 多了班级信息管理多了年级信息管理多了系统用户管理...

编程日记 2025/7/31 20:22:24

JavaScript笔记APIs篇03——DOM节点Bom操作本地存储正则表达式

黑马程序员视频地址：黑马程序员前端JavaScript入门到精通全套视频教程https://www.bilibili.com/video/BV1Y84y1L7Nn?vd_source0a2d366696f87e241adc64419bf12cab&spm_id_from333.788.videopod.episodes&p78https://www.bilibili.com/video/BV1Y84y1L7Nn?…...

编程日记 2025/7/29 19:15:45

JS 有哪些模块化规范

一、CommonJS 规范 1. 主要应用场景主要用于服务器端开发，尤其是 Node.js 环境。 2. 核心思想使用 require() 函数来引入模块，使用 module.exports 或 exports 对象来导出模块中的内容。 // math.js 模块const add (a, b) > a b;const subtr…...

编程日记 2025/7/27 15:52:39

摘录人工智能面试笔试题汇总

一、人工智能面试问答题汇总 1、什么是人工智能？ 人工智能（AI）是一种计算机科学，它增强了像人类一样工作和反应的智能机器。机器模拟人类智能行为的能力。人工智能通常用于各种应用，如决策、语音识别、感知、认知能力…...

编程日记 2025/7/31 12:22:41

【PCIe 总线及设备入门学习专栏 6.1 -- PCIe MCTP】

文章目录 1 什么是 MCTP？2 MCTP 消息在 PCIe 中的传输特点3 PCIe MCTP 的局限性(1) 出站（Outbound）MCTP 消息分解的限制(2) 入站（Inbound）MCTP 消息组装的限制4 MCTP 消息的实际使用流程发送端处理流程接收端处理流程5 实际使用场景例 1：管理命令传输例 2：监控数据报告例…...

编程日记 2025/8/1 14:33:28

RabbitMQ集群安装rabbitmq_delayed_message_exchange

1、单节点安装rabbitmq安装延迟队列安装延迟队列rabbitmq_delayed_message_exchange可以参考这个文章： rabbitmq安装延迟队列-CSDN博客 2、集群安装rabbitmq_delayed_message_exchange 在第二个节点 join_cluster 之后，start_app 就会报错了 (CaseC…...

编程日记 2025/7/29 22:57:45

doris 2.1 Queries Acceleration-Hints 学习笔记

1 Hint Classification 1.1 Leading Hint：Specifies the join order according to the order provided in the leading hint. 1.2 Ordered Hint：A specific type of leading hint that specifies the join order as the original text sequence. 1.3 Distribute Hint：Speci…...

编程日记 2025/7/30 16:02:35

【网络协议】【http】【https】TLS解决了HTTP存在的问题-加密通信+摘要，数字签名+CA证书

【网络协议】【http】【https】TLS解决了HTTP存在的问题-加密通信摘要数字签名CA证书 ps:TLS前期发送的密码套件里面主要就是约定：密钥交换算法，签名算法，对称加密算法，摘要算法 1加密通信一般选择非对称加密交换密钥对称加密…...

编程日记 2025/8/1 21:59:00

某讯一面，感觉问Redis的难度不是很大

前不久，有位朋友去某讯面试，他说被问到了很多关于 Redis 的问题，比如为什么用 Redis 作为 MySQL 的缓存？Redis 中大量 key 集中过期怎么办？如何保证缓存和数据库数据的一致性？我将它们整理出来，…...

编程日记 2025/7/29 14:57:26

【json_object】mysql中json_object函数过长，显示不全

问题：json只显示部分解决： SET GLOBAL group_concat_max_len 1000000; -- 设置为1MB，根据需要调整如果当前在navicat上修改，只有效本次连接和后续会话，重新连接还是会恢复默认值1024 在my.ini配置文件中新增或者修…...

编程日记 2025/8/1 21:55:46

【KOA框架】koa框架基础入门

koa是express的一层封装，语法比express更加简洁。所以有必要了解下koa的相关开发方法。代码实现 package.json {"name": "koapp","version": "1.0.0","main": "index.js","scripts": {&…...

编程日记 2025/7/29 7:33:53

kubernetes 集群 YAML 文件详解

Kubernetes 是一个开源的容器编排平台，用于自动化部署、扩展和管理容器化应用程序。在 Kubernetes 中，YAML 文件扮演着至关重要的角色，因为它们是用来定义资源对象（如 Pods、Deployments、Services 等）的配置文件。正确…...

编程日记 2025/7/25 14:00:16

【STM32G4xx的CAN驱动记录】

STM32G4xx的CAN驱动记录 CAN说明CAN的波特率计算数据测试总结本文主要记录了基于STM32G4xx的CAN接口解析某型号雷达数据遇到的问题及规避方法，CAN总线波特率500Kbps，采样点要求80%附近。注意CAN总线同步段的时间！！！ …...

编程日记 2025/8/1 9:51:24

VSCode下EIDE插件开发STM32

VSCode下STM32开发环境搭建本STM32教程使用vscode的EIDE插件的开发环境，完全免费，有管理代码文件的界面，不需要其它IDE。视频教程见本人的 VSCodeEIDE开发STM32 安装EIDE插件 Embedded IDE 嵌入式IDE 这个插件可以帮我们管理代码文件&am…...

编程日记 2025/7/27 15:18:37

HTML之拜年/跨年APP（改进版）

目录： 一：目录二：效果三：页面分析/开发逻辑 1.页面详细分析： 2.开发逻辑： 四：完整代码（不多废话） index.html部分 app.json部分二：效果三：页面…...

编程日记 2025/8/1 21:59:00

解决 WSL 2 中 Ubuntu 22.04 安装 Docker 后无法启动的问题

问题场景安装Docker后，执行sudo service docker start启动Docker，提示启动成功 rootDev:~# sudo service docker start * Starting Docker: docker [ OK ]执行su…...

编程日记 2025/8/1 20:43:17

Chrome 132 版本新特性

Chrome 132 版本新特性一、Chrome 132 版本浏览器更新 1. 在 iOS 上使用 Google Lens 搜索在 Chrome 132 版本中，开始在所有平台上推出这一功能。 1.1. 更新版本： Chrome 126 在 ChromeOS、Linux、Mac、Windows 上：在 1% 的稳定版用户…...

编程日记 2025/8/1 21:57:34

《贪心算法：原理剖析与典型例题精解》

必刷的贪心算法典型例题！ 算法竞赛（蓝桥杯）贪心算法1——数塔问题-CSDN博客算法竞赛（蓝桥杯）贪心算法2——需要安排几位师傅加工零件-CSDN博客算法（蓝桥杯）贪心算法3——二维数组排序与贪心算…...

编程日记 2025/8/1 21:55:47

CSS笔记基础篇02——浮动、标准流、定位、CSS精灵、字体图标

黑马程序员视频地址： 前端Web开发HTML5CSS3移动web视频教程https://www.bilibili.com/video/BV1kM4y127Li?vd_source0a2d366696f87e241adc64419bf12cab&spm_id_from333.788.videopod.episodes&p70https://www.bilibili.com/video/BV1kM4y127Li?vd_source…...

编程日记 2025/7/31 3:10:12

Golang Gin系列-6：Gin 高级路由及URL参数

在本章中，我们将深入研究使用Gin框架的高级路由和URL参数。我们将介绍如何创建和使用路由组、应用中间件、提取路径参数、处理查询字符串、处理静态文件以及使用HTML模板。路由分组为什么要使用路由组？ 使用路由组有助于保持代码结构整洁有序。当路由…...

编程日记 2025/7/28 8:20:46

重温STM32之环境安装

缩写 CMSIS：common microcontroller software interface standard 1，keil mdk安装链接 Keil Product Downloads 安装好后，开始安装平台软件支持包（keil 5后不在默认支持所有的平台软件开发包，需要自行下载&#…...

编程日记 2025/7/20 14:40:07

web应用引入cookie机制的用途和cookie技术主要包括的内容

web应用引入cookie机制，用于用户跟踪。 （1）HTTP响应报文中的Cookie头行：set-Cookie （2）用户浏览器在本地存储、维护和管理的Cookie文件 （3）HTTP请求报文中的Cookie头行：…...

编程日记 2025/7/30 10:08:17

Visual Studio Code + Stm32 （IAR）

记录一下， 以前看别人在 vsc 下配置 stm32 工程非常麻烦。最近，突然发现， iar 官方出了两个插件， iar build 、 iar C-Spy 安装之后，配置一下 iar 软件路径。然后，直接打开工程目录，编译…...

编程日记 2025/7/29 18:15:27

小程序获取微信运动步数

1、用户点击按钮，在小程序中触发getuserinfo方法，获取用户信息 <scroll-view class"scrollarea" scroll-y type"list"><view class"container"><button bind:tap"getLogin">获取</button&…...

编程日记 2025/7/31 19:47:14

嵌入式Linux驱动开发之platform

关键词：rk3399 嵌入式驱动 Linux platform 前言前面的嵌入式Linux驱动都是描述从特定的SOC与特定设备之间的直接两两通信。而Linux不是为单一某一SOC结构而设计的操作系统，它可以运行在X86、ARM等多种架构多种SOC平台上，如果驱动程序按照S…...

编程日记 2025/7/31 1:35:23

【蓝桥杯】43693.日期问题

题目描述小明正在整理一批历史文献。这些历史文献中出现了很多日期。小明知道这些日期都在 1960 年 1 月 1 日至 2059 年 12 月 31 日。令小明头疼的是，这些日期采用的格式非常不统一，有采用年/月/日的，有采用月/日/年的，还有采用…...

编程日记 2025/7/31 12:40:21

opengrok_windows_多工程的同步

多工程的目录工程代码下载和log配置工程代码下载在每个工程的src目录下，下载工程代码，以下载pulseaudio的代码为例。 git clone gitgithub.com:pulseaudio/pulseaudio.git log配置文件拷贝D:\opengrok\opengrok-…...

编程日记 2025/7/30 5:12:33

Redis的安装和使用--Windows系统

Redis下载地址： windows版本readis下载（GitHub）： https://github.com/tporadowski/redis/releases （推荐使用） https://github.com/MicrosoftArchive/redis/releases 官网下载（无Windows版本…...

编程日记 2025/8/1 5:48:42

【odbc】odbc连接kerberos认证的 hive和spark thriftserver

hive odbc驱动，以下两种都可以教程：使用 ODBC 和 PowerShell 查询 Apache HiveHive ODBC Connector 2.8.0 for Cloudera Enterprise spark thriftserver本质就是披着hiveserver的外壳的spark server 完成kerberos认证: （1）可以…...

编程日记 2025/8/1 18:05:39

亚博microros小车-原生ubuntu支持系列：1 键盘控制

背景：电脑配置不太行，我在ubuntu再运行vmware，里面运行亚博官方的虚拟机镜像ubuntu，系统很卡。基本上8G内存给打满了。还是想把亚博官方的代码迁移出来，之前售后就说除了官方镜像虚拟机，需要自己摸索迁移。…...

编程日记 2025/7/31 12:14:30

【Linux】利用‘shell脚本’快速查看服务的运行情况

一、脚本目的为了方便查看服务的运行情况，特此写了一个shell脚本，这样就很方便获取，查看如nginx、mysql等服务的运行状态、监听端口状态、防火墙、端口开放状态等。二、shell脚本源代码 #!/bin/bash SCRIPTPATH$(cd "$(dirname $0)…...

编程日记 2025/7/29 5:37:37

[2025分类时序异常检测指标R-AUC与VUS]

梳理了一下分类中常见的指标，这些指标与时序异常检测中新提出的A-RUC与VUS之间的关系真正例(True Positive,TP): 被正确识别为正样本的数量。真负例(True Negative,TN): 被正确识别为负样本的数量。假正例(False Positive ,FP): 被错误识为正样本数量假负例(Fals…...

编程日记 2025/7/31 7:39:01

设计模式之结构型模式

在软件开发的世界里，设计模式是前辈们智慧的结晶，它们为我们提供了通用的解决方案来应对各种常见的软件设计问题。今天，我们深入探讨设计模式中的结构型模式，并用 Java 语言来实现它们。什么是结构型模式结构型模式主要关注如…...

编程日记 2025/7/27 17:25:33

Spring Boot中的404错误：原因、影响及处理策略

Spring Boot中的404错误：原因、影响及处理策略在Web开发过程中，404错误是一个常见的HTTP状态码，表示“未找到”资源。在Spring Boot项目中，尽管它以其简化的配置和快速的开发速度著称，但开发者仍可能遇到404错误。本…...

编程日记 2025/7/28 4:23:27

网络协议如何确保数据的安全传输？

网络协议作为计算机网络通信的基石，其设计不仅旨在实现数据的有效传输，更在于确保数据在传输过程中的安全性。对于网络协议如何保障数据安全传输，是很多企业和网络IT部门的重点，本文将从多方面概述相关方法。加密与解密机制 1. …...

编程日记 2025/7/29 13:22:53

Python绘制数据地图-MovingPandas

MovingPandas 是一个用于时空数据分析的 Python 库，它扩展了 Pandas 和 GeoPandas，使得处理和分析带有时间戳的地理数据变得更加方便。虽然 MovingPandas 本身不直接提供数据可视化功能，但你可以结合其他库如 matplotlib、folium 或 plotly 来…...

编程日记 2025/7/28 6:02:32

鸿蒙子组件根据数据，刷新item Ui的规范

鸿蒙子组件列表中，有多个isSelect，父组件只用一个state类型的isSelect，就可以将它们关联起来，如下： isLike:item1.isPraise?!this.isLike:this.isLike, 子组件想要数据变化，UI随着更新，就得…...

编程日记 2025/7/31 1:40:53

使用 Flask 构建视频转 GIF 工具

使用 Flask 构建视频转 GIF 工具在前几日的文章当中，我介绍了如何使用 Python 脚本将视频转化为 GIF 动画，为了更好、更方便的进行操作，在这篇博客中，我将介绍使用 Flask 框架创建一个简单的 Web 应用程序，该应用程序…...

编程日记 2025/7/29 1:34:25

基于SpringBoot+Vue的智慧动物园管理系统的设计与实现

获取源码：基于SpringBootVue智慧动物园系统设计与实现: 后台和用户前台。后台包括首页、员工管理、考勤管理、部门管理、角色管理、审核管理、动物管理、演出管理、园区管理、园区设施维修、饲养管理、行为观察管理、疫苗管理、看护管理、个人中心、票务管理、收入管…...

编程日记 2025/8/1 21:06:48

“深入浅出”系列之数通篇：（5）TCP的三次握手和四次挥手

TCP（传输控制协议）的三次握手和四次挥手是TCP连接建立和释放的过程。一、TCP三次握手 TCP三次握手是为了建立可靠的连接，确保客户端和服务器之间的通信能力。具体过程如下： 第一次握手：客户端向服务器发送一个带有…...

编程日记 2025/7/30 21:51:58

【初阶数据结构】探索数据的多米诺链：单链表

文章目录 1.链表1.1 概念及结构1.2 分类 2.单链表接口实现2.1 单链表节点创建2.2 单链表打印2.3 单链表尾插2.4 单链表头插2.5 单链表尾删2.6 单链表头删2.7单链表查找2.8 单链表在pos位置插入x2.8.1 pos前2.8.2 pos后 2.9单链表在pos位置删除x2.9.1 pos前2.9.2 pos后 2.2.10 单…...

编程日记 2025/7/30 17:12:21