当前位置: 首页 > news >正文

「Mac畅玩AIGC与多模态01」架构篇01 - 展示层到硬件层的架构总览

一、概述

AIGC(AI Generated Content)系统由多个结构层级组成,自上而下涵盖交互界面、API 通信、模型推理、计算框架、底层驱动与硬件支持。本篇梳理 AIGC 应用的六层体系结构,明确各组件在系统中的职责与上下游关系,为后续部署与开发提供整体视角。

二、AIGC 系统六层结构

1. 展示层(交互层)

提供用户与模型交互的可视化界面,支持内容生成、问答对话与插件调用:

  • Open WebUI:本地可部署的统一聊天界面,支持对接 vLLM 或 Ollama 模型,兼容 OpenAI 格式。
  • Dify AIGC 平台:具备模型调用、工作流编排、知识库问答、插件扩展等功能。
  • Masked Base(扣子):国产无代码智能体平台,适用于图形化构建复杂逻辑与流程交互。

2. API 接入层

实现前后端或多端之间的数据通信,统一模型调用接口协议:

  • URL 接入(REST / WebSocket):采用标准化接口协议,适配前端页面、插件系统、自动化工具等多种访问方式。

3. 模型服务层

承载主力推理模型,负责处理输入、生成输出并返回:

  • vLLM:高吞吐大语言模型推理引擎,兼容 OpenAI API 接口,适合多轮问答场景。
  • Ollama:轻量本地推理平台,支持 llama、mistral、deepseek 等模型快速部署。
  • MindIE:融合规则引擎与知识图谱的智能推理系统,支持增强问答、多源融合等复杂任务。

4. 计算框架层

支撑模型执行的基础平台,负责张量计算与资源调度:

  • PyTorch:主流深度学习框架,支持研究开发与推理部署。
  • TensorFlow:工业级部署方案,适用于大规模模型上线与分布式执行。
  • CANN:华为昇腾平台的异构计算框架,支持 NPU 高效推理。

5. 驱动层

提供计算框架与物理硬件之间的接口,实现设备控制与指令转译:

  • GPU 驱动(如 CUDA):为 PyTorch、TensorFlow 等框架提供加速计算支持。
  • TPU 驱动:配合 Google 云 TPU 使用,适用于大规模训练与推理。
  • NPU 驱动(如 Ascend Driver):支撑华为昇腾芯片的异构指令调度。

6. 硬件层

提供实际算力支撑,决定系统的并发性能与响应速度:

  • NVIDIA GPU(英伟达图形处理单元):主流 AI 训练与推理平台。
  • Google TPU(谷歌张量处理单元):优化大模型任务的定制芯片。
  • 华为 Ascend NPU(昇腾神经网络处理器):面向边缘计算与企业部署场景。

三、结构示意图

在这里插入图片描述

四、数据流与交互路径简述

  • 用户通过 Open WebUI、Dify 或扣子界面提出请求
  • API 接入层解析请求并转发至后端模型服务
  • 模型服务(如 vLLM、Ollama)完成推理并生成结果
  • 结果返回前端界面展示,或进入后续插件流程(如图文生成、自动回复等)

五、总结与展望

本篇从系统架构视角,概括了 AIGC 应用的六大核心层级,涵盖从交互到硬件的全流程组件。这一分层结构为后续的实际部署、模型接入、插件调用与性能优化等任务提供了统一参考框架。接下来将在后续章节中逐步展开 vLLM 部署、Open WebUI 使用、Dify 场景实践等内容,逐层落地。

相关文章:

「Mac畅玩AIGC与多模态01」架构篇01 - 展示层到硬件层的架构总览

一、概述 AIGC(AI Generated Content)系统由多个结构层级组成,自上而下涵盖交互界面、API 通信、模型推理、计算框架、底层驱动与硬件支持。本篇梳理 AIGC 应用的六层体系结构,明确各组件在系统中的职责与上下游关系,…...

如何有效防止 SQL 注入攻击?

🔒 如何有效防止 SQL 注入攻击? SQL 注入(SQL Injection)是黑客通过构造恶意输入,篡改 SQL 查询语句的攻击方式。以下是 7 大防御策略,涵盖开发、测试和运维全流程。 ✅ 1. 使用参数化查询(Pre…...

路由交换网络专题 | 第九章 | NAT地址转换 | NAT回流

拓扑图 (1)配置实现内网用户可以通过 NAT 转换地址访问外网。 // 配置一条静态路由通往PC2 [AR1]ip route-static 0.0.0.0 0 60.1.1.10 // 配置ACL匹配网段 [AR1]acl 2000 [AR1-acl-basic-2000]rule permit source 192.168.1.10 0.0.0.0 // 设置地址池(不…...

DFPatternFunctor遍历计算图

文件:include/tvm/relay/dataflow_pattern_functor.h 功能:定义 DFPatternFunctor 基类,为 DFPattern 提供访问者模式(Visitor Pattern)的实现框架,支持对不同类型的模式节点进行差异化处理。 继承关系: template &…...

Spring Boot中@RequestParam、@RequestBody、@PathVariable的区别与使用

Spring Boot中RequestParam、RequestBody、PathVariable的区别与使用 前言 在当今的Web开发领域,Spring Boot凭借其简洁、高效和强大的功能,成为了Java开发者构建Web应用的首选框架。在开发过程中,处理来自客户端的请求参数是一项常见且关键…...

大模型 SFT 中的关键技术总结学习

文章目录 微调策略LoRA 微调核心思想具体实现过程超参数与技巧实现步骤​ QLoRA 相关技术1. 核心原理2. 技术优势​3. 实现流程​4. 应用场景​ P-tuning核心思想关键技术点训练流程优点应用场景 P-tuning v2Prefix Tuning一、关键概念前缀(Prefix)虚拟标…...

AI如何重塑DDoS防护行业?六大变革与未来展望

一、AI驱动的攻击与防御:攻防博弈的全面升级 AI技术的引入使DDoS攻防进入“智能对抗”时代,攻击者与防御方均借助AI提升效率,形成新的技术平衡。 1. 攻击端:AI赋能攻击的智能进化 动态流量生成:攻击者利用生成对抗网…...

电池的寿命

思路: 首先,我们观察发现:由于每枚电池的使用时间不同,而我们又要减少浪费才能使所有电池加起来用得最久,不难发现:当n2时,输出较小值。 第一步:将电池分为两组,使两组…...

Android完整开发环境搭建/Studio安装/NDK/本地Gradle下载配置/创建AVD/运行一个Android项目/常用插件

目录 安装Android Studio 修改sdk位置 配置 HTTP 代理 安装 NDK 设置快捷键 Gradle 说明 setting.gradle init.gradle build.gradle 下载 相关设置 创建项目 阿里云加速 清理缓存并同步 创建AVD 实用插件 ADB Idea Android Drawable Importer GsonFormat …...

【KWDB 创作者计划】_KWDB引领数据库技术革新的璀璨之星

【KWDB 创作者计划】_KWDB引领数据库技术革新的璀璨之星 🌟嗨,我是LucianaiB! 🌍 总有人间一两风,填我十万八千梦。 🚀 路漫漫其修远兮,吾将上下而求索。 在当今数字化浪潮汹涌澎湃的时代&…...

设计模式--桥接模式详解

桥接模式(bridge pattern) 桥接模式时将抽象部分与它的实现部分分离,使他们可以独立的变化。它是一种对象结构型模式,又称为柄体(Handle and Body)模式或者接口(interface)模式&…...

Python+Selenium+Pytest+Allure PO模式UI自动化框架

一、框架结构 allure-report:测试报告base:定位元素封装data:数据log:日志文件page:页面封装文件夹report:缓存报告testcases:测试用例层utils:工具类run.py:执行文件 二…...

【C语言操作符详解(一)】--进制转换,原反补码,移位操作符,位操作符,逗号表达式,下标访问及函数调用操作符

目录 一.操作符的分类 二.二进制和进制转换 2.1--2进制转10进制 ​编辑 2.1.1--10进制转2进制数字 2.2--2进制转8进制和16进制 2.2.1--2进制转8进制 2.2.2--2进制转16进制 三.原码,反码,补码 四.移位操作符 4.1--左移操作符 4.2--右移操作符…...

回顾|Apache Cloudberry™ (Incubating) Meetup·2025 杭州站

2025 年 4 月 19 日,由酷克数据与中启乘数联合举办的 Apache Cloudberry™ (Incubating) Meetup 杭州站在浙江省杭州市滨江区滨江会展中心成功举办。本次活动邀请了 Cloudberry PPMC 团队成员、活跃内核贡献者以及中兴 EBASE-A、阿里云 ADB-PG、网易、中启乘数等多…...

使用 Autofac 实现依赖注入

前言:接上一篇文章,有了微软官方的依赖注入组件Microsoft.Extensions.DependencyInjection, 那么今天介绍一个新的开源的依赖注入组件Autofac 一、二者的差异Autofac和微软官方的依赖注入组件(Microsoft.Extensions.DependencyIn…...

HTTP:十二.HTTPS

HTTPS 概述 超文本传输安全协议(英语:HyperText Transfer Protocol Secure,缩写:HTTPS;常称为HTTP over TLS、HTTP over SSL或HTTP Secure)是一种通过计算机网络进行安全通信的传输协议。HTTPS经由HTTP进行通信,利用TLS加密数据包。 HTTPS的主要目的是提供对网站服务器…...

《代码整洁之道》第12章 迭进 - 笔记

好的设计是如何形成的? 章节核心: 好的软件设计不是完全靠前期庞大的设计方案来完成的,而更多地是在持续的编码、测试和重构过程中,“涌现”或“演进”出来的。 设计不是一次性的前期活动 大白话: 作者认为&#x…...

数字巴别塔:全栈多模态开发框架如何用自然语言重构软件生产关系?

一、自然语言编程的范式革命 1. 从代码行数到语义密度 开发效率对比(某金融 SaaS 案例): 开发方式代码量(行)开发时间(天)维护成本($/年)传统 React5,2004512,000低代码…...

【C语言极简自学笔记】C 语言数组详解:一维数组与二维数组

在 C 语言中,数组是一种非常重要的数据结构,它可以将多个相同类型的元素组织在一起,以便于我们进行批量处理和操作。本文将详细介绍 C 语言中的一维数组和二维数组,包括它们的定义、初始化、元素访问以及内存存储等方面的内容。 …...

从零构建云原生秒杀系统——后端架构与实战

📝个人主页🌹:一ge科研小菜鸡-CSDN博客 🌹🌹期待您的关注 🌹🌹 一、引言:秒杀系统的挑战与机遇 在电商、票务、抢购等业务场景中,“秒杀”系统扮演着至关重要的角色。 秒杀活动通常会在极短时间内爆发出数十倍至数百倍的平时流量,这对后端系统的承载能力、响应…...

Linux Socket编程:从API到实战

Linux Socket编程完全指南:从API到实战 概述 Socket(套接字)是网络编程的基础,它允许不同主机或同一主机上的不同进程之间进行通信。在Linux系统中,Socket编程主要通过一系列系统调用来实现,这些API提供了…...

德州仪器(TI)—TDA4VM芯片详解(1)—产品特性

写在前面 本系列文章主要讲解德州仪器(TI)TDA4VM芯片的相关知识,希望能帮助更多的同学认识和了解德州仪器(TI)TDA4VM芯片。 若有相关问题,欢迎评论沟通,共同进步。(*^▽^*) 错过其他章节的同学…...

增强版wps-plugin-deepseek开源插件是DeepSeek 支持的 WPS 插件,在您的办公工作流程中提供智能文档自动化和 AI 驱动的生产力增强

一、软件介绍 文末提供程序和源码下载学习 增强版wps-plugin-deepseek开源插件专为WPS Office插件开发打造的Vue模板,搭配Vite构建工具,提供丰富的WPS API实操示例。虽然官方提供了TypeScript扩展包,但支持程度有限,因此本项目选…...

在 Cursor 中 配置 GitHub MCP Server

文章目录 1、简单回顾 sequentialthinking 的安装2、提出问题:如何在 cursor 配置 github mcp 呢3、结果如下How to Configure GitHub MCP in CursorPrerequisitesStep 1: Update Cursor (if needed)Step 2: Generate a GitHub Personal Access TokenStep 3: Open Cursor MCP S…...

uniapp-商城-40-shop 购物车 选好了 进行订单确认4 配送方式3 地址编辑

前面说了配送 和地址页面 当地址页面为空或需要添加地址时&#xff0c;需要添加地址。 我的地址页面有个按钮 就是添加地址 点击 添加地址 按钮 后&#xff0c;就会跳转到地址添加的页面 1、添加地址页面 2、添加地址文件夹以及文件的创建 3、添加地址的代码 <template…...

初步自定义layui的table(laravel 12)

layui的table是非常好的表格&#xff0c;有美观的样式&#xff0c;对接起来也很便捷。使用后端翻页传过来的数据&#xff0c;本地测试是好的&#xff0c;部署到服务器时&#xff0c;翻页不起作用。故而暂时采用一次性读取全部数据&#xff0c;发送给table&#xff0c;界面如下所…...

手写SpringMVC(基本框架)

服务器启动阶段处理 分析服务器启动阶段都都需要初始化什么&#xff1f; 1.初始化Spring容器 组件扫描包下的类纳入IOC容器管理创建视图解析器对象创建所有的拦截器对象扫描这和包下的所有类org.myspringmvc.web.servlet.mvc.method.annotation&#xff0c;全部实例化&#…...

JS-OCR-demo加载本地文件

背景&#xff1a; 在了解 Tesseract 的识别效果的时候&#xff0c;有个demo项目很好用。有个小毛病&#xff0c;就是没事都要从摄像头抓取图片&#xff0c;然后进行识别。如果可以从本地读取图&#xff0c;就更方便了。 实现&#xff1a; 下载项目代码&#xff1a;https://gi…...

MySQL 表的约束(一)

文章目录 表的约束空属性默认值列描述zerofill主键总结 表的约束 1. 为什么要有表的约束&#xff1f; 因为要保证数据的完整性和可约束性&#xff0c;合法性 空属性 两个值&#xff1a;null&#xff08;默认的&#xff09;和not null(不为空)数据库默认字段基本都是字段为空…...

论文导读 - 基于大规模测量与多任务深度学习的电子鼻系统实现目标识别、浓度预测与状态判断

基于大规模测量与多任务深度学习的电子鼻系统实现目标识别、浓度预测与状态判断 原论文地址&#xff1a;https://www.sciencedirect.com/science/article/abs/pii/S0925400521014830 引用此论文&#xff08;GB/T 7714-2015&#xff09;&#xff1a; WANG T, ZHANG H, WU Y, …...

力扣hot100_子串_python版本

一、560. 和为 K 的子数组 思路&#xff1a;这就是一道典型的前缀和的题代码: class Solution:def subarraySum(self, nums: List[int], k: int) -> int:presum [0] * (len(nums) 1)for i, x in enumerate(nums):presum[i 1] presum[i] x # 前缀和序列需要n1个ans 0…...

cached-property - 类属性缓存装饰器

本文翻译整理自&#xff1a;https://github.com/pydanny/cached-property 文章目录 一、关于 cached-property相关链接资源关键功能特性 二、安装三、使用指南1、基础用法2、手动清除缓存3、线程安全版本4、异步支持5、缓存超时&#xff08;TTL&#xff09; 四、致谢 一、关于…...

「Mac畅玩AIGC与多模态03」部署篇02 - 在 Mac 上部署 Dify

一、概述 本篇介绍如何在 macOS 环境下本地部署 Dify 平台,作为多模型协同与工作流集成的可视化应用服务。Dify 提供了模型调用、对话管理、知识库问答、插件服务等功能,可与 Ollama、OpenAI、DeepSeek 等推理后端集成,适用于本地智能体应用的快速搭建与扩展。 二、部署流…...

扩散模型和马尔科夫链

1. 扩散模型的基本原理 扩散模型的灵感来源于热力学扩散&#xff08;如一滴墨水在水中逐渐扩散的过程&#xff09;&#xff0c;其核心分为两个阶段&#xff1a; 前向过程&#xff08;Forward Process&#xff09;&#xff1a;逐步向数据添加噪声&#xff0c;直到数据完全变为随…...

Dify框架面试内容整理-Dify如何处理知识库的集成?

Dify 在知识库集成方面采用了“检索增强生成(RAG)”的技术架构,核心实现思路如下: 一、知识库集成的整体流程 Dify处理知识库集成通常包括以下关键步骤: 文档上传↓...

第35课 常用快捷操作——用“鼠标左键”拖动图元

概述 拖动某个图元&#xff0c;是设计过程中常需要用到的操作&#xff0c;我们可以在原理图中拖动某个元器件符号&#xff0c;也可以在PCB图中拖动某个焊盘。 和常用的软件类似&#xff0c;用按住鼠标左键的方式来完成拖动操作。 用鼠标左键拖动图元 在想要拖动的图元上&…...

复盘笔记1

以下是一份专业股市投资操盘手的复盘清单&#xff0c;涵盖市场分析、交易策略、风险管理等核心环节&#xff0c;帮助系统化梳理每日交易并优化次日决策&#xff1a; --- ### **一、市场整体复盘** 1. **指数与成交量分析** - 主要指数表现&#xff08;上证、深证、创业板、科…...

海思dump图原理

在海思中是用指令进行对应的dump。 例如./vi_chn_dump 0 0 1 1 第一个指令代表是dump哪里的数据。 第一个0代表是vi_pipe。 第二个0代表vi_chn。 第一个1代表需要dump帧的数量。 第二个dump代表dump帧的位置&#xff0c;如果是0表示dump的是在所有ISP模块后面的数据&#xff0…...

C++:STL——list

一简介 底层是一个带头双向循环列表 二、成员函数 &#xff08;1&#xff09;构造函数 三、迭代器 四、修饰函数 &#xff08;1&#xff09;insert 插入和删除不再使用下标&#xff0c;而是使用迭代器指针作为要插入位置的形参&#xff0c;这是因为&#xff1a;vector是连续的…...

在Azure Databricks中实现缓慢变化维度(SCD)的三种类型

在Azure Databricks中使用PySpark实现缓慢变化维度&#xff08;SCD&#xff09;的三种核心类型&#xff0c;需结合Spark SQL和DataFrame API的特性&#xff0c;并利用Delta Lake的事务支持。以下是具体设计与实现步骤&#xff0c;以及测试用例&#xff1a; 通过以下步骤&#…...

Segment Anything in Images and Videos

目录 摘要 Abstract SAM2 模型框架 图像编码器 记忆机制 提示编码器和掩码解码器 实验 代码 总结 摘要 SAM2是基于Meta公司推出的Segment Anything Model升级而来的先进分割模型。它在SAM的基础上&#xff0c;通过引入记忆注意力模块和优化图像编码器等改进&#xf…...

C++之异常

目录 一、异常的概念及使用 1.1、异常的概念 1.2、异常的抛出和捕获 1.3、栈展开 1.4、查找匹配的处理代码 1.5、异常重新抛出 1.6、异常安全问题 1.7、异常规范 1.8、C异常的优缺点 二、标准库的异常 一、异常的概念及使用 1.1、异常的概念 异常处理机制允许程序中…...

服务器不能复制粘贴文件的处理方式

1.打开远程的服务器,在服务器的任务栏随便一块空白处右击鼠标,选择“启动任务管理器”。 2.在打开的任务管理器中,我们找到“rdpclip.exe”这个进程,如果没有找到那么如图所示 任务管理器–文件–运行新任务&#xff0c;然后在弹出的对话框内输入rdpclip.exe 如下图&#xff1…...

Golang | 搜索表达式

// (( A | B | C ) & D ) | E & (( F | G ) & H )import "strings"// 实例化一个搜索表达式 func NewTermQuery(field, keyword string) *TermQuery {return &TermQuery{Keyword: &Keyword{Field: field, Word: keyword},} }func (tq *TermQuery…...

【速写】conda安装(linux)

序言 昨天叶凯浩空降&#xff08;全马241&#xff09;&#xff0c;降维打击&#xff0c;10分24秒断层夺冠。 夏潇阳10分53秒绝杀小崔10分54秒第2&#xff0c;小崔第3&#xff0c;均配都在3’30"以内&#xff0c;即便我是去年巅峰期也很难跑出这种水平。我就知道他去年大…...

linux两个特殊的宏 _RET_IP_ 和_THIS_IP_ 实现

本文探讨了Linux环境下两个特殊的宏,_RET_IP_和_THIS_IP_,它们分别用于获取当前函数的返回地址和当前指令指针的地址。 1、宏定义 我们先看它们的宏定义 include./linux/kernel.h#define _RET_IP_ (unsigned long)__builtin_return_address(0)#define _THIS_IP_ ({ __labe…...

开源|上海AILab:自动驾驶仿真平台LimSim Series,兼容端到端/知识驱动/模块化技术路线

导读 随着自动驾驶技术快速发展&#xff0c;有效的仿真环境成为验证与增强这些系统的关键。来自上海人工智能实验室的研究团队推出了LimSim Series——一个革命性的自动驾驶仿真平台&#xff0c;它巧妙解决了行业面临的三大挑战&#xff1a;仿真精度与持续时间的平衡、功能性与…...

全栈黑暗物质:可观测性之外的非确定性调试

一、量子计算的测不准Bug 1. 经典 vs. 量子系统的错误模式 量子程序崩溃的观测影响&#xff1a; 调试方法崩溃复现率观测干扰度日志打印12%35%断点调试5%78%无侵入跟踪27%9%量子态层析成像63%2% 二、量子调试工具箱 1. 非破坏性观测协议 # 量子程序的无干扰快照 from qiski…...

光耦、继电器

一、光耦 1.什么是光耦&#xff1f; ①图一:Ic受控于Ib&#xff0c;间接受控于Ia ②如果Va和Vb是隔离的两个电压系统该咋控制&#xff1f;可以利用光耦来控制&#xff0c;让两边建立关系 2.光电耦合器的基本原理 ①是以光为媒介来传输电信号的器件&#xff0c;通常把发光器…...

使用Three.js搭建自己的3Dweb模型(从0到1无废话版本)

教学视频参考&#xff1a;B站——Three.js教学 教学链接&#xff1a;Three.js中文网 老陈打码 | 麒跃科技 一.什么是Three.js&#xff1f; Three.js​ 是一个基于 JavaScript 的 ​3D 图形库&#xff0c;用于在网页浏览器中创建和渲染交互式 3D 内容。它基于 WebGL&#xff0…...