当前位置: 首页 > news >正文

1.4 大模型应用产品与技术架构

目录

一,产品架构

1.1 AI Embedded产品架构

1.2 AI Copilot产品架构

1.3 AI Agent产品架构

二,技术架构

2.1 纯Prompt

2.2 Agent + Function Calling

2.3 RAG (Retrieval-Augmented Generation 检索增强生成)

2.4 Fine-tuning(微调)


大模型应用的产品架构随着技术发展和场景需求不断演进,在演进的过程中人们提出了不同的应用产品架构和技术架构

一,产品架构

1.1 AI Embedded产品架构

在早期,深度学习初步成熟,但大模型技术还没有出现。

人们将AI能力深度集成到现有产品或流程中,作为后台功能增强用户体验。例如电商平台的个性化推荐(如淘宝猜你喜欢);手机相册的智能分类(如人脸识别分组)。

也就是AI作为模块化功能嵌入产品。

这种模式下,人类的干预还是占主导,而AI模型只是作为很小的一部分,嵌入到我们的产品当中,提高产品的服务和体验。

这种产品架构下,用户无需主动调用,AI自动在后台处理任务(如推荐算法、语音识别)。甚至用户可能意识不到AI的存在,只是能感受到功能优化。

1.2 AI Copilot产品架构

随着GPT-3等大模型突破,理解上下文能力得到跃升。 人们提出了AI Copilot架构,这也是目前的主流架构,其核心是多Agent工作流。

在这种架构下,AI作为用户实时助手,如代码编写、文档润色。甚至可以完成复杂任务,如提供建议、补全或错误修正(如GitHub Copilot),不过决策权依然在用户。

当人类设立了工作目标之后,目标会被拆解成一个个的子任务,或者流水线。在这个流水线上有多个Agent,每个Agent负责这个任务流水线的一部分,所有Agent共同协作达成任务目标。

1.3 AI Agent产品架构

随着大模型+强化学习的发展,人们提出AI Agent产品架构。 AI Agent可以自主规划任务,自主决策。

AI Agent核心思想是构建具有自主性、反应性和社会性的实体,能够在动态环境中独立或协作完成任务。

在这种模式下,人为干预占一小部分,绝大部分任务,都有AI来完成。

二,技术架构

2.1 纯Prompt

在该技术架构下,Prompt使用户与大模型交流的唯一窗口。用户与大模型,一问一答的形式进行交流。

2.2 Agent + Function Calling

这种技术架构下,由AI主动提要求,例如AI需要通过执行某个函数,也就是通过调用其他的能力来完成最后的任务。 

例如你的问题是去北京,要穿什么衣服,去故宫要提前几天预约等。那么通过外部接口的返回,来完成这个问题的解答。

2.3 RAG (Retrieval-Augmented Generation 检索增强生成

RAG的核心技术栈基于向量语义编码与向量检索引擎的协同运作。

  1. 语义向量化层
    通过Embeddings模型(如BERT、Sentence-Transformer等)将非结构化文本转换为高维稠密向量,将语义相似性转化为数学可计算的向量空间距离(如余弦相似度、欧氏距离),解决传统关键词匹配的语义歧义问题。

  2. 向量存储与索引层
    构建专用向量数据库(如Pinecone、Milvus、FAISS),利用近似最近邻搜索(ANN)算法(如HNSW、IVF-PQ)实现毫秒级检索,支持十亿级向量规模下的实时响应。

  3. 动态检索匹配层
    用户输入的查询文本经Embeddings模型实时编码为向量后,在向量数据库中执行语义拓扑匹配,返回与查询向量空间距离最近的Top-K文档向量,同步返回原始文本片段及元数据(如来源、时间戳)。

举个例子,

  • 输入:请解析2023年高考数学全国卷I第20题三角函数综合应用
  • 分析:
    1. 问题向量生成:通过Sentence-BERT编码为768维向量
    2. 向量数据库检索:在500万道题目向量库中匹配相似度>0.85的Top-5结果
    3. 上下文增强:关联检索到3篇历年真题解析、2篇教师评课记录、1篇官方评分标准
  • 生成:生成包含详细解题步骤、易错点分析、评分细则的整合答案,较传统检索效率提升72%,答案准确率提升至94.6%(基于10万条测试数据)

2.4 Fine-tuning(微调)

微调的核心在于,在预训练模型的基础上,针对特定任务或领域开展进一步的训练,使模型能够深入学习并掌握该领域的知识和特征,从而在长期记忆的基础上灵活运用这些知识。

与传统的方法相比,Fine-Tuning具有显著的优势。它并非从零开始训练模型,而是充分利用预训练模型已经学习到的通用知识,通过微调使其快速适应特定场景。这种方法不仅能够节省大量的训练时间和计算资源,还能让模型在特定领域展现出更高的专业性和准确性。

例如在医学领域,疾病的诊断需要高度的专业知识和精确的判断。通过Fine-Tuning技术,可以对预训练模型进行医学影像数据(如X光、CT、MRI等)和临床病例数据的微调训练。经过训练后的模型能够识别各种疾病的特征模式,辅助医生进行更准确的诊断,提高诊断的效率和准确性,为患者的治疗争取宝贵的时间。

相关文章:

1.4 大模型应用产品与技术架构

目录 一,产品架构 1.1 AI Embedded产品架构 1.2 AI Copilot产品架构 1.3 AI Agent产品架构 二,技术架构 2.1 纯Prompt 2.2 Agent Function Calling 2.3 RAG (Retrieval-Augmented Generation 检索增强生成) 2.4 Fine-tu…...

Android HAL HIDL

1 Android HAL HIDL 1.1 Android中查看有哪些HIDL HAL HIDL是Treble Interface的一部分。 adb root adb shell # lshal 1.2 Android打印C调用栈 #include <utils/CallStack.h> 在需要打印的地方加如下的定义。 android::CallStack stack("oem"); logcat | g…...

std::mutex底层实现原理

std::mutex是一个用于实现互斥访问的类&#xff0c;其具备两个成员函数——lock和unlock 锁的底层实现原理 锁的底层实现是基于原子操作的&#xff0c;这些原子操作是由指令支持的&#xff0c;因为单个指令是不能被中断的 一些与锁的实现有关的原子指令为&#xff1a; 待补充…...

性能提升手段--池化技术

看到hadoop代码里有ByteBufferPool,使用池子来避免频繁创建、销毁ByteBuffer,减轻GC压力,提高性能。 顺便总结一下池化技术 一、什么是池化技术?​​ ​​池化(Pooling)​​ 是一种资源管理策略,通过​​预先创建并复用资源​​(如数据库连接、线程、内存对象等)来提…...

精益数据分析(28/126):解读商业模式拼图与关键指标

精益数据分析&#xff08;28/126&#xff09;&#xff1a;解读商业模式拼图与关键指标 在创业和数据分析的探索旅程中&#xff0c;每一次深入研究都可能带来新的启发和突破。今天&#xff0c;我们依旧带着共同进步的初心&#xff0c;深入解读《精益数据分析》中关于商业模式的…...

QT6 源(52)篇二:存储 c 语言字符串的类 QByteArray 的使用举例,

&#xff08;3&#xff09; &#xff08;4&#xff09; 谢谢...

工业摄像头通过USB接口实现图像

工业摄像头系列概览&#xff1a;类型与应用 工业摄像头系列涵盖了多种类型&#xff0c;以满足不同行业和应用的需求。以下是对工业摄像头系列的一些介绍&#xff1a; 一、主要类型与特点 USB工业摄像头 &#xff1a;这类摄像头通常通过USB接口与计算机连接&#xff0c;适用于…...

【BBDM】main.py -- notes

命令行接口 python main.py [OPTIONS]参数 参数类型默认值说明-c, --configstr"BBDM_base.yml"配置文件路径-s, --seedint1234随机种子&#xff0c;用于结果复现-r, --result_pathstr"results"结果保存目录-t, --trainflagFalse训练模式开关&#xff1a;…...

X86物理机安装iStoreOS软路由

目录 安装前准备 制作启动盘 安装系统到硬盘 启动与初始配置 常见问题与注意事项 参考资料 安装前准备 硬件设备 X86物理机&#xff08;如普通电脑、J4125/N5105等小主机&#xff09; U盘&#xff08;建议容量≥2GB&#xff09; 显示器、键盘&#xff08;用于初始配置…...

QML Date:日期处理示例

目录 引言相关阅读QML Date对象知识概要格式化选项 DateExamples示例解析代码解析示例1&#xff1a;日期格式化示例2&#xff1a;不同地区的日期显示示例3&#xff1a;日期解析示例4&#xff1a;自定义格式示例5&#xff1a;日期与时间戳转换 运行效果总结下载链接 引言 在Qt …...

python 与Redis操作整理

以下是使用 Python 操作 Redis 的完整整理&#xff0c;涵盖基础操作、高级功能及最佳实践&#xff1a; 1. 安装与连接 (1) 安装库 pip install redis(2) 基础连接 import redis# 创建连接池&#xff08;推荐复用连接&#xff09; pool redis.ConnectionPool(hostlocalhost, …...

【Linux】环境监控系统软件框架

目录 tasks.h type.h main.c tasks.c makefile 运行结果 调用多线程框架&#xff0c;在主函数写好环境监控文件的函数&#xff0c;使用结构体封装环境指标的参数 最后使用makefile管理工程文件 tasks.h #include<pthread.h>#ifndef __TASK_H__ #define __TASK_H_…...

WPF实现数字孪生示例

WPF 数字孪生系统实现示例 数字孪生(Digital Twin)是通过数字化手段在虚拟空间中构建物理实体的精确数字模型,并实现虚实映射、实时交互和智能决策的技术。本文将展示如何使用WPF实现一个基础的数字孪生系统示例。 一、系统架构设计 1. 整体架构 +-------------------+ | …...

对卡尔曼滤波的理解和简单示例实现

目录 一、概述 二、基本公式解释 1&#xff09;状态转移方程 2&#xff09;状态更新方程 3&#xff09;卡尔曼系数更新方程 4&#xff09;误差协方差估计方程 三、一个简单示例 一、概述 经典卡尔曼滤波算法在线性系统中运用非常广泛&#xff0c;可以对数据实现很好的平…...

Linux基础命令总结

Linux系统命令 1. systemctl 1. 基本语法 systemctl start | stop | restart | status 服务名 2. 经验技巧查看服务的方法:/usr/lib/systemd/system 3. 案例实操 (1)查看防火墙服务的状态 systemctl status firewalld (2)停止防火墙服务 systemctl stop firewalld (…...

视觉大模型专栏导航

关于视觉大模型专栏&#xff0c;暂时还没有比较明确的更新计划&#xff0c;最近会在本专栏上更新关于Sam模型的基本原理&#xff0c;包括Image Encoder、Prompt Encoder及Mask Decoder等模块的实现&#xff1b;还有记录下如何利用Sam代码跑通一个demo。 后期接触了其他视觉大模…...

Eigen的主要类及其功能

Eigen 是一个高性能的 C 模板库&#xff0c;主要用于线性代数、矩阵和向量运算。它提供了许多类来支持各种数学运算&#xff0c;以下是 Eigen 的主要类及其功能分类。 1. 核心矩阵和向量类 这些是 Eigen 中最常用的类&#xff0c;用于表示矩阵和向量&#xff1a; Matrix - 通用…...

深入理解TransmittableThreadLocal:原理、使用与避坑指南

一、ThreadLocal与InheritableThreadLocal回顾 在介绍TransmittableThreadLocal之前&#xff0c;我们先回顾一下Java中的ThreadLocal和InheritableThreadLocal。 1. ThreadLocal ThreadLocal提供了线程局部变量&#xff0c;每个线程都可以通过get/set访问自己独立的变量副本…...

大模型奖励建模新突破!Inference-Time Scaling for Generalist Reward Modeling

传统的RM在通用领域面临准确性和灵活性挑战&#xff0c;而DeepSeek-GRM通过动态生成principle和critic&#xff0c;结合并行采样与meta RM引导的投票机制&#xff0c;实现了更高质量的奖励信号生成。论文通过Self-Principled Critique Tuning (SPCT)方法&#xff0c;显著提升了…...

C++:string 1

练习题&#xff1a; 这个题的思路是从前往后&#xff0c;从后往前同时找&#xff0c;不是字母的话就继续&#xff0c;是的话就交换。 代码&#xff1a; #define _CRT_SECURE_NO_WARNINGS 1 #include <iostream> #include <string> using namespace std; //1、4个…...

C语言学习之调试

在C语言的编程学习中&#xff0c;我们能不可避免的要遇到bug。通常我们面对编译错误等问题是很容易发现的&#xff0c;但是当我们面对代码结果不满足预期等情况下是很难去改的&#xff0c;因此我们就要学习如何调试代码。 bug与调试 什么是bug&#xff1f; bug本意是“昆虫”和…...

【project】--模拟搭建一个中小型校园网的网络平台

文章目录 项目介绍设备及IP地址分配node01配置网卡配置DHCP配置路由转发 node02配置网卡配置安装并配置授权 Unbound DNS node03配置网卡配置安装防火墙SNAT配置DNAT配置(端口转发)纯缓存 Unbound DNS 配置 node04配置node05配置node06配置 项目介绍 本项目通过1台物理机和VMw…...

DeepSeek 的长上下文扩展机制

DeepSeek 在基础预训练完成后,引入 YaRN(Yet another RoPE extensioN method)技术,通过额外的训练阶段将模型的上下文窗口从默认的 4K 逐步扩展至 128K。整个过程分为两个阶段:第一阶段将上下文窗口从 4K 扩展到 32K;第二阶段则进一步从 32K 扩展到 128K。每个阶段均采用…...

AQS条件队列源码详细剖析

AQS条件队列源码详细剖析 0.简介 欢迎来到我的博客&#xff1a;TWind的博客 最好先看过我博客中的 ReentrantLock的超详细源码解析 &#xff0c;不然想要理解条件队列的源码会非常困难。 AQS中的条件队列相比同步队列略显简单&#xff0c;但依然优异且高效&#xff0c;复杂而…...

LeetCode --- 446 周赛

题目列表 3522. 执行指令后的得分 3523. 非递减数组的最大长度 3524. 求出数组的 X 值 I 3525. 求出数组的 X 值 II 一、执行指令后的得分 照着题目要求进行模拟即可&#xff0c;代码如下 // C class Solution { public:long long calculateScore(vector<string>&…...

ngrok 内网穿透技术系统性文档

ngrok 内网穿透技术系统性文档—目录 1. 概述与背景1.1 内网穿透的需求背景1.2 ngrok的核心定义1.3 定位与核心价值 2. 核心原理与技术架构2.1 技术架构图2.2 核心原理详解2.2.1 隧道建立流程2.2.2 多协议支持机制2.2.3 动态DNS与路由 3. 功能体系与配置详解3.1 基础功能3.1.1 …...

C++ 为什么建议类模板定义在头文件中,而不定义在源文件中

类模板 XXXX 模板的编译模式模板不是实际的代码&#xff0c;而是一个“代码生成模板” 分离定义会导致链接错误补充为什么普通类可以分离定义&#xff1f;对比C11的export关键字&#xff08;已弃用&#xff09; 模板的编译模式 C模板采用两阶段编译&#xff08;Two-Phase Tran…...

Android studio学习之路(八)---Fragment碎片化页面的使用

fragment的用法很常见&#xff0c;你可能经常看见这样的画面&#xff1a; 通过滑动来进行切换页面&#xff0c;今天我们就来实现这样的形式 介绍 使用 Fragment 的核心价值在于 ​​模块化设计​​ 和 ​​动态适配能力​​&#xff0c;尤其适合以下场景&#xff1a; 需要…...

数据结构和算法(九)--红黑树

一、红黑树 1、红黑树 前面介绍了2-3树&#xff0c;可以看到2-3树能保证在插入元素之后&#xff0c;树依然保持平衡状态&#xff0c;它的最坏情况下所有子结点都是2-结点&#xff0c;树的高度为IgN&#xff0c;相比于我们普通的二叉查找树&#xff0c;最坏情况下树的高度为N,确…...

字节跳动开源数字人模型latentsync1.5,性能、质量进一步优化~

项目背景 LatentSync1.5 是由 ByteDance 开发的一款先进的 AI 模型&#xff0c;专门针对视频唇同步&#xff08;lip synchronization&#xff09;任务设计&#xff0c;旨在实现音频与视频唇部动作的高质量、自然匹配。随着 AI 技术的快速发展&#xff0c;视频生成和编辑的需求…...

Pygame入门:零基础打造你的第一个游戏窗口

Pygame入门:零基础打造你的第一个游戏窗口 大家好,欢迎来到本期的技术分享!今天,我们将一起探索如何使用Python中的Pygame库来创建一个简单的游戏窗口。无论你是编程新手,还是对游戏开发感兴趣的朋友,这篇文章都将帮助你迈出第一步。让我们开始吧! 什么是Pygame? 在…...

《ATPL地面培训教材13:飞行原理》——第13章:高速飞行

翻译&#xff1a;刘远贺&#xff1b;工具&#xff1a;Cursor & Cluade 3.7&#xff1b;过程稿 第13章&#xff1a;高速飞行 目录 引言声速马赫数恒定指示空速爬升对马赫数的影响恒定马赫数下真空速随高度的变化恒定飞行高度和指示空速下温度对马赫数的影响气动流动的细分…...

【C语言练习】004. 使用各种运算符进行计算

【C语言练习】004. 使用各种运算符进行计算 004. 使用各种运算符进行计算1. 算术运算符2. 关系运算符3. 逻辑运算符4. 位运算符5. 赋值运算符6. 逗号运算符综合示例输出结果004. 使用各种运算符进行计算 在C语言中,运算符用于执行各种数学和逻辑运算。以下是一些常见的运算符…...

Pygame事件处理详解:键盘、鼠标与自定义事件

Pygame事件处理详解:键盘、鼠标与自定义事件 在游戏开发中,玩家的交互是至关重要的。无论是移动角色、触发动作还是暂停游戏,都需要通过各种输入来实现。Pygame作为一个功能强大的Python库,提供了丰富的API来处理这些输入,包括键盘、鼠标以及自定义事件。本文将详细介绍如…...

16. LangChain自主智能体(Autonomous Agent):模拟人类工作流的进阶设计

引言&#xff1a;当AI学会"思考"与"行动" 2025年某跨国律所的合同审查智能体&#xff0c;通过自主规划任务流&#xff0c;将平均处理时间从8小时缩短至23分钟。本文将基于LangChain的AgentExecutor与Deepseek-R1&#xff0c;揭示如何构建能自主决策、动态…...

直接映射例题及解析

目录 基本单位换算 例题一 &#x1f4c1; Tag Directory&#xff08;标签目录&#xff09; 是什么&#xff1f; 例题二 例题三 例题四 串行访问还是并行访问的选择 例题五 例题六 例题七 &#x1f535; P1&#xff1a;&#xff08;按行访问&#xff09; &#x1…...

MAVLink协议:原理、应用与实践

目录 1. 前言 2. MAVLink 协议的基本概念 2.1 协议概述 2.2 消息格式 2.3 协议版本 3. MAVLink 协议的适应场景 3.1 无人机地面站与飞行器通信 3.2 飞行器与传感器通信 3.3 无人机集群通信 3.4 飞行模拟与测试 4. 基于 Python 的 MAVLink 协议编程实践 4.1 开发环境…...

【记一次亚马逊普华永道审计流程】

1、2025年2月21日 收到审计邮件 2、2025年2月25日未及时关注注册开发者的邮箱导致一直未回复 3、2025年3月4日亚马逊警告邮件-依旧未回复 4、2025年3月13日APP正式被亚马逊开发者商店下架 停用影响: APP从官方商店下架&#xff0c;不能授权新店铺 停用原因: 由于此邮箱为注册…...

Java 异常处理全解析:从基础到自定义异常的实战指南

Java 异常处理全解析&#xff1a;从基础到自定义异常的实战指南 一、Java 异常体系&#xff1a;Error 与 Exception 的本质区别 1. 异常体系核心架构 Java把异常当作对象来处理&#xff0c;并定义一个基类java.lang.Throwable作为所有异常的超类。 在Java API中已经定义了许…...

二、UI自动化测试02--元素定位方法

目录 一、定位⼀组元素⽅法二、XPath 定位⽅法1. 路径策略1.1 路径值获取⽅法 2. 利⽤元素属性策略利⽤元素属性策略的注意事项 3. 属性和逻辑结合4. 层级和属性结合策略5. XPath 延伸⽅法 三、CSS 定位⽅法1. CSS 策略: id选择器/class选择器/元素选择器/属性选择器2. 属性选择…...

第二章 信息技术发展(2.1 信息技术及其发展)

2.1 信息技术及其发展 2.1.1 计算机软硬件 计算机硬件 (Computer Hardware) 是指计算机系统中由电 、机械和光电元件等组成 的各 种物理装置的总称计算机软件 (Computer Software) 是指计算机系统中的程序及其文档,程序是计 算任务的处理对象和处理规则的描述;文档是为了便千…...

【SwitchyOmega安装教程】

目录 一、插件安装 1. 下载安装文件 2. 打开浏览器扩展安装页面 3. 安装插件 二、界面详情 三、配置信息 3.1 设置IP 1、查看IP地址信息 2、批量测试IP是否有效 3、点击扩展程序&#xff0c;选择 Proxy SwitchyOmega 4、 点击选项进行配置 5、配置页面 一、插件安装 1…...

驱动开发硬核特训 · Day 21(上篇加强版):深入理解子系统机制与实战初探

&#x1f4c5; 日期&#xff1a;2025-04-27 &#x1f4da; 技术平台&#xff1a;嵌入式Jerry&#xff08;B站&#xff09; 1. 为什么要有子系统&#xff1f;&#xff08;深度版&#xff09; 在 Linux 内核发展早期&#xff0c;设备管理较为混乱&#xff0c;每种设备&#xff0…...

GoFly快速开发框架新增UI素材库-帮助开发者快速开发管理后台UI基于ArcoDesign框架开发

说明&#xff1a; 为开发者提供管理台的UI素材&#xff0c;社区将持续为开发开发后台系统常用UI界面&#xff0c;让开发时能有一半的界面可以直接从UI库获取&#xff0c;减少开发者自己排版界面的时间&#xff0c;帮助开发者快速开发后台业务。 使用的前端版本要求&#xff1…...

Unity-Shader详解-其二

前向渲染和延迟渲染 前向渲染和延迟渲染总的来说是我们的两种主要的渲染方式。 我们在Unity的Project Settings中的Graphic界面能够找到渲染队列的设定&#xff1a; 我们也可以在Main Camera这里进行设置&#xff1a; 那这里我们首先介绍一下两种渲染&#xff08;Forward R…...

Windows 安装 Neo4j 教程

Windows 安装 Neo4j 教程 Neo4j 是一个开源的图数据库&#xff0c;它以图形结构存储数据&#xff0c;适合用于处理高度连接的数据&#xff0c;广泛应用于社交网络、推荐系统、欺诈检测等场景。本文将为你介绍如何在 Windows 系统上安装和配置 Neo4j 数据库。 一、安装前准备 …...

Neo4j 常用查询语句

Neo4j 常用查询语句 Neo4j 是一个图数据库&#xff0c;查询语言是 Cypher&#xff0c;它类似于 SQL 但针对图形数据进行了优化。Cypher 语法直观易懂&#xff0c;适合用来处理图数据。本文将介绍一些 Neo4j 中常用的查询语句&#xff0c;帮助你快速掌握图数据的操作方法。 一…...

机器学习(10)——神经网络

文章目录 1. 神经网络基本原理1.1. 什么是神经网络1.2. 核心思想 2. 基础组件3. 前向传播&#xff08;Forward Propagation&#xff09;4. 反向传播&#xff08;Backpropagation&#xff09;5. 激活函数对比6. 网络架构类型7. 优化策略8. Python示例&#xff08;PyTorch&#x…...

Qt软件开发-摄像头检测使用软件V1.1

系列文章目录 Qt软件开发-摄像头检测使用软件V1.1 文章目录 系列文章目录前言一、V1.1增加了哪些功能&#xff1f;二、代码构成1.总体结构2. 代码内容 三、效果展示图总结 前言 之前&#xff0c;在Qt软件开发-摄像头检测使用软件&#xff1a;https://blog.csdn.net/xuming204…...

AI日报 - 2025年04月26日

&#x1f31f; 今日概览(60秒速览) ▎&#x1f916; 模型竞赛 | OpenAI与Google新模型在Arena榜单激烈角逐&#xff0c;性能指标各有千秋。 OpenAI发布o3/o4-mini等新模型&#xff0c;Gemini 2.5 Pro紧随其后&#xff0c;数学、编程能力成焦点。 ▎&#x1f4bc; 商业动向 | 并…...