当前位置：首页 > news >正文

《AI大模型应知应会100篇》第60篇：Pinecone 与 Milvus，向量数据库在大模型应用中的作用

news 来源：原创 2025/7/20 11:23:16

第60篇：Pinecone与Milvus，向量数据库在大模型应用中的作用

摘要

本文将系统比较Pinecone与Milvus两大主流向量数据库的技术特点、性能表现和应用场景，提供详细的接入代码和最佳实践，帮助开发者为大模型应用选择并优化向量存储解决方案。

在这里插入图片描述

引言：为什么需要向量数据库？

随着AI大模型的发展，向量数据（如文本、图像的嵌入表示）成为处理非结构化数据的核心方式。然而，传统的数据库无法高效地处理高维向量的相似性搜索问题。因此，向量数据库应运而生。

什么是向量数据库？

向量数据库是一种专门用于存储和检索高维向量数据的数据库。它支持快速执行近似最近邻搜索（ANN），即找出与目标向量最接近的一组向量。

向量数据库的应用场景

推荐系统：基于用户行为向量进行个性化推荐。
语义搜索：通过文本嵌入实现文档或网页内容的语义匹配。
图像检索：利用图像特征向量进行相似图片查找。
RAG（Retrieval-Augmented Generation）：结合知识库与大模型生成更准确的回答。

核心概念与知识点

1. 向量数据库基础

向量嵌入基础

向量嵌入是将非结构化数据（如文本、图像）转换为固定维度的数值向量的过程。例如：

使用 text-embedding-ada-002 将文本转换为 1536 维向量。
使用 CLIP 模型将图像转换为 512 维向量。

from openai import OpenAIclient = OpenAI()
response = client.embeddings.create(input="这是一个示例文本",model="text-embedding-ada-002"
)
embedding = response.data[0].embedding
print(len(embedding))  # 输出: 1536

相似性搜索原理

常见的相似性度量方法包括：

余弦相似度（Cosine Similarity）：衡量两个向量之间的夹角。
欧氏距离（Euclidean Distance）：衡量两个向量之间的直线距离。

通常使用余弦相似度来判断两个向量是否“语义上”相似。

索引类型对比

索引类型	特点	适用场景
HNSW (Hierarchical Navigable Small World)	高效且支持动态更新	实时推荐系统
IVF (Inverted File Index)	快速但不支持频繁更新	批量处理场景
FLAT	精确但慢	小规模数据

向量数据库与传统数据库的区别

对比项	传统数据库	向量数据库
数据类型	结构化数据（如整数、字符串）	高维向量
查询方式	精确匹配（如 SQL WHERE 条件）	近似最近邻搜索（ANN）
性能	插入/查询速度快	支持大规模向量数据的高效检索

Pinecone实战应用

账户设置与索引创建

Pinecone 是一个云托管的向量数据库服务，适合不想自己部署服务器的开发者。

安装依赖

pip install pinecone-client openai

初始化 Pinecone 并创建索引

import pinecone
from openai import OpenAI# 初始化 Pinecone
pinecone.init(api_key="your-api-key", environment="your-environment")# 创建索引（如果不存在）
if "knowledge-base" not in pinecone.list_indexes():pinecone.create_index(name="knowledge-base",dimension=1536,  # OpenAI ada-002 的输出维度metric="cosine")# 连接到索引
index = pinecone.Index("knowledge-base")

插入向量

client = OpenAI()# 生成向量嵌入
embeddings = client.embeddings.create(input="需要向量化的文本内容",model="text-embedding-ada-002"
).data[0].embedding# 插入向量
index.upsert(vectors=[{"id": "doc1","values": embeddings,"metadata": {"source": "article", "author": "Zhang San"}}]
)

相似性搜索

results = index.query(vector=embeddings,top_k=3,include_metadata=True
)for result in results['matches']:print(f"ID: {result['id']}, Score: {result['score']}, Metadata: {result['metadata']}")

输出示例

ID: doc1, Score: 0.987, Metadata: {'source': 'article', 'author': 'Zhang San'}
ID: doc2, Score: 0.876, Metadata: {'source': 'blog', 'author': 'Li Si'}
ID: doc3, Score: 0.765, Metadata: {'source': 'wiki', 'author': 'Wang Wu'}

Milvus实战应用

部署与集群配置

Milvus 是一个开源的向量数据库，支持本地部署和分布式架构，适合对数据隐私要求较高的企业。

安装 Milvus

使用 Docker 快速启动：

docker run -d --name milvusdb -p 19530:19530 milvusdb/milvus:v2.4.3

Python 客户端连接

pip install pymilvus numpy

连接 Milvus 并插入数据

from pymilvus import connections, Collection, utility
import numpy as np# 连接 Milvus
connections.connect(host='localhost', port='19530')# 创建集合
collection_name = "document_store"if utility.has_collection(collection_name):collection = Collection(collection_name)
else:from pymilvus import FieldType, CollectionSchema, DataTypefields = [{"name": "id", "type": DataType.INT64, "is_primary": True},{"name": "embedding", "type": DataType.FLOAT_VECTOR, "dim": 1536},{"name": "source", "type": DataType.VARCHAR, "max_length": 256},{"name": "author", "type": DataType.VARCHAR, "max_length": 256}]schema = CollectionSchema(fields, description="Document Store")collection = Collection(collection_name, schema=schema)# 插入数据
import randomnum_entities = 1000
ids = [i for i in range(num_entities)]
embeddings = [[random.random() for _ in range(1536)] for _ in range(num_entities)]
sources = ["article"] * num_entities
authors = ["Zhang San"] * num_entitiescollection.insert([ids, embeddings, sources, authors])
collection.flush()

向量搜索

search_params = {"metric_type": "COSINE", "params": {"nprobe": 10}}
results = collection.search(data=[embeddings[0]],anns_field="embedding",param=search_params,limit=3,expr="source == 'article'",output_fields=["source", "author"]
)for hit in results[0]:print(f"ID: {hit.id}, Distance: {hit.distance}, Source: {hit.entity.get('source')}")

输出示例

ID: 0, Distance: 0.0, Source: article
ID: 123, Distance: 0.123, Source: article
ID: 456, Distance: 0.135, Source: article

应用架构与集成

与 LangChain 集成

LangChain 是一个强大的框架，可以轻松集成向量数据库。

安装依赖

pip install langchain pinecone-client pymilvus openai

Pinecone 集成

from langchain.vectorstores import Pinecone as LangchainPinecone
from langchain.embeddings.openai import OpenAIEmbeddingsembeddings = OpenAIEmbeddings()
vectorstore = LangchainPinecone.from_existing_index(index_name="knowledge-base",embedding=embeddings,text_key="content"
)

Milvus 集成

from langchain.vectorstores import Milvus as LangchainMilvusmilvus_store = LangchainMilvus(embedding_function=embeddings,collection_name="document_store",connection_args={"host": "localhost", "port": "19530"}
)

性能与选型对比

对比项	Pinecone	Milvus
部署方式	云托管	自托管/云托管
易用性	高（开箱即用）	中等（需部署）
成本	按 API 调用计费	开源免费
扩展性	自动扩展	支持分布式部署
社区活跃度	商业支持	开源社区活跃
功能丰富度	丰富	更加灵活可定制

实战案例

案例一：企业搜索引擎

需求：亿级文档的向量检索系统。
方案：
- 使用 Milvus 构建本地向量数据库。
- 使用 Elasticsearch 做关键词搜索。
- 使用 LangChain 整合两者实现混合搜索。

案例二：个性化推荐

需求：根据用户历史行为推荐相关内容。
方案：
- 用户行为向量化。
- 使用 Pinecone 进行实时相似性搜索。
- 返回相似用户的偏好内容作为推荐结果。

实战案例：完整代码与部署指南

案例一：企业搜索引擎（Milvus + Elasticsearch + LangChain）

1. 系统架构设计

[用户查询] ↓
[LangChain混合搜索]├─→ [Elasticsearch关键词搜索]└─→ [Milvus向量相似性搜索]↓
[结果融合排序]↓
[最终返回结果]

2. 技术栈要求

pip install pymilvus elasticsearch langchain openai sentence-transformers fastapi uvicorn
docker pull milvusdb/milvus:v2.4.3
docker pull docker.elastic.co/elasticsearch/elasticsearch:8.11.3

3. Milvus向量数据库初始化

from pymilvus import connections, Collection, utility, FieldSchema, CollectionSchema, DataType# 连接Milvus
connections.connect(host='localhost', port='19530')# 创建集合
collection_name = "document_vectors"if not utility.has_collection(collection_name):fields = [FieldSchema(name="doc_id", dtype=DataType.INT64, is_primary=True),FieldSchema(name="embedding", dtype=DataType.FLOAT_VECTOR, dim=768),FieldSchema(name="title", dtype=DataType.VARCHAR, max_length=512),FieldSchema(name="content", dtype=DataType.VARCHAR, max_length=65535)]schema = CollectionSchema(fields, description="文档向量存储")collection = Collection(collection_name, schema=schema)# 创建索引index_params = {"index_type": "IVF_FLAT","params": {"nlist": 1024},"metric_type": "COSINE"}collection.create_index(field_name="embedding", index_params=index_params)
else:collection = Collection(collection_name)collection.load()

4. Elasticsearch关键词索引创建

from elasticsearch import Elasticsearch
from elasticsearch_dsl import analyzer# 连接Elasticsearch
es_client = Elasticsearch(hosts=["http://localhost:9200"])# 创建索引
index_name = "document_search"if not es_client.indices.exists(index=index_name):es_client.indices.create(index=index_name,body={"settings": {"analysis": {"analyzer": {"custom_analyzer": {"type": "custom","tokenizer": "whitespace","filter": ["lowercase", "stop", "stemmer"]}}}},"mappings": {"properties": {"title": {"type": "text", "analyzer": "custom_analyzer"},"content": {"type": "text", "analyzer": "custom_analyzer"}}}})

5. 向量化处理服务

from sentence_transformers import SentenceTransformerclass VectorService:def __init__(self):self.model = SentenceTransformer('all-MiniLM-L6-v2')def text_to_vector(self, text: str) -> List[float]:return self.model.encode(text).tolist()vector_service = VectorService()

6. LangChain混合搜索实现

from langchain.vectorstores import Milvus
from langchain.schema import Document
from langchain.embeddings import HuggingFaceEmbeddings# 初始化嵌入模型
embeddings = HuggingFaceEmbeddings(model_name="all-MiniLM-L6-v2")# 连接Milvus向量数据库
milvus_store = Milvus(embedding_function=embeddings,collection_name=collection_name,connection_args={"host": "localhost", "port": "19530"}
)def hybrid_search(query: str, top_k: int = 5):# 向量搜索vector_results = milvus_store.similarity_search(query, k=top_k)# 关键词搜索es_results = es_client.search(index=index_name,body={"query": {"multi_match": {"query": query, "fields": ["title^2", "content"]}}})# 结果融合combined_results = []for hit in es_results['hits']['hits']:combined_results.append({"source": "elasticsearch","score": hit['_score'],"title": hit['_source']['title'],"content": hit['_source']['content']})for doc in vector_results:combined_results.append({"source": "milvus","score": doc.metadata.get("distance", 0),"title": doc.metadata.get("title", ""),"content": doc.page_content})# 按分数排序combined_results.sort(key=lambda x: x["score"], reverse=True)return combined_results[:top_k]

7. 部署指南

# 启动Milvus
docker run -d --name milvusdb -p 19530:19530 milvusdb/milvus:v2.4.3# 启动Elasticsearch
docker run -d --name es-node -p 9200:9200 \-e "discovery.type=single-node" \-e "ES_JAVA_OPTS=-Xms1g -Xmx1g" \docker.elastic.co/elasticsearch/elasticsearch:8.11.3# 安装依赖
pip install -r requirements.txt# 启动API服务
uvicorn search_api:app --host 0.0.0.0 --port 8000

案例二：个性化推荐系统（Pinecone + 用户行为分析）

1. 系统架构设计

[用户行为数据]↓
[特征工程处理]↓
[Pinecone向量存储]↓
[相似用户查找]↓
[内容推荐生成]

2. 技术栈要求

pip install pinecone-client openai pandas numpy scikit-learn fastapi uvicorn

3. Pinecone初始化

import pinecone
from openai import OpenAI# 初始化Pinecone
pinecone.init(api_key="your-api-key", environment="northamerica-northeast1-gcp")# 创建索引
index_name = "user-behavior"if index_name not in pinecone.list_indexes():pinecone.create_index(name=index_name,dimension=1536,  # OpenAI嵌入维度metric="cosine")# 连接索引
index = pinecone.Index(index_name)
client = OpenAI()

4. 用户行为向量化

import pandas as pd
from sklearn.preprocessing import StandardScalerclass UserBehaviorVectorizer:def __init__(self):self.scaler = StandardScaler()def _extract_features(self, user_data: dict) -> pd.DataFrame:# 特征提取示例features = {"avg_session_time": user_data.get("session_duration", 0),"click_rate": len(user_data.get("clicked_items", [])) / max(1, user_data.get("impressions", 1)),"purchase_frequency": len(user_data.get("purchases", [])) / max(1, user_data.get("days_active", 1)),"category_preference": user_data.get("preferred_category", "other"),"device_usage": user_data.get("device_type", "desktop"),"location": user_data.get("location", "unknown")}return pd.DataFrame([features])def _normalize_features(self, df: pd.DataFrame) -> np.ndarray:# 数值特征标准化numerical = self.scaler.fit_transform(df[["avg_session_time", "click_rate", "purchase_frequency"]])# 类别特征one-hot编码categorical = pd.get_dummies(df[["category_preference", "device_usage", "location"]])# 合并特征return np.hstack([numerical, categorical.values])def vectorize(self, user_data: dict) -> List[float]:df = self._extract_features(user_data)features = self._normalize_features(df)# 使用OpenAI嵌入进行降维response = client.embeddings.create(input=features.tolist()[0],model="text-embedding-ada-002")return response.data[0].embedding

5. 推荐引擎实现

class RecommendationEngine:def __init__(self):self.user_vectorizer = UserBehaviorVectorizer()def add_user(self, user_id: str, user_data: dict):# 向量化用户行为vector = self.user_vectorizer.vectorize(user_data)# 存储到Pineconeindex.upsert(vectors=[{"id": user_id,"values": vector,"metadata": {"preferences": user_data.get("preferred_categories", []),"recent_purchases": user_data.get("recent_purchases", []),"location": user_data.get("location", "")}}])def get_recommendations(self, user_id: str, top_k: int = 5):# 获取用户向量result = index.fetch(ids=[user_id])if not result.vectors:return []user_vector = result.vectors[user_id].values# 查找相似用户similar_users = index.query(vector=user_vector,top_k=top_k+1,  # 排除自己include_metadata=True)# 过滤出相似用户的偏好recommendations = []for match in similar_users.matches:if match.id == user_id:continuemetadata = match.metadatarecommendations.extend(metadata.get("recent_purchases", []))# 去重并返回return list(set(recommendations))[:top_k]

6. API接口实现

from fastapi import FastAPI, HTTPException
from pydantic import BaseModelapp = FastAPI()class UserData(BaseModel):session_duration: floatclicked_items: List[str]impressions: intpurchases: List[str]days_active: intpreferred_category: strdevice_type: strlocation: strrecommendation_engine = RecommendationEngine()@app.post("/users/{user_id}/update")
async def update_user_profile(user_id: str, user_data: UserData):try:recommendation_engine.add_user(user_id, user_data.dict())return {"status": "success"}except Exception as e:raise HTTPException(status_code=500, detail=str(e))@app.get("/users/{user_id}/recommendations")
async def get_recommendations(user_id: str, top_k: int = 5):try:results = recommendation_engine.get_recommendations(user_id, top_k)return {"recommendations": results}except Exception as e:raise HTTPException(status_code=500, detail=str(e))

7. 部署指南

# 设置环境变量
export PINECONE_API_KEY="your-pinecone-api-key"
export OPENAI_API_KEY="your-openai-api-key"# 安装依赖
pip install -r requirements.txt# 启动服务
uvicorn recommendation_api:app --host 0.0.0.0 --port 8000

扩展建议

1. 性能优化

对于企业搜索引擎：
- 使用Milvus的分片功能支持亿级数据
- 在Elasticsearch中使用倒排索引优化关键词搜索
- 引入缓存层（如Redis）存储高频查询结果

2. 安全加固

添加身份验证（JWT/OAuth）
对敏感数据进行加密存储
实现速率限制防止滥用

3. 监控方案

Prometheus + Grafana监控系统指标
ELK日志分析体系
设置异常报警规则

4. 可扩展性设计

将计算密集型任务移至Celery异步任务队列
使用Kubernetes进行容器编排
为不同模块设计独立的微服务架构

以上两个实战案例提供了完整的代码实现和部署指南，可根据具体需求进一步扩展和优化。

优化与故障排除

性能调优清单

索引类型选择：根据数据量和查询频率选择合适的索引。
批量插入：避免单条插入，使用批量插入提高效率。
内存优化：适当调整索引参数以减少内存占用。
缓存机制：对高频查询结果进行缓存。

常见问题与解决方案

问题	解决方案
向量维度不匹配	检查模型输出维度是否一致
查询超时	增加超时时间或优化索引
内存溢出	减少索引分片数或升级硬件
插入失败	检查主键唯一性约束

总结与扩展思考

未来趋势

多模态检索：支持文本、图像、音频等多种数据类型的统一检索。
混合搜索：结合关键词搜索与向量搜索，提升搜索准确性。
边缘计算：向量数据库将在边缘设备中得到更多应用。

学习资源推荐

Pinecone 官方文档
Milvus 官方文档
LangChain 官方文档
OpenAI Embeddings API 文档

如果你喜欢这篇文章，请点赞、收藏，并分享给你的朋友！欢迎关注我的专栏《AI大模型应知应会100篇》，获取更多实用技术干货！

《AI大模型应知应会100篇》第60篇：Pinecone 与 Milvus，向量数据库在大模型应用中的作用

第60篇：Pinecone与Milvus，向量数据库在大模型应用中的作用摘要本文将系统比较Pinecone与Milvus两大主流向量数据库的技术特点、性能表现和应用场景，提供详细的接入代码和最佳实践，帮助开发者为大模型应用选择并优化向量存储解…...

编程日记 2025/7/20 11:23:16

如何在通义灵码里使用 MCP 能力？

通义灵码编程智能体支持 MCP 工具使用，根据用户需求描述，通过模型自主规划，实现 MCP 工具调用，并深度集成国内最大的 MCP 中文社区——魔搭 MCP 广场，涵盖开发者工具、文件系统、搜索、地图等十大热门领域 2400 MCP 服…...

编程日记 2025/7/15 17:48:24

关于mac配置hdc(鸿蒙)

关于mac配置hdc(鸿蒙) 在最开始配置的hdc -v时候老是出现格式不匹配于是乎在网上找官网也不行，最后在csdn上找到了这篇文章Mac配置hdc才有的头绪环境变量的问题自己做一个简单的总结首先在访达里面打开ide 打开之后输入下面的命令，一步一步的找…...

编程日记 2025/7/7 21:36:32

几何_平面方程表示_点+向量形式

三维平面方程可以写成： π : n ⊤ X d 0 \boxed{\pi: \mathbf{n}^\top \mathbf{X} d 0} π:n⊤Xd0 📐 一、几何直观解释 ✅ 平面是“法向量平面上一点”定义的集合一个平面可以由： 一个单位法向量 n ∈ R 3 \mathbf{n} \in \mat…...

编程日记 2025/7/19 16:29:06

iOS safari和android chrome开启网页调试与检查器的方法

手机开启远程调试教程（适用于 Chrome / Safari） 前端移动端调试指南｜适用 iPhone 和 Android｜WebDebugX 出品本教程将详细介绍如何在 iPhone 和 Android 手机上开启网页检查器，配合 WebDebugX 实现远程调试。教程包含…...

编程日记 2025/7/20 11:02:14

Matlab 模糊pid控制的永磁同步电机PMSM

1、内容简介 Matlab 226-模糊pid控制的永磁同步电机PMSM 可以交流、咨询、答疑 2、内容说明略 3、仿真分析略 4、参考论文略基于模糊控制的高精度伺服速度控制器的设计与实现_刘京航...

编程日记 2025/7/20 11:09:56

ActiveMQ 高级特性：延迟消息与优先级队列实战（二）

三、优先级队列实战 3.1 优先级队列概念与应用场景优先级队列是一种特殊的队列，与普通队列按照先进先出（FIFO）的规则不同，优先级队列中的元素按照其优先级进行排序，在消费消息时，高优先级的消息会优先被…...

编程日记 2025/7/16 9:31:26

ActiveMQ 高级特性：延迟消息与优先级队列实战（一）

引言在当今的分布式系统开发中，消息中间件扮演着至关重要的角色，而 ActiveMQ 作为一款广泛使用的开源消息中间件，凭借其丰富的特性和良好的性能，深受开发者的青睐。它支持多种消息模型，如点对点和发布 / 订阅&#x…...

编程日记 2025/7/20 11:04:45

动手学深度学习12.4.硬件-笔记练习（PyTorch）

以下内容为结合李沐老师的课程和教材补充的学习笔记，以及对课后练习的一些思考，自留回顾，也供同学之人交流参考。本节课程地址：31 深度学习硬件：CPU 和 GPU【动手学深度学习v2】_哔哩哔哩_bilibili 本节教材地址&am…...

编程日记 2025/7/20 11:13:14

LAN-402 全国产信号采集处理模块K7-325T（4通道采集）

UD LAN-402全国产化信号处理模块最多支持2通道16bit125Msps的短波采集（或2通道14bit250Msps超短波采集）、2通道16bit310Msps超短波采集，可选配XC7K325T、XC7K410T、JFM7K325T、JFM7K410T FPGA芯片，对外支持PCIe2.0x8接口、千兆网、…...

编程日记 2025/7/20 11:03:30

关于大语言模型的困惑度（PPL）指标优势与劣势

1. 指标本身的局限性与人类感知脱节： PPL衡量的是模型对词序列的预测概率（基于交叉熵损失），但低困惑度未必对应高质量的生成结果。例如： 模型可能生成语法正确但内容空洞的文本（PPL低但质量差）…...

编程日记 2025/7/19 11:40:00

[Spring AOP 8] Spring AOP 源码全流程总结

Spring AOP总结更美观清晰的版本在：Github 前面的章节： [Spring AOP 1] 从零开始的JDK动态代理 [Spring AOP 2] 从零开始的CGLIB动态代理 [Spring AOP 3] Spring选择代理 [Spring AOP 4] Spring AOP 切点匹配 [Spring AOP 5] 高级切面与低级切面&#…...

编程日记 2025/7/13 9:41:57

通信网络编程——JAVA

1.计算机网络 IP 定义与作用 ：IP 地址是在网络中用于标识设备的数字标签，它允许网络中的设备之间相互定位和通信。每一个设备在特定网络环境下都有一个唯一的 IP 地址，以此来确定其在网络中的位置。分类 ：常见的 IP 地址分为 I…...

编程日记 2025/7/19 18:42:41

支持向量机算法

支持向量机（Support Vector Machine，SVM）作为机器学习领域中一颗耀眼的明星，凭借其卓越的分类与回归能力，在众多算法中独树一帜。它宛如一位精准的边界守护者，通过巧妙地构建超平面，将不同类别的…...

编程日记 2025/7/20 11:02:13

Redis集群模式、持久化、过期策略、淘汰策略、缓存穿透雪崩击穿问题

Redis四种模式单节点模式架构：单个Redis实例运行在单台服务器。优点： 简单：部署和配置容易，适合开发和测试。低延迟：无网络通信开销。缺点： 单点故障&…...

编程日记 2025/7/20 10:34:15

【WPF】Opacity 属性的使用

在WPF（Windows Presentation Foundation）中，Opacity 属性是定义一个元素透明度的属性，其值范围是从 0.0（完全透明）到 1.0（完全不透明）。由于 Opacity 是在 UIElement 类中定义的&…...

编程日记 2025/7/19 11:09:28

编程题 02-线性结构3 Reversing Linked List【PAT】

文章目录题目输入格式输出格式输入样例输出样例题解解题思路完整代码编程练习题目集目录题目 Given a constant K K K and a singly linked list L L L, you are supposed to reverse the links of every K K K elements on L L L. For example, given L being 1 → …...

编程日记 2025/7/19 18:42:41

集成指南：如何采用融云 Flutter IMKit 实现双端丝滑社交体验

在移动应用开发领域，跨平台框架的广泛应用已成为一种趋势。融云跨平台方案持续升级，近期正式上线 Flutter IMKit，uni-app IMKit 也将紧随其后向广大开发者开放。覆盖两大跨平台核心框架，一套代码即可支持 Android、iOS 双端丝滑…...

编程日记 2025/7/19 21:50:56

使用vite重构vue-cli的vue3项目

一、修改依赖首先修改 package.json，修改启动方式与相应依赖移除vue-cli并下载vite相关依赖，注意一些peerDependency如fast-glob需要手动下载 # 移除 vue-cli 相关依赖 npm remove vue/cli-plugin-babel vue/cli-plugin-eslint vue/cli-plugin-rout…...

编程日记 2025/7/20 11:16:43

LeetCode 2094.找出 3 位偶数：遍历3位偶数

【LetMeFly】2094.找出 3 位偶数：遍历3位偶数力扣题目链接：https://leetcode.cn/problems/finding-3-digit-even-numbers/ 给你一个整数数组 digits ，其中每个元素是一个数字（0 - 9）。数组中可能存在重复元素。你…...

编程日记 2025/7/20 11:01:04

FLASH闪存（擦除、编译）

FLASH闪存文章目录 FLASH闪存1.存储器映像位置2.FLASH简介3.闪存模块组织3.2闪存的共性： 4.FLASH基本结构4.1FLASH解锁4.2使用指针访问寄存器 5.选项字节5.1选项字节编程5.2选项字节擦除 6.相关函数介绍7.读取内部FLASH（实操）7.1接线图7.2工…...

编程日记 2025/7/16 16:55:55

企业即时通讯软件，私有化安全防泄密

在数字化转型与信创战略双重驱动下，企业对即时通讯工具的需求已从基础沟通转向安全可控、高效协同的综合能力。BeeWorks作为一款专为政企设计的私有化即时通讯与协同办公平台，凭借其全链路安全架构、深度国产化适配及灵活的业务集成能力，成为…...

编程日记 2025/7/15 15:27:38

直方图特征结合 ** 支持向量机图片分类

一、核心技术框架 1. 直方图特征原理颜色直方图：统计图像中每个颜色区间（如 RGB 通道）的像素数量，反映颜色分布。HOG 直方图（方向梯度直方图）：统计图像局部区域的梯度方向分布，捕…...

编程日记 2025/7/20 11:07:53

【prometheus+Grafana篇】基于Prometheus+Grafana实现windows操作系统的监控与可视化

💫《博主主页》： 🔎 CSDN主页 🔎 IF Club社区主页 🔥《擅长领域》：擅长阿里云AnalyticDB for MySQL(分布式数据仓库)、Oracle、MySQL、Linux、prometheus监控；并对SQLserver、NoSQL(MongoDB)有了…...

编程日记 2025/7/20 11:06:45

PyTorch实战（4）——卷积神经网络(Convolutional Neural Network, CNN)详解

PyTorch实战（4）——卷积神经网络详解 0. 前言1. 全连接网络的缺陷2. 卷积神经网络基本组件2.1 卷积2.2 步幅和填充2.3 池化2.3 卷积神经网络完整流程 3. 卷积和池化相比全连接网络的优势4. 使用 PyTorch 构建卷积神经网络4.1 使用 PyTorch 构建 CNN 架构…...

编程日记 2025/7/19 17:04:50

【Python】Python常用控制结构详解：条件判断、遍历与循环控制

Python提供了多种控制结构来处理逻辑判断和循环操作，包括if-else条件分支、switch替代方案、遍历方法以及循环控制语句break和continue。以下是对这些功能的详细说明及示例： 一、条件判断：if-else与多分支结构单分支结构 • 语法&#xff1…...

编程日记 2025/7/8 17:12:15

在Linux中安装JDK并且搭建Java环境

1.首先准备好JDK的Linux的安装包 2.打开Linux,进入root的文件夹,直接拖入即可 3.输入解压命令,后面指定的是位置（注意不要填写错误，就填写这个） 4.之后进入我们安装的jdk的文件利用pwd命令，展示我们安装的目录，之后…...

编程日记 2025/7/19 8:16:26

理解多智能体深度确定性策略梯度MADDPG算法:基于python从零实现

引言：多智能体强化学习（MARL） 多智能体强化学习（MARL）将强化学习拓展到多个智能体在共享环境中相互交互的场景。这些智能体可能相互合作、竞争，或者目标混杂。MARL 引入了单智能体设置中不存在的独特挑战。…...

编程日记 2025/7/17 18:04:41

【AI大语言模型本质分析框架】

AI大语言模型本质分析框架 ——从教育危机到智能本质的七层递进式解构第一层：现象观察——阴（显性危机）与阳（隐性变革）的共存观点1（阴）：AI作弊泛滥，传统教育体系崩溃…...

编程日记 2025/7/17 5:48:29

算法模型部署后_python脚本API测试指南-记录3

API 测试指南服务运行后，可以通过以下方式测试： Curl: curl -X POST -F "file./test_dataset/surface/surface57.png" http://<服务器IP>:9000/api/v1/predictPython 脚本: (参考 svm_request测试.py) import requestsurl http://…...

编程日记 2025/7/18 11:26:36

鸿蒙（HarmonyOS）应用开发入门教程

目录第一章：鸿蒙系统简介 1.1 什么是鸿蒙系统？ 1.2 鸿蒙系统架构第二章：开发环境搭建 2.1 安装DevEco Studio 步骤1：下载与安装步骤2：首次配置步骤3：设备准备 2.2 创建第一个项目第三章：鸿蒙应用开发基础 3.1 核心概念：Ability与AbilitySlice 示例代码…...

编程日记 2025/7/18 22:39:03

MIT XV6 - 1.6 Lab: Xv6 and Unix utilities -uptime

接上文 MIT XV6 - 1.5 Lab: Xv6 and Unix utilities - xargs 第一章持续有点久了，虽然肯定有些特点和细节还没注意到，但这次的主要目的是学习内核部分，决定水一篇然后进入第二章节 uptime 第一章的最后一个实验，选做性质&#xf…...

编程日记 2025/7/14 13:04:05

Python语言在地球科学交叉领域中的应用——从数据可视化到常见数据分析方法的使用【实例操作】

前言： Python是功能强大、免费、开源，实现面向对象的编程语言，Python能够运行在Linux、Windows、Macintosh、AIX操作系统上及不同平台（x86和arm），Python简洁的语法和对动态输入的支持，再加上解释…...

编程日记 2025/7/16 19:52:25

flutter 的 json序列化和反序列化

一、json转实体 Instantly parse JSON in any language | quicktype 二、实体中的toJson和fromJson 实现官方推荐的两个插件(个人觉得一个实体会多一个.g.dart 文件太多了，不喜欢) json_annotation json_serializable 三、使用 dart_json_mapper 实现上面的功…...

编程日记 2025/7/15 17:10:00

什么是数据集市（Data Mart）？

数据集市（Data Mart）是数据仓库（Data Warehouse）的一个子集，专门针对某个特定业务部门、业务线或主题领域，存储和管理该部门或领域所需的特定数据。它通常包含从企业范围的数据仓库中抽取、筛选和汇总的部分…...

编程日记 2025/7/20 5:40:03

从攻击者角度来看Go1.24的路径遍历攻击防御

目录一、具体攻击示例程序攻击步骤： 二、为什么攻击者能成功？ 分析类比理解总结三、TOCTOU 竞态条件漏洞 1、背景：符号链接遍历攻击 2. TOCTOU 竞态条件漏洞 3. 另一种变体：目录移动攻击 4. 问题的核心四、防…...

编程日记 2025/7/18 8:19:22

[ARM][汇编] 01.基础概念

目录 1.全局标号 1.1.使用方法 1.1.1.声明全局标号 1.1.2.定义全局标号 1.1.3.引用全局标号 1.2.全局标号与局部标号的区别 1.3.注意事项 2.局部标号 2.1.使用方法 2.1.1.定义局部标号 2.1.2.跳转引用 2.2.局部标号与全局标号的对比 2.3.注意事项 3.符号定义伪指…...

编程日记 2025/7/15 13:57:27

杭州电商全平台代运营领军者——品融电商

杭州电商全平台代运营领军者——品融电商：以“效品合一”驱动品牌全域增长在电商行业竞争日益白热化的当下，品牌如何突破流量焦虑、实现长效增长？作为中国领先的品牌化电商服务商，杭州品融电商（PINKROON）…...

编程日记 2025/7/19 16:31:03

02.Golang 切片（slice）源码分析（一、定义与基础操作实现）

Golang 切片（slice）源码分析（一、定义与基础操作实现） 注意当前go版本代码为1.23 一、定义 slice 的底层数据是数组，slice 是对数组的封装，它描述一个数组的片段。两者都可以通过下标来访问单个元素。数…...

编程日记 2025/7/17 14:14:11

当生产了~/qt-arm/bin/qmake，可以单独编译其他-源码的某个模块，如下，编译/qtmultimedia

cd ~/qt-everywhere-src-5.15.2/qtmultimedia # 设置交叉编译器和 qmake 路径 export CC/usr/bin/aarch64-linux-gnu-gcc export CXX/usr/bin/aarch64-linux-gnu-g export QMAKE~/qt-arm/bin/qmake # 使用已安装的 qmake export QT_INSTALL_PREFIX~/qt-arm # 安装路径 # 配…...

编程日记 2025/7/18 7:46:01

WordPress 网站上的 jpg、png 和 WebP 图片插件

核心功能 1. 转换 AVIF 并压缩 AVIF 将您 WordPress 网站上的 jpg、png 和 WebP 图片转换为 AVIF 格式，并根据您设置的压缩级别压缩 AVIF 图片。如果原始图片已经是 WordPress 6.5 以上支持的 AVIF 格式，则原始 AVIF 图片将仅被压缩。 2. 转换 WebP 并…...

编程日记 2025/7/15 11:37:05

构造+简单树状

昨日的牛客周赛算是比较简单的，其中最后一道构造题目属实眼前一亮。倒数第二个题目也是一个很好的模拟题目（考验对二叉树的理解和代码的细节） 给定每一层的节点个数，自己拟定一个父亲节点，构造一个满足条件的二叉树。…...

编程日记 2025/7/19 16:00:17

Flask支持哪些日志框架

目录 ✅ Flask 默认支持的日志框架 ✅ 默认推荐：logging（标准库） ✅ 进阶推荐：Loguru（更优雅的日志库） ✅ Flask 日志级别说明（与标准库一致） ✅ 生产环境建议 ✅ 总结推荐在 Flask 中，默认的日志系统是基于 Python 标准库 logging 模块构建的。 ✅ Flask 默认…...

编程日记 2025/7/20 5:16:29

健康养生指南：解锁活力生活的科学密码

健康是人生最珍贵的财富，在快节奏的现代生活中，掌握科学的养生方法至关重要。虽然不借助中医理念，我们依然可以从饮食、运动、睡眠等多个方面入手，打造健康生活方式。合理的饮食是健康的基石。遵循均衡饮食原则，保证每…...

编程日记 2025/7/19 11:16:39

SAR图像压缩感知

SAR图像压缩感知 matlab代码对应着汕大闫老师的那本压缩感知及其应用，有需要的可以看一下！！ SAR图像压缩感知/baboon.bmp , 66616 SAR图像压缩感知/camera.bmp , 66616 SAR图像压缩感知/DWT.m , 1265 SAR图像压缩感知/Gauss.m , 373 SAR图像…...

编程日记 2025/7/14 16:58:09

定时器设计

定时器设计的必要性服务器中的定时器设计具有多方面的必要性，主要体现在以下几个关键方面： 任务调度与管理定时任务执行：服务器常常需要执行一些定时性的任务，如定时备份数据、定时清理缓存、定时更新系统日志等。通过定时器可…...

编程日记 2025/7/15 8:05:40

Spring Boot整合Kafka实战指南：从环境搭建到消息处理全解析

一、环境准备安装 Kafka 下载 Kafka：从 Apache Kafka 官网下载对应版本的 Kafka。解压并启动 Kafka： # 启动 Zookeeper（Kafka 依赖 Zookeeper） bin/zookeeper-server-start.sh config/zookeeper.properties# 启动 Kafka bin/ka…...

编程日记 2025/7/15 23:11:12

(done) 补充：xv6 的一个用户程序 init 是怎么启动的？它如何启动第一个 bash ?

先看 main.c 从函数名来看，比较相关的就 userinit() 和 scheduler() #include "types.h" #include "param.h" #include "memlayout.h" #include "riscv.h" #include "defs.h"volatile static int started 0;//…...

编程日记 2025/7/14 18:05:59

AI 搜索引擎 MindSearch

背景 RAG是一种利用文档减少大模型的幻觉，AI搜索也是 AI 搜索引擎 MindSearch 是一个开源的 AI 搜索引擎框架，具有与 Perplexity.ai Pro 相同的性能。您可以轻松部署它来构建您自己的搜索引擎，可以使用闭源 LLM（如 GPT、Claude…...

编程日记 2025/7/16 1:40:48

HTML简单语法标签（后续实操：云备份项目）

以下是一些 HTML 的简单语法标签及其功能介绍： 基本结构标签 <!DOCTYPE html>：声明文档类型为 HTML5<html>：HTML 文档的根标签<head>：包含文档元数据（如标题、字符编码等）<title>…...

编程日记 2025/7/15 8:46:25

第60篇：Pinecone与Milvus，向量数据库在大模型应用中的作用

摘要

引言：为什么需要向量数据库？

什么是向量数据库？

向量数据库的应用场景

核心概念与知识点

1. 向量数据库基础

向量嵌入基础

相似性搜索原理

索引类型对比

向量数据库与传统数据库的区别

Pinecone实战应用

账户设置与索引创建

安装依赖

初始化 Pinecone 并创建索引

插入向量

相似性搜索

输出示例

Milvus实战应用

部署与集群配置

安装 Milvus

Python 客户端连接

连接 Milvus 并插入数据

向量搜索

输出示例

应用架构与集成

与 LangChain 集成

安装依赖

Pinecone 集成

Milvus 集成

性能与选型对比

实战案例

案例一：企业搜索引擎

案例二：个性化推荐

实战案例：完整代码与部署指南

案例一：企业搜索引擎（Milvus + Elasticsearch + LangChain）

1. 系统架构设计

2. 技术栈要求

3. Milvus向量数据库初始化

4. Elasticsearch关键词索引创建

5. 向量化处理服务

6. LangChain混合搜索实现

7. 部署指南

案例二：个性化推荐系统（Pinecone + 用户行为分析）

1. 系统架构设计

2. 技术栈要求

3. Pinecone初始化

4. 用户行为向量化

5. 推荐引擎实现

6. API接口实现

7. 部署指南

扩展建议

1. 性能优化

2. 安全加固

3. 监控方案

4. 可扩展性设计

优化与故障排除

性能调优清单

常见问题与解决方案

总结与扩展思考

未来趋势

学习资源推荐

相关文章：