SEO(Search Engine Optimization,搜索引擎优化)相关知识点
SEO(Search Engine Optimization)是指搜索引擎优化,是计算机领域中通过技术手段和内容策略,提升网站在搜索引擎(如Google、Bing、百度)中自然(非付费)排名的系统性方法。是一种通过优化网站内容、结构和技术元素,以提高网站在搜索引擎结果页面(SERP)上的排名,从而增加网站流量和曝光度的过程。
一、Canonical标签
1. Canonical 标签
-
定义:HTML 中通过
<link rel="canonical">
指定的标签,用于向搜索引擎声明当前页面的“规范版本”(即原始内容来源)。 -
核心作用:解决重复内容问题,避免多个 URL 因内容相同导致搜索引擎权重分散。
详细解释:规范标签是告诉搜索引擎哪个URL是原始内容,防止重复内容的问题。例如,如果有多个URL显示相同的内容,使用规范标签可以指定主URL,避免搜索引擎将其视为重复内容,影响排名。比如,网站可能有多个URL指向相同的内容,如带参数的不同版本,或者移动端和桌面端的URL不同。这时候规范标签就很重要了。再比如,一个电商网站可能有多个排序方式或过滤条件生成不同的URL,但内容相同。或者,一个博客可能有多个路径访问同一篇文章。在这些情况下,规范标签能帮助指定正确的URL。
2. 典型使用场景
场景 1:同一内容多 URL 访问
-
示例:
-
https://example.com/product
-
https://example.com/product?color=red
-
https://example.com/product/print
-
-
解决方案:在所有变体页面中添加 Canonical 标签指向主 URL。
场景 2:分页内容
-
示例:
-
https://example.com/blog?page=1
-
https://example.com/blog?page=2
-
-
解决方案:每个分页的 Canonical 指向自身,避免被合并。
场景 3:跨域名重复内容
-
示例:A 网站转载 B 网站的文章。
-
解决方案:转载页面添加 Canonical 指向 B 网站的原始文章 URL。
3. 如何正确实现 Canonical 标签?
-
方法 1:HTML 内嵌入
<head><link rel="canonical" href="https://example.com/original-page" /> </head>
方法 2:HTTP 头部声明(适用于非 HTML 文件,如 PDF)
HTTP/1.1 200 OK Link: <https://example.com/original-document.pdf>; rel="canonical"
方法 3:CMS/SaaS 平台自动生成
-
WordPress:SEO 插件(如 Yoast SEO)自动添加。
-
Shopify:系统默认处理产品页参数化 URL 的 Canonical。
4. 最佳实践与注意事项
✅ 必须遵守的规则
- 绝对路径:使用完整的 URL(包含
https://
)。<!-- 正确 --> <link rel="canonical" href="https://example.com/page" /> <!-- 错误 --> <link rel="canonical" href="/page" />
-
自指向规范:规范页面自身也需包含 Canonical 标签指向自己。
-
一致性:确保 Canonical URL 与其他 SEO 标记(如 Open Graph 的
og:url
)一致。
❌ 常见错误
-
循环引用:A 页面指向 B,B 又指向 A。
-
指向 404 页面:规范 URL 必须是可访问的。
-
多 Canonical 标签:一个页面只能有一个规范标签。
5. Canonical 与 301 重定向的区别
特性 | Canonical 标签 | 301 重定向 |
---|---|---|
用户可见性 | 无跳转,URL 不变 | 跳转后 URL 变更 |
权重传递 | 部分权重聚合到规范页 | 全部权重传递到新页面 |
适用场景 | 需保留多个 URL 但内容相同 | 永久废弃旧 URL |
6. 特殊场景处理
移动端与桌面端
-
如果移动端和桌面端 URL 不同,但内容相同:
-
移动端页面 Canonical 指向桌面端 URL。
-
桌面端页面 Canonical 指向自身。
-
AMP 页面
- AMP 页面必须通过 Canonical 指向原始非 AMP 页面:
<!-- AMP 页面中 --> <link rel="canonical" href="https://example.com/original-article" />
AMP 页面(Accelerated Mobile Pages)
-
定义:由 Google 主导的开源框架,旨在通过精简 HTML/CSS/JS 实现移动端页面秒开。
-
核心目标:解决移动端加载速度慢的问题,提升用户体验和搜索排名。
-
技术原理:
-
限制自定义 JavaScript,强制使用异步加载。
-
预加载关键资源,优化渲染路径。
-
内容托管在 Google AMP Cache(CDN 加速)。
-
AMP 页面 vs 普通 HTML 页面
特性 | AMP 页面 | 普通 HTML 页面 |
---|---|---|
加载速度 | 通常 <1s | 依赖网络和优化程度 |
JavaScript 限制 | 仅允许 AMP 官方组件 | 无限制 |
CSS | 内联且最大 75KB | 可外链,大小不限 |
图片加载 | 必须使用 | 标准 |
SEO 优势 | 曾优先展示于 Google Top Stories | 依赖常规优化 |
二、bing的indexNow
提升搜索引擎内容索引效率的技术协议,以下是其核心要点:
1. 核心功能
- 即时通知机制:网站管理员可通过API主动通知Bing等搜索引擎内容的更新、新增或删除,无需等待爬虫主动发现。
- 简化流程:仅需提交URL的哈希值(如SHA-256),无需附带完整内容,降低技术门槛和资源消耗。
2. 优势与价值
- 加速索引:内容变更后可在数分钟内被Bing收录,显著缩短传统爬虫的延迟。
- 提升可见性:快速索引使网页更早进入搜索结果,增加曝光机会和潜在流量。
- 节能高效:减少搜索引擎不必要的爬取次数,优化网络资源利用。
3. 应用与兼容性
- WordPress集成:微软提供官方插件,可自动检测页面变动并提交至IndexNow,支持批量操作和提交状态追踪。
- 多引擎支持:除Bing外,Yandex、Seznam.cz、Naver等搜索引擎已接入协议;Google也于2025年4月确认进入测试阶段
三、TKD
TKD 是网页 SEO 优化的三大核心元标签(Meta Tags),直接影响搜索引擎对页面内容的理解和排名,同时影响用户的点击决策。
1. Title(标题)
- 定义
网页的标题标签(<title>
),显示在浏览器标签页和搜索结果中,是用户对页面的第一印象。 - 作用
- 搜索引擎优化:搜索引擎判断页面主题的核心依据,直接影响排名。
- 用户点击率:吸引用户点击的关键因素,需简洁且有吸引力。
- 优化技巧
- 长度控制:50-60字符(避免被截断),例如:“SEO入门指南:从基础到实战 | XX博客”。
- 关键词前置:核心关键词放在标题前部,提升相关性。
- 唯一性:每个页面的标题需唯一,避免重复。
- 品牌露出:末尾添加品牌名(如“| 品牌名”),增强辨识度。
2. Keywords(关键词)
- 定义
元标签<meta name="keywords">
,用于声明页面相关的关键词(早期SEO的关键元素)。 - 作用
- 历史背景:过去搜索引擎依赖此标签判断内容主题,现因滥用(堆砌关键词)已弱化其权重。
- 辅助参考:部分搜索引擎仍可能参考,但非排名核心因素。
- 优化技巧
- 精准性:选择3-5个与内容强相关的关键词,避免无关词。
- 自然组合:如“SEO优化, 搜索引擎排名, 关键词研究”。
- 避免重复:禁止堆砌(如“SEO, SEO优化, SEO技术”)。
3. Description(描述)
- 定义
元标签<meta name="description">
,概括页面内容,常显示在搜索结果摘要中。 - 作用
- 用户引导:影响用户点击率,需清晰传达页面价值。
- 补充SEO:搜索引擎可能提取描述中的关键词辅助理解内容。
- 优化技巧
- 长度控制:150-160字符,完整展示核心信息。
- 包含关键词:自然融入主关键词,例如:“学习SEO优化技巧,掌握搜索引擎排名提升方法,涵盖关键词研究、内容优化等实战指南。”
- 行动号召:使用行动词(如“立即获取”、“免费下载”),提升点击意愿。
4. TKD 优化注意事项
-
避免以下常见错误
- 标题重复:全站多个页面使用相同标题,导致搜索引擎难以区分优先级。
- 关键词堆砌:如标题“SEO, SEO优化, SEO技术, SEO培训”,易被判定为作弊。
- 描述与内容不符:描述中承诺的内容未在页面中体现,损害用户体验和信任。
-
与页面内容强相关
- TKD 需精准反映页面主题,若内容与TKD不符,可能导致搜索引擎降权。
-
适配移动端与结构化数据
- 移动端标题和描述需更简洁,避免被截断。
- 结合结构化数据(如
og:title
,og:description
),提升社交媒体分享效果。
5. TKD 与 SEO 的关系
- 基础但非唯一:TKD 是SEO的入门要素,但排名还依赖内容质量、外链、用户体验等。
- 动态调整:根据搜索引擎算法更新(如Google BERT更注重自然语言)优化标题和描述,减少机械式关键词填充。
6. 工具推荐
- 标题与描述长度检查
- SERP Simulator:模拟搜索结果中的显示效果。
- 关键词研究
- Google Keyword Planner、Ahrefs、SEMrush:挖掘高价值关键词。
- 内容与TKD一致性检测
- Screaming Frog:批量分析全站TKD的重复和缺失问题。
四、OG协议(Open Graph Protocol)
OG协议(开放图谱协议)是一种由Facebook推出的元数据标记标准,旨在将网页转化为社交媒体平台中的“富媒体对象”,通过结构化信息控制内容在社交分享时的呈现形式,显著提升传播效率和用户体验。
核心功能与技术实现
1. 定义富媒体对象
- 通过HTML的
<meta property="og:xxx">
标签声明页面属性,包括标题、描述、图片、类型(如文章、视频)、URL等关键信息。 - 示例标签:
-
<meta property="og:title" content="OG协议详解"> <meta property="og:image" content="thumbnail.jpg"> <meta property="og:type" content="article">
-
标准化社交分享
- 社交媒体平台(如Facebook、Twitter、LinkedIn)抓取OG标签内容,自动生成包含标题、缩略图、描述的预览卡片,替代传统纯文本链接。
- 国内平台(微信、微博)亦支持该协议,确保跨平台内容展示一致性。
2. 应用场景与优势
-
典型场景
- 内容传播:博客文章、新闻资讯通过OG标签生成图文并茂的分享卡片,提高点击率。
- 多媒体展示:视频/音乐页面嵌入播放器预览,用户可直接在社交平台互动。
- 电商推广:商品详情页通过OG协议展示价格、主图,缩短用户决策路径。
-
核心优势
- 增强视觉吸引力:定制化预览内容比纯链接更易吸引用户注意力,点击率提升可达30%以上。
- 精准品牌曝光:通过统一品牌Logo和风格化图片强化识别度。
- 跨平台兼容性:成为主流社交媒体的通用标准,减少多平台适配成本。
3. 技术挑战与解决方案
-
动态内容适配问题
- 问题:单页应用(SPA)通过JavaScript动态设置OG标签可能导致社交爬虫无法正确抓取。
- 解决方案:
- 服务器端渲染(SSR)预生成含OG标签的HTML。
- 使用中间页跳转,确保首次请求返回完整的元数据。
-
数据更新延迟
- 优化方案:结合Bing IndexNow等实时索引协议,主动通知平台内容变更,缩短生效时间。
4. 协议扩展与未来发展
- 类型扩展:支持
article
、video
、product
等20余种对象类型,覆盖更多垂直场景。 - 语义化增强:与Schema.org等结构化数据标准融合,提升搜索引擎与社交平台的内容理解能力
五、LDJSON(Linked Data in JSON)
JSON-LD(JavaScript Object Notation for Linked Data)是一种基于JSON的轻量级结构化数据格式,旨在将语义化数据嵌入网页,帮助搜索引擎、应用程序和知识图谱更高效地解析内容,从而提升网页在搜索结果中的展示效果和交互体验
核心特性与技术原理
1. 语义化标记
-
词汇表定义:通过
@context
属性引入外部词汇(如Schema.org),明确数据字段的语义,例如"@context": "https://schema.org"
。 -
实体类型标识:使用
@type
标注数据主体类型(如文章、产品、事件),例如"@type": "Article"
。 -
唯一标识符:通过
@id
为实体分配全局唯一标识符,支持跨数据源链接。
2. 结构化嵌套与关联
-
支持嵌套JSON对象和数组,表达复杂关系。例如,一篇文章可包含作者(嵌套
Person
类型)、发布日期和关联图片。 -
示例片段:
{"@context": "https://schema.org","@type": "Article","headline": "JSON-LD教程","author": {"@type": "Person","name": "张三"},"datePublished": "2025-04-24" }
3. 搜索引擎优化(SEO)
-
主流搜索引擎(Google、Bing)优先解析JSON-LD数据,生成富媒体摘要(Rich Snippets),如星级评分、商品价格、事件日程等,点击率可提升20%-30%。
4. 核心优势
(1)提升索引效率
结构化数据直接标注内容实体(如产品、地点),减少搜索引擎的语义推断成本,加速索引过程。
(2)跨平台兼容性
与RDF(资源描述框架)兼容,支持知识图谱互联互通,例如将电商数据与第三方评论平台关联。
(3)开发友好性
基于JSON语法,无需改变现有HTML结构,可直接在<script type="application/ld+json">
标签内嵌入。
5. 典型应用场景
(1)网页内容增强
电商页面:标注商品价格、库存状态、评价评分,触发购物类富媒体卡片。
新闻/博客:标识文章作者、发布时间、摘要,优化搜索引擎摘要展示。
(2)多语言与本地化
通过@language
属性声明文本语言,支持多语言内容的分发与索引。
(3)动态数据集成
与单页应用(SPA)结合,动态生成JSON-LD数据,确保搜索引擎爬虫获取最新内容。
6. 最佳实践与注意事项
(1)数据唯一性
避免同一页面内重复定义相同实体的JSON-LD数据,防止搜索引擎混淆。
(2)结合Schema.org词汇
优先使用Schema.org标准词汇表,确保语义通用性。
(3)验证与调试
使用Google结构化数据测试工具或Bing Markup Validator检查语法错误和兼容性。
六、Robots.txt
Robots.txt 是网站根目录下的文本文件,用于指导搜索引擎爬虫(如Googlebot、Baiduspider)的抓取行为,通过声明允许或禁止访问的页面路径,优化网站内容的索引效率并保护敏感信息。
1. 定义与核心功能
-
核心作用
-
控制抓取范围:明确告知爬虫哪些目录或文件可抓取(
Allow
),哪些需禁止(Disallow
),例如禁止访问后台管理页面(Disallow: /admin/
)。 -
提升爬取效率:通过限制无关页面抓取,减少服务器负载和爬虫资源浪费。
-
-
文件定位
-
路径固定:必须命名为
robots.txt
,并放置于网站根目录(如https://example.com/robots.txt
)。 -
全局适用性:针对所有搜索引擎爬虫,也可通过
User-agent
指定特定爬虫(如User-agent: Googlebot
)。
-
2. 文件结构与语法规则
-
基础语法
-
User-agent:定义规则适用的爬虫名称,
*
表示所有爬虫。 -
Disallow/Allow:声明禁止或允许的路径(支持通配符
*
和$
),例如:User-agent: * Disallow: /private/ Allow: /public/
-
Sitemap 声明:提供网站地图链接,辅助爬虫快速发现内容(如
Sitemap: https://example.com/sitemap.xml
)。
-
-
优先级规则
-
最长路径优先:若规则冲突,爬虫优先遵循更具体的路径声明。
-
顺序敏感:
Allow
可覆盖同作用域下的Disallow
,但需注意指令顺序。
-
3. 典型应用场景
-
隐私与安全保护
-
屏蔽后台、日志文件等敏感目录(如
Disallow: /wp-admin/
)。 -
防止重复内容抓取(如临时页面、参数化URL)。
-
-
SEO 优化
-
集中爬虫抓取权重,避免索引低质量页面(如测试环境、用户个人页)。
-
结合
Sitemap
提升重要页面的索引速度。
-
-
多爬虫差异化控制
-
针对不同搜索引擎设置规则,例如允许Google抓取图片但禁止Baidu:
User-agent: Googlebot-Image Allow: /images/ User-agent: Baiduspider Disallow: /images/
-
4. 注意事项与局限性
-
无强制约束力
-
恶意爬虫可能无视规则,需结合其他安全措施(如IP黑名单、登录验证)。
-
即使禁止抓取,若其他网站链接到被禁页面,搜索引擎仍可能索引其URL(需配合
noindex
元标签)。
-
-
常见错误规避
-
语法错误:避免大小写敏感、路径格式错误(如
Disallow: private/
应为Disallow: /private/
)。 -
过度屏蔽:误封关键页面可能导致搜索引擎流量下降。
-
-
验证工具
-
使用Google Search Console、Bing Webmaster Tools 检测文件有效性。
-
5. 示例与工具推荐
-
标准示例
User-agent: *
Disallow: /tmp/
Disallow: /search/
Allow: /public-articles/
Sitemap: https://example.com/sitemap.xml
下面的示例:
https://www.1688.com/robots.txt
https://jd.com/robots.txt
- 工具推荐
-
在线生成器:Robots.txt Generator(如 Screaming Frog)。
-
测试工具:Google Structured Data Testing Tool。
七、Sitemap
网站地图,是一个包含网站上所有页面链接的XML文件,提交给搜索引擎有助于加快网页的抓取和索引速度。Sitemap 是网站管理员向搜索引擎主动提供的结构化文件,用于明确展示网站所有页面的链接及关键元数据,从而优化搜索引擎爬虫的抓取效率,加速网页索引速度并提升内容覆盖率。
1. 定义与核心功能
-
基本定义
-
Sitemap 通常以 XML 格式(如
sitemap.xml
)存储于网站根目录,包含所有需被索引的页面 URL 及其附加信息(如更新频率、优先级)。 -
适用于复杂结构的网站,尤其是深层链接、动态页面或新站,帮助爬虫快速发现和抓取内容。
-
-
核心作用
-
加速索引:主动提交 Sitemap 可缩短新页面被搜索引擎发现的时间,尤其利于外链少或更新频繁的网站。
-
提升覆盖率:减少因网站结构复杂导致的爬虫遗漏,确保重要页面被收录。
-
优化资源分配:通过
priority
标签引导爬虫优先抓取高权重页面,避免资源浪费。
-
2. 文件类型与适用场景
-
主要格式
-
XML Sitemap:主流格式,支持添加元数据(如
<lastmod>
、<changefreq>
),适用于所有搜索引擎。 -
TXT Sitemap:仅包含纯文本 URL 列表,适用于简单需求(如 Yahoo 早期支持)。
-
HTML Sitemap:为用户提供可视化导航,改善用户体验,但无直接 SEO 作用。
-
-
适用场景
-
新站/低外链站点:通过主动提交弥补外链不足的抓取劣势。
-
大型/动态网站:解决页面数量多或动态参数导致的爬虫抓取盲区。
-
多媒体内容:支持扩展协议(如图片 Sitemap、视频 Sitemap),增强富媒体内容的索引能力。
-
3. 生成与提交方法
-
生成方式
-
工具自动化:使用 WordPress 插件、Screaming Frog 等工具自动生成并更新。
-
手动编写:遵循 XML 语法规则,确保包含
<urlset>
根标签及<url>
、<loc>
等子标签。 -
动态生成:结合服务器端脚本(如 PHP、Python)实时生成,适合高更新频率的网站。
-
-
提交流程
-
搜索引擎工具:通过 Google Search Console、Bing Webmaster Tools 等平台提交 XML 文件。
-
Robots.txt 声明:在
robots.txt
中添加Sitemap: https://example.com/sitemap.xml
,辅助爬虫发现。
-
4. SEO 优化与注意事项
-
优化策略
-
元数据精准化:合理设置
<priority>
(0.0-1.0)和<changefreq>
(如 daily/weekly),避免滥用导致信任度下降。 -
分片管理:大型网站可拆分多个 Sitemap 文件,并通过
sitemap-index.xml
统一索引。
-
-
常见错误规避
-
重复 URL:确保同一 URL 不在多个 Sitemap 中重复出现,防止爬虫混淆。
-
无效链接:定期检查并移除 404 或重定向页面,保持文件有效性。
-
格式错误:严格校验 XML 语法(如编码需为 UTF-8),避免解析失败。
-
5. 技术扩展与趋势
-
实时索引协议:结合 Google Indexing API、Bing IndexNow 实现秒级内容更新通知。
-
语义化增强:与 JSON-LD、Schema.org 等结构化数据融合,提升内容语义理解的精准度。
八、重定向(Redirect)
重定向是将用户或搜索引擎爬虫从一个 URL 自动引导至另一个 URL 的技术操作。在 SEO 中,正确配置重定向是维护网站权重、提升用户体验和避免内容冲突的核心策略。
1. 核心概念与类型
-
定义
-
重定向通过服务器端指令(HTTP 状态码)或客户端脚本(如 JavaScript)实现页面跳转,确保访问者或爬虫在请求原 URL 时被自动导向目标 URL。
-
-
主要类型
-
301 重定向(永久重定向):
-
作用:声明原 URL 已永久迁移至新地址,搜索引擎会将原页面的权重(Link Equity)转移至新页面。
-
适用场景:网站改版、域名更换、内容合并。
-
示例:
https://old.com/page
→https://new.com/page
。
-
-
302 重定向(临时重定向) & 307/308 重定向:
-
作用:临时将流量导向新 URL,不传递权重,适用于短期维护或 A/B 测试。
-
风险:滥用可能导致搜索引擎误判为“权重劫持”。
-
-
Meta Refresh(元刷新):
-
实现方式:通过 HTML
<meta>
标签设置跳转(如<meta http-equiv="refresh" content="0; url=https://new.com">
)。 -
缺点:搜索引擎可能视为低优先级跳转,且用户体验较差(页面闪烁)。
-
-
JavaScript 重定向:
-
实现方式:通过
window.location
或replace()
方法跳转。 -
局限性:部分爬虫可能无法解析 JavaScript,导致跳转失效。
-
-
2. SEO 核心价值与风险
-
正向作用
-
避免权重分散:
-
通过 301 重定向将失效页面的权重集中传递至新页面,防止因 404 错误导致排名下降。
-
-
维护用户体验:
-
自动跳转至有效页面,减少用户因死链或错误链接流失。
-
-
处理重复内容:
-
合并相似页面时,通过重定向统一索引目标,避免内容重复导致的排名竞争。
-
-
-
潜在风险
-
权重损失:
-
链式重定向(多次跳转,如 A→B→C)会稀释权重传递效率,建议直接跳转至最终 URL。
-
-
索引混乱:
-
错误使用 302 替代 301,可能导致搜索引擎长期索引旧 URL,影响新页面收录。
-
-
爬虫效率下降:
-
过多重定向会增加爬虫抓取负担,拖慢网站整体索引速度。
-
-
3. 应用场景与配置方法
-
典型场景
-
网站迁移:
-
域名更换(
old.com
→new.com
)或 HTTP 升级 HTTPS 时,全站 301 重定向。
-
-
内容优化:
-
合并低质量页面(如
/page1
与/page2
内容相似,重定向至/page
)。
-
-
多版本适配:
-
移动端跳转(如
desktop-site.com/page
→m-site.com/page
),但推荐响应式设计替代。
-
-
-
配置方式
-
服务器端配置:
-
Apache:通过
.htaccess
文件添加规则:Redirect 301 /old-path/ https://new-domain.com/new-path/
-
Nginx:在配置文件中添加:
server { rewrite ^/old-path/(.*)$ https://new-domain.com/new-path/$1 permanent; }
-
-
CMS 插件:
-
WordPress 使用插件(如 Redirection、Yoast SEO)可视化管理跳转规则。
-
-
4. 最佳实践与验证工具
-
优化策略
-
优先使用 301 重定向:确保权重传递与长期 SEO 效果。
-
简化跳转路径:避免链式重定向(如 A→B→C),直接跳转至目标 URL。
-
更新内部链接:将网站内链直接指向新 URL,减少重定向依赖。
-
-
验证与监控
-
工具推荐:
-
Google Search Console:检查“覆盖率报告”中的重定向错误。
-
Screaming Frog:爬取网站识别无效或循环跳转。
-
Redirect Checker:在线工具测试跳转链状态码与最终目标。
-
-
-
常见问题处理
-
循环重定向:检查规则逻辑,确保未形成 A→B→A 的死循环。
-
权重未传递:确认是否误用 302,或新页面被
noindex
标记。
-
5. 与其他技术的协同
-
规范链接(Canonical Tag):
-
重定向用于处理已废弃的 URL,而
rel="canonical"
用于声明重复页面的主版本,二者互补但不可替代。
-
-
HSTS 策略:
-
强制 HTTPS 跳转时,结合 HSTS 头信息提升安全性与跳转效率
-
九、结构化信息
结构化信息是网页中通过标准化格式(如Schema.org)标记的语义化数据,旨在以机器可读的方式描述页面内容(如产品参数、事件时间等),帮助搜索引擎精准理解信息并优化搜索结果展示。
1. 定义与作用
-
核心定义
-
结构化信息通过语义标签将内容分解为关联的、有层级的组件(如产品名称、价格、评分),并遵循Schema.org等通用词汇表进行编码。
-
与非结构化数据(如纯文本、图片)不同,结构化信息具有明确的字段定义和逻辑关系,可直接被搜索引擎解析。
-
-
主要作用
-
增强搜索结果展示:触发富媒体摘要(Rich Snippets),例如在搜索结果中显示评分、价格、FAQ等,提升点击率。
-
提升索引效率:帮助爬虫快速识别页面主题与关键属性,减少内容误判风险。
-
支持知识图谱与语音搜索:为Google知识图谱、语音助手等提供语义化数据支持,优化多场景搜索体验。
-
2. 技术实现与标准
-
主流标记格式
-
JSON-LD:Google推荐的格式,通过
<script>
标签嵌入页面头部或尾部,独立于HTML内容,维护便捷。 -
Microdata:将语义标签直接嵌入HTML元素(如
<div itemscope>
),需与页面结构紧密耦合。 -
RDFa:基于XML的扩展语法,适用于复杂语义关系标注。
-
-
常见数据类型
-
产品信息(Product):标注名称、价格、库存状态,触发购物搜索结果中的商品卡片。
-
文章(Article):声明标题、作者、发布时间,优化新闻类内容展示。
-
常见问题(FAQ):生成可折叠的问答列表,直接显示在搜索结果页。
-
本地企业(LocalBusiness):提供地址、营业时间、联系方式,增强本地搜索可见性。
-
3. SEO 优化价值
-
直接收益
-
提高点击率(CTR):富媒体摘要比普通搜索结果更醒目,用户点击意愿提升30%-50%。
-
降低跳出率:精准展示内容关键信息(如价格区间、活动时间),吸引目标用户点击。
-
-
长期优势
-
支持语义搜索:适应自然语言处理(NLP)趋势,提升长尾关键词的排名潜力。
-
跨平台兼容:结构化数据可被社交媒体(如Facebook)、聚合平台复用,扩大内容分发范围。
-
4. 实施与验证
-
操作步骤
-
选择数据类型:根据页面内容匹配Schema.org中的词汇表(如
Event
、Recipe
)。 -
生成代码:使用工具(如Google结构化数据标记助手、JSON-LD Generator)自动生成代码片段。
-
部署与测试:通过Google Search Console的“结构化数据测试工具”验证代码有效性。
-
-
注意事项
-
避免滥用:仅标记页面实际存在的内容,虚假标记可能导致搜索引擎惩罚。
-
动态更新:确保数据与页面内容实时同步(如价格变动、活动过期)。
-
5. 典型案例
-
电商网站:
<script type="application/ld+json"> { "@context": "https://schema.org", "@type": "Product", "name": "无线降噪耳机", "image": "https://example.com/image.jpg", "description": "主动降噪,30小时续航", "brand": "XYZ", "offers": { "@type": "Offer", "price": "699", "priceCurrency": "CNY" } } </script>
此代码可使产品在搜索结果中显示价格、星级评分等富媒体元素。
6. 与其他技术的协同
-
与JSON-LD结合:增强数据语义化表达,支持更复杂的关联关系(如事件日程、人员角色)。
-
与AMP(加速移动页面)集成:提升移动端加载速度与交互体验。
结构化信息是连接内容与搜索引擎的“翻译器”,其合理应用可显著提升网站的搜索可见性与用户体验,是SEO策略中不可或缺的一环。
相关文章:
SEO(Search Engine Optimization,搜索引擎优化)相关知识点
SEO(Search Engine Optimization)是指搜索引擎优化,是计算机领域中通过技术手段和内容策略,提升网站在搜索引擎(如Google、Bing、百度)中自然(非付费)排名的系统性方法。是一种通过优…...
轻松完成视频创作,在线视频编辑器,无需下载软件,功能多样实用!
小白工具的在线视频编辑https://www.xiaobaitool.net/videos/edit/ 功能丰富、操作简便,在线裁剪或编辑视频工具,轻松完成视频创作能满足多种视频编辑需求。 格式支持广泛:可编辑超百种视频格式,基本涵盖常见和小众视频格式&#…...
typescript学习笔记(全)
1.安装 全局安装 npm i -g typescript局部安装 npm i typescript初始化 tsc --init就会在所在目录下创建出一个tsconfig.json的ts配置文件 2.编译 如果是全局安装 tsc index.ts就会在同目录下编译出一个index.js文件 如果是局部安装 npx tsc index.ts3.特性 1.静态类…...
centos挂载新的硬盘
如果要将 nvme0n1 挂载到 /data 目录(而不是 /),操作会更简单,无需迁移系统文件。以下是详细步骤: 1. 检查磁盘情况 lsblk输出: NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINT sda 8:0 …...
客户案例 | 西昊智能家具:日事清【目标】【日程】【项目】助力高效OKR管理
随着社会现代化、科技化的发展,人们越来越青睐智能化的家具产品,以此来提升家居的安全性、便利性与舒适性。目前,智能家具的行业规模正在不断扩张,产业也逐渐步入高质量增长模式。面对繁荣的市场前景,西昊智能家具与日…...
16.磁环在EMC设计中的选型与运用
磁环在EMC设计中的选型与运用 1. 磁环选型的参数和注意事项2. 磁环的选型方法3. 非晶磁环 1. 磁环选型的参数和注意事项 (1)损耗电阻R(f)和L(f)是频率的函数,因此IL也是频率的函数; (2)fL段,R(f…...
oralce 查询未提交事务和终止提交事务
查询提交记录 SELECT s.sid,s.serial#,s.username,s.status,t.start_time,t.used_ublk,t.log_io,t.phy_io FROM v$session sJOIN v$transaction t ON s.saddr t.ses_addr; 查到的记录如下: 如果要终止第一次提交,如下操作 ALTER SYSTEM KILL SESSION…...
智能小助手部署 Win10 + ollama的Deepseek + CentOS+ maxKB
一、适用场景 1、企业内部知识管理 (1)快速查询政策与流程文档: 员工通过自然语言提问,MaxKB 能迅速定位相关文档并给出准确答案,减少人工检索成本,提升企业内部知识获取的效率。 (2࿰…...
CentOS 7 系统中,防火墙要怎么使用?
在 CentOS 7 系统中,默认有两个防火墙管理工具: firewalld(默认的动态防火墙,基于 D-Bus 管理) iptables(传统的静态防火墙,底层由 netfilter 提供支持) 是否需要关闭这两个防火墙…...
网页版 deepseek 对话问答内容导出为 PDF 文件和 Word 文件的浏览器插件下载安装和使用说明
文章目录 网页版 deepseek 浏览器扩展应用程序插件1. 预览效果2. 功能介绍3. 浏览器扩展应用程序下载3.1. 下载方式13.2. 下载方式24. 安装教程4.1. Chrome 浏览器安装步骤4.2. Edge 浏览器安装步骤5. 使用说明网页版 deepseek 浏览器扩展应用程序插件 1. 预览效果 预览效果 导…...
MySQL 报错解析:SQLSyntaxErrorException caused by extra comma before FROM
一、遇到的错误 在日常开发中,尤其是使用 MyBatis 等 ORM 框架操作 SQL 时,我们经常会遇到类似下面的错误。 ### Error querying database. Cause: java.sql.SQLSyntaxErrorException: You have an error in your SQL syntax; check the manual that co…...
高光谱相机在生物医学中的应用:病理分析、智慧中医与成分分析
高光谱成像技术(Hyperspectral Imaging, HSI)通过捕捉物质的连续光谱信息与空间信息,形成“光谱立方体”,能够揭示传统成像技术无法获取的分子级特征。作为国内光谱技术领域的领军企业,深圳市中达瑞和科技有限公司依托…...
2025 年“泰迪杯”数据挖掘挑战赛B题——基于穿戴装备的身体活动监测问题分析
摘要 本文聚焦于基于穿戴设备采集的加速度计数据,深入研究志愿者在日常活动中的行为特征,构建了多个数学建模框架,实现从身体活动监测、能耗预测、睡眠阶段识别到久坐预警等多个目标。我们依托于多源数据融合与机器学习模型,对人体活动状态进行识别与分析,为健康管理、行…...
10.接口而非实现编程
10.接口而非实现编程 目录介绍 01.接口编程原则 1.1 接口指导思想 02.如何理解接口 2.1 重点搞清楚接口2.2 抽象的思想 03.来看一个案例 3.1 图片存储的案例3.2 业务拓展问题3.3 代码演变设计思想3.4 重构后的代码 04.定义接口的场景 4.1 要有接口意识4.2 接口具体的场景4.3 …...
基于大语言模型的AI智能体开发:构建具备工具使用能力的智能助手
本文将结合大语言模型(LLM)与工具调用能力,构建新一代AI智能体系统。通过ReAct框架实现智能思考-行动循环,集成网络搜索、计算器、API调用等外部工具,并基于LangChain实现可扩展的智能体架构。 一、新一代AI智能体技术…...
DS B/B+/B*树及其应用(21)
文章目录 前言一、常见的搜索结构内查找外查找 二、B树的概念三、B树的插入分析四、B树的插入实现B树的节点设计B树的查找B树插入Key / Key & Value的过程B树的完整插入代码B树的中序遍历B树的删除B树的性能分析 五、B树六、B*树七、B树系列总结及其应用总结 前言 我们计算…...
04-stm32的标准外设库
一、概述 1、STM32标准外设库(Standard Peripheral Library)是STMicroelectronics为STM32系列微控制器提供的一个软件库,它提供了一组API函数来简化对STM32微控制器硬件的访问。这个库包含了对各种外设(如GPIO、USART、SPI、I2C等…...
ORACLE RAC环境使用ASM机制零宕机时间更换存储的实践
ORACLE RAC使用存储,随时系统的发展,磁盘空间以及存储的老化、更换是一个典型的动作;基于ASM数据自动均衡分配到各个磁盘LUN的特性,可以使用此方式进行在线的迁移,ORACLE MOS上有一个文档:中文版࿱…...
03_JavaScript
文章目录 一、概述1.1、JavaScript简介1.2、JavaScript组成部分1.3、为什么要学习JavaScript1.4、学习的目的1.5、JavaScript与Java的关系 二、使用位置及运行说明2.1、使用位置2.2、如何运行 三、JavaScript基础语法3.1、变量3.2、运算符3.3、控制流程3.3.1、分支结构3.3.2、循…...
Kafka消息可视化工具Offset Explorer
参考文献 Kafka消息可视化工具:Offset Explorer(原名kafka Tool)的使用方法【转】 - paul_hch - 博客园 https://zhuanlan.zhihu.com/p/722232008 正文 官网下载地址为Offset Explorer 双击offsetexplorer_64bit.exe 安装 双击 使用kafka…...
AXP2101入门
目录 核心功能与特性封装与配置安全与可靠性 AXP2101 是一款由全志公司开发的单电池 NVDC 电源管理集成电路(PMIC),专为锂离子/锂聚合物单电池应用设计,适用于需要多通道电源输出的设备。 核心功能与特性 1.输入与充电管理 输入…...
Bytebase 取得 SOC 2 Type 1 认证
我们很高兴地宣布,Bytebase 已成功取得 SOC 2 Type 1 认证,印证了我们在数据库 DevSecOps 平台始终以最高标准保障安全性、可用性和保密性的承诺。 为了实现并维持 SOC 2 合规性,我们与 Vanta 合作进行自动安全监控和合规性验证。审计由独立…...
反爬系列 IP 限制与频率封禁应对指南
在数据采集领域,IP 限制与频率封禁是反爬机制中最常见的防御手段。随着网站安全策略的升级,单靠传统爬虫技术已难以应对高强度的检测。本文将从反爬机制解析、实战应对策略两个维度,系统讲解如何突破 IP 限制与频率封禁。 一、反爬机制解析 …...
Java的进阶学习
注解 Java注解(Annotation)又称为Java标注,是JDK5.0引入的一种注释机制,可以用在类、方法、变量、参数成员上,在编译期间,会被编译到字节码文件中,运行时通过反射机制获得注解内容进行解析。 内置注解 Java语言已经定…...
从零开始学习SLAM|技术路线
概念 视觉SLAM(Simultaneous Localization and Mapping)系统中,整个过程通常分为 前端 和 后端 两个主要部分。前端处理的是从传感器数据(如相机图像、激光雷达等)中提取和处理信息,用于实时定位和建图&am…...
vue3:十一、主页面布局(修改顶部导航栏样式-右侧:用户信息+退出登录+全屏显示)
一、效果 完成效果,增加顶部导航栏,右侧用户信息(其中个人中心需要后续进行页面开发,这里只写了退出登录功能),以及全屏功能 二、搭建并引入右侧组件 将右侧内容封装到单独的组件,直接引入(像左侧导航条等内容也是可以做成这种形式) 1、新建右侧组件的页面 在layout中…...
车载客流记录仪简介
一、产品概述 车载客流记录仪技术是采用智能视频分析算法,通过人体形态特征(头部和肩部)及上下车的运动规律研判,在设定区域内分析出上下车人数数量,实现相关人数数据的统计和记录。能够为公共交通企业、公共交通管理…...
2025新版懒人精灵零基础及各板块核心系统视频教程-全分辨率免ROOT自动化开发
2025新版懒人精灵零基础安装调试lua基础UI设计交互常用方法封装项目实战项目打包安装板块-视频教程(初学者必修课) 1.懒人精灵核心API基础和lua基础视频教程:https://www.bilibili.com/video/BV1Vm9kYJEfM/ 其它板块教程(包含:对接AI、实战、插件、UI、…...
从 Java 到 Kotlin:在现有项目中迁移的最佳实践!
全文目录: 开篇语 1. 为什么选择 Kotlin?1.1 Kotlin 与 Java 的兼容性1.2 Kotlin 的优势1.3 Kotlin 的挑战 2. Kotlin 迁移最佳实践2.1 渐进式迁移2.1.1 步骤一:将 Kotlin 集成到现有的构建工具中2.1.2 步骤二:逐步迁移2.1.3 步骤…...
矩阵运营的限流问题本质上是平台与创作者之间的流量博弈
矩阵运营的限流问题本质上是平台与创作者之间的流量博弈,要系统性解决这一问题,需从技术规避、内容优化、运营策略三个维度构建防御体系。以下结合平台算法逻辑与实战案例,深度解析限流成因及破解之道: 一、技术层:突…...
一种Spark程序运行指标的采集与任务诊断实现方式
一种Spark程序运行指标的采集与任务诊断实现方式 编写时间:2023年8月2日 第一次校准时间:2023年8月2日 文章目录 一种Spark程序运行指标的采集与任务诊断实现方式数据链路采集器的类图CustomSparkListener采集的指标task相关stage相关Job相关Executors相关诊断诊断分类调度阶…...
Gazebo 仿真环境系列教程(一):环境安装与基础使用
文章目录 一、版本说明与技术背景1.1 Gazebo 版本分支1.2 版本选择建议 二、系统环境准备2.1 硬件要求2.2 软件依赖 三、Gazebo Garden 安装流程3.1 添加官方软件源3.2 执行安装命令3.3 环境验证 四、Gazebo Classic 安装方法4.1 添加软件仓库4.2 安装核心组件4.3 验证安装 五、…...
Nginx 中间件
Nginx(发音为 "engine-x")是一款开源的高性能 HTTP 服务器和反向代理服务器,最初由 Igor Sysoev 开发。 它以其高性能、稳定性、丰富的功能集和低资源消耗而闻名,广泛应用于全球的 Web 服务架构中。 作为中间件&#…...
记录学习的第三十一天
今天只做了一道每日一题。 说实话,根本不会做呀,该怎么办? 以下是我看了题解之后的思路(适合新手): 1.首先肯定是要求出整个数组的不同数字有多少个的使用set来操作 2.右指针开始进入窗口,把元素放进哈希…...
Framework.jar里的类无法通过Class.forName反射某个类的问题排查
1,背景 我们想要在system_server进程里扩展一些我们自己的功能。 考虑到解耦和编译依赖的问题,我们用PRODUCT_SYSTEM_SERVER_JARS预置我们的类,然后用反射jar里面的类的方式来实现代码引用。 2,遇到的问题 在SystemServer.jav…...
架构-信息安全技术基础知识
一、信息安全基础 1. 信息安全的5个基本要素(重点) 机密性:确保信息不泄露给未授权的人或程序。 ▶ 举例:银行用户的账户密码必须保密,防止黑客窃取。完整性:保证信息不被非法修改,保持准确和…...
项目班——0419——chrono时间库
1、写日志需要时间库 C11时间库chrono源自于boost 1.时间间隔 duration 2.时间点 timepoint 3.时钟 clock 系统时钟system_clock,稳定时钟steady_clock,高精度时钟high_resolution_clock 例子 1、休眠100毫秒 2、输出当前时间 获取当前时间戳 s…...
Unity后处理全解析:从入门到优化
在游戏开发的世界里,Unity作为一款强大的游戏引擎,为开发者们提供了丰富的功能和工具。其中,后处理(Post-Processing)技术是提升游戏画面质量和视觉效果的重要手段之一。今天,我们就来深入探讨一下Unity后处理的相关内容,包括基本概念、使用说明、常见效果、优化技巧以及…...
得物业务参数配置中心架构综述
一、背景 现状与痛点 在目前互联网飞速发展的今天,企业对用人的要求越来越高,尤其是后端的开发同学大部分精力都要投入在对复杂需求的处理,以及代码架构,稳定性的工作中,在对比下,简单且重复的CRUD就显得…...
针对密码学的 EM 侧信道攻击
基于电磁的侧信道攻击是非侵入式的,这意味着攻击者无需物理接触设备即可窃取信息。我们将了解这些电磁侧信道攻击的工作原理。 我们之前介绍了侧信道攻击的概念:它们是什么,以及为什么它们会成为重大的硬件安全威胁。在众多形式的侧信道攻击中,最强大的一种是电磁 (EM) 攻…...
el-setup- 修改样式(vue3)
一 第一步 <template><el-steps :active"activeStep" align-center><el-stepv-for"item in stepData":key"item.value":class"{ currentStep: activeStep item.value }"><template #icon><div class"…...
CPT204 Advanced Obejct-Oriented Programming 高级面向对象编程 Pt.8 排序算法
文章目录 1. 排序算法1.1 冒泡排序(Bubble sort)1.2 归并排序(Merge Sort)1.3 快速排序(Quick Sort)1.4 堆排序(Heap Sort) 2. 在面向对象编程中终身学习2.1 记录和反思学习过程2.2 …...
【低配置电脑预训练minimind的实践】
低配置电脑预训练minimind的实践 概要 minimind是一个轻量级的LLM大语言模型,项目的初衷是拉低LLM的学习门槛,让每个人都能从理解每一行代码开始, 从零开始亲手训练一个极小的语言模型。对于很多初学者而言,电脑配置仅能够满足日…...
flutter 小知识
FractionallySizedBox组件 FractionallySizedBox是Flutter中的一个特殊布局小部件,它允许子组件的尺寸基于父组件的尺寸来计算。这意味着子组件的尺寸是父组件尺寸的一个比例,这使得布局在不同屏幕尺寸下保持一致性1。 ListWheelScrollView Lis…...
高性能服务器配置经验指南3——安装服务器可能遇到的问题及解决方法
文章目录 1、重装系统后VScode远程连接失败问题2、XRDP连接黑屏问题1. 打开文件2. 添加配置3. 重启xrdp服务 在完成 服务器基本配置和 深度学习环境准备后,大家应该就可以正常使用服务器了,推荐使用VScode远程连接使用,比较稳定方便&#x…...
Vue实战(08)解决 Vue 项目中路径别名 `@` 在 IDE 中报错无法识别的问题
一、引言 在 Vue 项目开发过程中,路径别名是一个非常实用的特性,它能够帮助开发者简化文件引用路径,提高代码的可读性和可维护性。其中, 作为一个常见的路径别名,通常被用来指向项目的 src 目录。然而,…...
处理任务“无需等待”:集成RabbitMQ实现异步通信与系统解耦
在前几篇文章中,我们构建的Web应用遵循了一个常见的同步处理模式:用户发出HTTP请求 -> Controller接收 -> Service处理(可能涉及数据库操作、调用其他内部方法)-> Controller返回HTTP响应。这个流程简单直接,…...
ASP.NET Core 主机模型详解:Host、WebHost与WebApplication的对比与实践【代码之美】
🎀🎀🎀代码之美系列目录🎀🎀🎀 一、C# 命名规则规范 二、C# 代码约定规范 三、C# 参数类型约束 四、浅析 B/S 应用程序体系结构原则 五、浅析 C# Async 和 Await 六、浅析 ASP.NET Core SignalR 双工通信 …...
编译型语言、解释型语言与混合型语言:原理、区别与应用场景详解
编译型语言、解释型语言与混合型语言:原理、区别与应用场景详解 文章目录 编译型语言、解释型语言与混合型语言:原理、区别与应用场景详解引言一、编译型语言1.1 工作原理1.2 典型的编译型语言1.3 优点1.4 缺点 二、解释型语言2.1 工作原理2.2 典型的解释…...
AI工程pytorch小白TorchServe部署模型服务
注意:该博客仅是介绍整体流程和环境部署,不能直接拿来即用(避免公司代码外泄)请理解。并且当前流程是公司notebook运行&本机windows,后面可以使用docker 部署镜像到k8s,敬请期待~ 前提提要:工程要放弃采购的AI平台…...