Python中的defaultdict方法
文章目录
- 核心特点
- 基本语法
- 常见使用场景
- 1. 分组数据(默认值为列表)
- 2. 计数(默认值为整数)
- 3. 集合操作(默认值为集合)
- 4. 嵌套字典
- 注意事项
- 与普通字典对比
- 总结
- 1. 键(Key)的类型
- 2. 值(Value)的类型
- 3. `default_factory` 的返回值
- 4. 嵌套 `defaultdict` 的键值
- 5. 键和值的可变性总结
- 常见问题解答
- Q1:可以用 `list` 作为键吗?
- Q2:可以用 `defaultdict` 作为键吗?
- Q3:值可以是函数或类吗?
- 总结
在 Python 中,
defaultdict
是
collections
模块提供的一个非常有用的类,它是内置字典类型
dict
的子类。
defaultdict
的主要特点是
自动处理字典中不存在的键,避免在使用普通字典时因访问不存在的键而抛出
KeyError
异常。
核心特点
- 自动初始化默认值:当访问一个不存在的键时,
defaultdict
会调用指定的默认工厂函数(default_factory
)生成一个初始值,确定了字典中值的类型。 - 简化代码:无需手动检查键是否存在,适合需要分组、统计或聚合数据的场景。
基本语法
from collections import defaultdictd = defaultdict(default_factory)
default_factory
:一个可调用对象(如list
,int
,set
,str
或自定义函数),用于生成默认值。
常见使用场景
1. 分组数据(默认值为列表)
将数据按键分组,类似 SQL 的 GROUP BY
:
from collections import defaultdictdata = [("apple", "fruit"), ("carrot", "vegetable"), ("apple", "fruit")]
grouped = defaultdict(list)for name, category in data:grouped[category].append(name)print(grouped)
# 输出:defaultdict(<class 'list'>, {'fruit': ['apple', 'apple'], 'vegetable': ['carrot']})
2. 计数(默认值为整数)
统计元素出现次数:
from collections import defaultdicttext = "apple banana apple orange banana"
words = text.split()
count = defaultdict(int)for word in words:count[word] += 1print(count)
# 输出:defaultdict(<class 'int'>, {'apple': 2, 'banana': 2, 'orange': 1})
3. 集合操作(默认值为集合)
避免重复值:
from collections import defaultdictpairs = [("a", 1), ("b", 2), ("a", 3)]
unique = defaultdict(set)for key, value in pairs:unique[key].add(value)print(unique)
# 输出:defaultdict(<class 'set'>, {'a': {1, 3}, 'b': {2}})
4. 嵌套字典
构建多层嵌套结构:
from collections import defaultdictnested = defaultdict(lambda: defaultdict(int))
nested["fruit"]["apple"] += 1
nested["vegetable"]["carrot"] += 2print(nested["fruit"]) # 输出:defaultdict(<class 'int'>, {'apple': 1})
print(nested["unknown_key"]) # 输出:defaultdict(<class 'int'>, {})
注意事项
default_factory
必须可调用:例如list
、int
是类(构造函数),而list()
或int()
的返回值不可作为工厂。- 仅对
d[key]
有效:使用d.get(key)
或key in d
不会触发默认值生成。 - 性能:与普通字典性能接近,适合高频插入操作。
与普通字典对比
# 普通字典需要手动处理缺失键
d = {}
key = "unknown"
if key not in d:d[key] = []
d[key].append(1)# defaultdict 自动处理
d = defaultdict(list)
d["unknown"].append(1)
总结
defaultdict
简化了需要初始化默认值的字典操作,特别适合数据聚合、分组和统计场景。通过合理选择 default_factory
(如 list
、int
、set
或自定义函数),可以大幅提升代码简洁性和可读性。
在 Python 中,defaultdict
继承自 dict
,因此它的 键(Key)和值(Value)的类型规则与普通字典一致,但也有一些细节需要注意。以下是详细说明:
1. 键(Key)的类型
-
规则:键必须是 不可变类型(Immutable) 且 可哈希(Hashable)。
-
允许的类型:
- 基本类型:
int
,float
,str
,bool
,None
- 不可变容器:
tuple
(但元组内的元素也必须不可变) frozenset
(不可变集合)- 用户自定义的不可变对象(需正确实现
__hash__
和__eq__
方法)。
- 基本类型:
-
禁止的类型:
- 可变类型:
list
,dict
,set
- 包含可变元素的
tuple
(例如(1, [2, 3])
)。
- 可变类型:
-
示例:
from collections import defaultdict# 合法键 d = defaultdict(int) d["apple"] = 10 # 字符串作为键 ✅ d[123] = 20 # 整数作为键 ✅ d[(1, 2)] = 30 # 不可变元组作为键 ✅# 非法键(会抛出 TypeError) d[[1, 2]] = 40 # 列表不可哈希 ❌ d[{"a": 1}] = 50 # 字典不可哈希 ❌
2. 值(Value)的类型
-
规则:值可以是 任意类型,包括可变对象。
-
允许的类型:
- 基本类型(
int
,float
,str
等) - 可变容器(
list
,dict
,set
) - 自定义对象、函数、类实例等。
- 基本类型(
-
示例:
from collections import defaultdict# 值可以是列表(可变) d_list = defaultdict(list) d_list["fruits"].append("apple")# 值可以是字典(可变) d_dict = defaultdict(dict) d_dict["data"]["count"] = 10# 值可以是自定义对象 class MyClass:passd_obj = defaultdict(MyClass) obj = d_obj["instance"] # 自动生成一个 MyClass 实例
3. default_factory
的返回值
default_factory
是一个可调用对象(如 list
, int
或自定义函数),它决定了 当键不存在时,默认值的类型。例如:
defaultdict(list)
:默认值是一个空列表([]
)。defaultdict(int)
:默认值是0
。defaultdict(lambda: "unknown")
:默认值是字符串"unknown"
。
值的类型完全由 default_factory
决定,与键的类型无关。
4. 嵌套 defaultdict
的键值
可以创建多层嵌套的 defaultdict
,键的规则依然适用:
from collections import defaultdict# 嵌套 defaultdict(值类型是另一个 defaultdict)
nested = defaultdict(lambda: defaultdict(int))# 合法操作
nested["fruit"]["apple"] += 1 # 键为 "fruit"(字符串)和 "apple"(字符串)
nested[123][(4, 5)] = 2 # 键为 123(整数)和 (4, 5)(不可变元组)# 非法操作(内层键非法)
nested["data"][[1, 2]] = 3 # 内层键为列表,不可哈希 ❌
5. 键和值的可变性总结
特性 | 键(Key) | 值(Value) |
---|---|---|
类型限制 | 必须不可变且可哈希 | 可以是任意类型 |
可变性 | 不可变 | 可以可变 |
示例 | int , str , tuple | list , dict , 自定义对象 |
常见问题解答
Q1:可以用 list
作为键吗?
- 否。列表是可变类型,不可哈希。若需用类似列表的结构作为键,可以转换为不可变的
tuple
。
Q2:可以用 defaultdict
作为键吗?
- 否。
defaultdict
是可变对象,不可哈希。只有不可变类型(如frozenset
)可以作为键。
Q3:值可以是函数或类吗?
- 是。例如:
d = defaultdict(type) # 默认值是类对象 d["my_class"] = MyClass
总结
- 键:必须为不可变且可哈希的类型(如
str
,int
,tuple
)。 - 值:可以是任意类型(包括可变对象),具体由
default_factory
决定。 - 嵌套结构:可以自由嵌套
defaultdict
,但需确保每一层的键合法。
相关文章:
Python中的defaultdict方法
文章目录 核心特点基本语法常见使用场景1. 分组数据(默认值为列表)2. 计数(默认值为整数)3. 集合操作(默认值为集合)4. 嵌套字典 注意事项与普通字典对比总结1. 键(Key)的类型2. 值&…...
Android启动应用时屏蔽RecyclerView滑动,延时后再允许滑动,Kotlin
Android启动应用时屏蔽RecyclerView滑动,延时后再允许滑动,Kotlin var bCanScrollVertically falselifecycleScope.launch(Dispatchers.Default) {repeatOnLifecycle(Lifecycle.State.CREATED) {Log.d(TAG, "Lifecycle.State.CREATED")delay(…...
2025运维工程师面试题1(答案在后一张)
一、逻辑思维能力考核: 问题1: 3个人去投宿,一晚30元三个人每人掏了10元凑够30元交给了老板后来老板说今天优惠只要25元就够了,拿出5元命令服务生退还给他们,服务生偷偷藏起了2元,然后,把剩下…...
在网页中使用【LaTeX 数学公式块】的完整步骤总结
以下是在网页中使用 LaTeX 数学公式块的完整步骤总结,记录如何让网页正确渲染 LaTeX 数学表达式(如 \(H(X) -\sum p(x) \log p(x)\) 这样的公式): ✅ 使用 LaTeX 数学公式块的完整步骤(以 KaTeX 为例) &am…...
新人销售如何找精准客户?
深入了解自身产品或服务。 清晰掌握产品优势、应用场景和解决的问题,比如销售办公软件,要熟知其提升办公效率的具体功能,以此定位需求客户。 利用社交媒体平台。 像领英可完善资料,加入行业群组分享内容吸引潜在客户࿱…...
【Unity】使用Socket建立客户端和服务端并进行通信的例子
Socket服务端: using System; using System.Collections.Generic; using System.Net; using System.Net.Sockets; using System.Text; using System.Threading; public class SocketServer { public static Socket listenSocket;//监听Socket public static List<Socket>…...
为什么要学习《易经》?
《易经》精华解读:变易之道与人生智慧 《易经》(《周易》)是中国最古老的经典之一,被誉为“群经之首,大道之源”。它不仅是占卜之书,更是一部哲学经典,揭示了宇宙运行的规律和人生处世的智慧。…...
13.继承、重载、重写、多态、抽象类、接口、final、Static的学习
一、继承 继承:你继承谁你就是谁,继承是一种严格的父子关系 (在父类里面抽取的属性和方法一定是所有子类所共有) (Student继承Person,那么Student就是人) UML: 类图(描述类和类之间的…...
SpringBoot Actuator未授权访问漏洞的全面解析与解决方案
引言 SpringBoot Actuator 作为应用监控与管理的核心组件,为开发者提供了丰富的系统自省和运维能力。然而,其默认配置中可能存在的未授权访问漏洞,已成为企业安全防护的潜在风险。本文将从漏洞原理、影响范围、检测方法到解决方案,系统性地剖析该问题,并提供覆盖开发、运维…...
使用C# ASP.NET创建一个可以由服务端推送信息至客户端的WEB应用(1)
背景 用户在WEB页面上点击按钮,服务端需要执行一系列操作,该操作系列步骤较多且耗时长,为了更好的给用户浏览体验,需要在每进行一个步骤由服务端推送消息给客户端(浏览器),避免一个长时间的操作…...
一网统管建设组织保障分工常见表
在 “一网统管” 建设进程中,强有力的组织保障体系与各业务部门间的紧密分工协作是确保建设成效的关键。 从组织保障层面来看,需建立专门的 “一网统管” 建设领导小组,由政府高层领导担任组长,各关键业务部门负责人作为组员,以此强化对整体建设工作的统筹规划与组…...
JVM | CMS垃圾收集器详解
目录 CMS垃圾回收器简介 为什么CMS图中初始标记的阶段是单线程?为啥不多线程?当然现在默认多线程了。 CMS的两种模式与一种特殊策略 Backgroud CMS 记忆集 卡表 ForeGroud CMS CMS的标记压缩算法 三色标记 (便于理解而被后人提出&am…...
android开发中的多线程、数据存储同步功能实现方案和应用场景
在Android开发中,多线程、数据存储与同步功能有多种实现方案,以下是详细介绍及其应用场景: 多线程 实现方案: Thread类与Runnable接口:通过继承Thread类并重写run方法,或实现Runnable接口并将其传入Threa…...
【C++初阶】--- 模板进阶
1.非类型模板参数 • 模板参数分类类型形参与非类型形参。 • 类型形参即:出现在模板参数列表中,跟在class或者typename之类的参数类型名称。 • 非类型形参,就是用一个常量作为类(函数)模板的一个参数,在类(函数)模板中可将该参…...
数据库所有知识
# 第一章 数据库-理论基础 ## 1.1 什么是数据库 数据: 描述事物的符号记录, 可以是数字、 文字、图形、图像、声音、语言等,数据有多种形式,它们都可以经过数字化后存入计算机。 数据库: 存储数据的仓库,…...
docker部署的Nextcloud,处于维护模式,如何解决
Nextcloud 在升级后卡在维护模式,以下是针对 Docker 部署的解决方案: 1. 通过 OCC 命令强制关闭维护模式 进入 Nextcloud 容器内部执行命令: # 替换 nextcloud 为你的容器名称 docker exec -it --user www-data nextcloud php occ maintena…...
mongoose插入文档,字段类型, 字段验证, 删除文档,更新文档,读取文档,查询文档的条件控制 ,字段筛选,数据排序,数据截取
、Mongoose 中与 文档操作(插入、查询、更新、删除)及其相关功能(字段类型、验证、条件筛选、排序、分页等)相关示例: 📋 一、字段类型定义(Schema Types) const mongoose require…...
源码编译安装LAMP
一:LAMP概述 LAMP架构是目前成熟的企业网站应用模式之一,指的是协同工作的一整套系统和相关软件,能够提供动态Web站点服务及其应用开发环境。LAMP是一个缩写词,具体包括Linux操作系统、Apache网站服务器、MySQL数据库服务器、PHP…...
C++每日训练 Day 18:构建响应式表单与数据验证(初学者友好)
📘 本篇目标:在前几日协程与事件驱动机制基础上,构建一个响应式表单系统,实现用户输入的异步验证与反馈。通过协程挂起/恢复机制,简化异步逻辑,提升代码可读性。 🔁 回顾 Day 17:响应…...
Linux环境变量以及进程虚拟地址原理
目录 一、介绍进程优先级 1.什么是优先级 2.为什么会有优先级 3.Linux中的优先级是怎么确定的 1)查看Linux中的优先级 2)计算优先级和更改优先级 二、环境变量 1.什么是环境变量 2.环境变量有什么作用 3.环境变量怎么做到的 1)查看系统已有的…...
基于非递归求解的汉诺塔超级计算机堆栈与数据区设计方案
基于非递归求解的汉诺塔超级计算机堆栈与数据区设计方案 一、设计背景与目标 汉诺塔问题存在非递归直接求解方法,相较于递归法具有明确移动规律和潜在性能优势。本设计旨在利用非递归求解规律,优化汉诺塔超级计算机的堆栈与数据区结构,降低…...
【Linux应用】在PC的Linux环境下通过chroot运行ARM虚拟机镜像img文件(需要依赖qemu-aarch64、不需要重新安装iso)
【Linux应用】在PC的Linux环境下通过chroot运行ARM虚拟机镜像img文件(需要依赖qemu-aarch64、不需要重新安装iso) qemu提供了运行ARM虚拟机的方法 具体的操作方式就是建立一个硬盘img 然后通过iso安装到img 最后再运行img即可 这种方式教程很多 很简单 …...
CISC与RISC详解:定义、区别及典型处理器
一、CISC(复杂指令集计算机) Complex Instruction Set Computer 核心思想:通过设计复杂的指令,减少程序指令数量,以硬件复杂度换取编程便利性。 主要特点: 指令复杂度高: 单条指令可完成多步操…...
数据库中DDL、DML、DCL的区别是什么?
数据库中DDL、DML、DCL的区别是什么? 在数据库的使用过程中,SQL(结构化查询语言)常常被用来执行不同的操作,主要分为三类:DDL(数据定义语言)、DML(数据操纵语言…...
【东枫电子】AI-RAN:人工智能 - 无线接入网络
太原市东枫电子科技有限公司,翻译 文章目录 1.概述1.1 什么是AI-RAN?1.2 为什么是AI-RAN?1.3 AI-RAN有哪些好处?1.4 为什么 AI-RAN 会给通信服务提供商 (CoSP) 带来变革?1.5 AIRAN 的构建模块是什么? 2. 参…...
实习技能记录【5】-----项目中消息传递到ui层的方法
代码 while (1){osEvent evt;evt osMailGet(ui_msg_mailbox, 0);if (evt.status osEventMail){UI_MSG_APP_T *msg (UI_MSG_APP_T *)evt.value.p;if (msg->cmd_type CMD_TYPE_INNER){if (msg->cmd_code CMD_CODE_INNER_REFRESH_NOW){lv_obj_invalidate(lv_scr_act()…...
4.29【Q】paraCompute
还是同样的要求,我要写实验报告,如何组织描述运行时间,加速比,效率等随数据规模,进程数,线程数变化的语言和逻辑,从而显得不冗余和精简?为我生成合理排版,布局的文字&…...
什么是布林带?
什么是布林带? 布林带是约翰布林格在20世纪80年代开发的一种广泛使用的技术分析工具。布林带由价格图表上的三条线组成:中轨、上轨和下轨。中轨通常是20天简单移动平均线(SMA),代表资产在此期间的平均价格。上轨和下轨…...
爬虫学习笔记(四)---request入门
例1 例1:写一个爬取百度搜索页面的程序,以搜索一个喜欢的明星为例(如在搜索框中输入周杰伦) 正常搜索 页面 爬虫思路: 1.用一个query变量,在控制台输入的方式更加灵活的输入想爬取的明星的百度搜索页面 …...
JSON配置文件格式全解析与多语言实战指南
JSON配置文件格式全解析与多语言实战指南 摘要 本文全面解析JSON配置文件的核心语法规范,深入探讨数据类型、转义机制及JSON5扩展特性,提供JavaScript/Python/Java等多语言解析方案。通过典型应用场景案例演示JSON的最佳实践,帮助开发者高效…...
JavaScript 中的类型转换机制?
一、类型转换的两种模式 1. 显式转换(手动翻译) 你主动告诉 JavaScript 如何转换类型,比如: let num Number("123"); // 字符串 → 数字:123 let str String(123); // 数字 → 字符串:&qu…...
【分享】音频音乐剪辑[特殊字符]人声分离伴奏提取[特殊字符]拼接合并
音频音乐剪辑是一款专业的剪辑软件。在剪辑过程中,它可以对音频进行拼接合成、音乐裁剪、变调变速、格式转换,同时音频音乐剪辑还是一款支持高清录音、音频降噪等众多功能于一体的音频制作软件。 【应用名称】:音频剪辑 【应用版本】…...
关于 const a 定义的数据 与 其渲染 的问题。即通过const定义的常量,会不会导致渲染不及时。
情况1 (同2、4结论一致) 定义:使用子hook,将数据 const a 【对stateX的一系列操作】 封存到子hook里。并return出去。结果:此种情况不影响实时渲染。缺点:只要stateX变更,一定展示c的最新数据…...
开源Kotlin从零单排0基础完美入门教程
🚀 Kotlin 从零单排 一个让你欲罢不能的 Kotlin 入门教程! 教程仓库地址 👋 Hey,你好啊! 如果你: 🤔 听说 Kotlin 很香,但不知道香在哪?😅 Java 写得头大&a…...
主流微前端框架比较
主流微前端框架比较 以下表格列出了当前主流微前端框架的核心对比信息,包括基本介绍、核心特性、适用场景、技术栈兼容性、优缺点、社区维护情况和典型应用案例等: 框架基本介绍核心特性与机制适用场景技术栈兼容性优缺点社区维护情况典型应用案例qiankun蚂蚁金服推出的生产…...
DOM 事件的处理通常分为三个阶段:捕获、目标、冒泡【前端示例】
如果神明还不帮你,说明他相信你。 目录 引言:捕获阶段:目标阶段:冒泡阶段:事件传播示意图:示例:代码:解读:输出: 引言: DOM 事件的处理通常分为三…...
C#实现对达索(Dassault)SolidWorks中3D图纸转化为手机可直接查看预览图纸格式
转化环境无需安装SolidWorks。 代码更新:暂不公开。 实现效果:...
Twitter 工作原理|架构解析|社交APP逻辑
这是对Twitter 工作原理|架构解析|社交APP逻辑_哔哩哔哩_bilibili的学习,感谢up小凡生一 在两年半前,埃隆马斯克收购了Twitter,并且进行了一系列重大改革。今天我们来解析一下这个全球知名社交平台的架构。首先&#x…...
模拟集成电路设计与仿真 : Feedback System
前情提要 此為作者針對迴授系統,進行資料統整,以便日後查詢 原理 1. The Whole System 更正 : V - V feedback 是 並 - 串 迴授 2. Feedback Block Beta 更正 : ,所以 the whole systemfeedback block左 2右 1 feedback block feed…...
Linux权限管理进阶:文件归属、特殊权限与ACL详解
一、文件归属管理:chown命令 1. 基础语法与作用 chown 命令用于修改文件或目录的 属主(Owner) 和 属组(Group),是Linux权限管理中调整资源归属的核心工具。 chown [选项] 新属主:新属组 文件/目录 常用…...
MyBatis、MyBatis-Plus、Hibernate、Spring Data JPA 等 Java 持久层技术的理解和对比
一、基本概念 1. MyBatis 是一个 半自动的 ORM 框架(Object-Relational Mapping),用于简化 JDBC 开发。它允许你通过 XML 或注解配置 SQL 语句,将 Java 对象与 SQL 查询结果进行映射。 2. MyBatis-Plus(MPÿ…...
如何用vivado导出pin delay
目录 简介: Vivado工具导出pin delay步骤: 简介: 通过在一些等长要求比较严格的场合,会考虑到FPGA内部的走线,这时候就需要用到方法去导出fpga的pin delay。本文以xinlinx 的UltraScale系列的XCKU060-2FFVA1156I为例…...
【图片识别改名】批量读取图片区域文字识别后批量改名,基于Python和腾讯云的实现方案
项目场景 办公文档管理:将扫描的发票、合同等文档按编号、日期自动重命名。例如,识别“编号:2023001 日期:20230403”生成“2023001_20230403.jpg”。产品图片整理:电商产品图片按产品编号、名称自动命名。例如,…...
数字中国浪潮下:Coremail AI赋能邮件办公,筑牢安全防线引领转型
4月28日,在第八届数字中国建设峰会新产品新技术发布会上,Coremail分享了AI在邮件产品领域的最新应用成果和实践经验。 作为互联网之后的又一波技术浪潮,人工智能(AI)已成为推动各行业变革的核心力量,为企业…...
软件设计师-软考知识复习(1)
写在前面 复习软考,把一些忘记了的知识整理一下,方便后续查看。 设码长为8,补码为11111111,其真值是多少( ) A.1 B.-1 C.127 D.128 参考答案:B 解题步骤 1. 理解补码表示法 在计算机中&…...
快速安装Arduino IED的STM32 MCU开发包
从github安装STM32 MCU开发包非常慢,很难安装成功。因此我将Arduino IED的TM32 MCU开发包上传到国内网站,亲测安装成功。 1.打开Arduino IED,文件--首选项--其它开发板管理地址,添加http://www.aluoyun.cn/BoardManagerFiles-mai…...
Html 2
一,表单 1.概念:在一个区域中,拥有许多输入和最终组件,可以让用户输入、选择信息,最终将信息传入服务器端 2.常用组件: (1)<form action " " methon "get&qu…...
业务层在事务中高频创建动态表然后删除或者回滚导致 pg_dump 概率出现备份失败问题分析
文章目录 测试环境,业务层在事务中高频创建动态表然后删除或者回滚导致 pg_dump 概率出现备份失败职责划分应用层对 DDL 事务的滥用 导致的目录污染怎么理解?应用层在事务中大量高频新建动态表, 然后删除表, 有啥隐患目录版本风暴…...
图漾官网Sample_V1版本C++语言完整参考例子---单相机版本
文章目录 1.参考例子 主要梳理了图漾官网Sample_V1版本的例子 1.参考例子 主要增加了从storage区域读取相机参数的设置,使用图漾PercipioViewer软件,如何将相机参数保存到srorage区,可参考链接:保存相机参数操作 保存参数设置 注…...
SSM书籍管理(业务编写)
查询书籍功能 编写Controller类 Controller RequestMapping("/book") public class BookController {//controller调用service层AutowiredQualifier("BookServiceImpl")private BookService bookService;//查询全部的书籍,并且返回到书籍展示…...