百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

Python之容器:字典(dict)就是哈希表换个马甲?

liuian 2025-02-19 12:55 10 浏览

引言

从上一篇文章开始,开始了Python中常用的数据结构,也就是容器类的介绍,上一篇文章简要介绍了列表的使用,这一篇文章准备介绍一下Python中字典(dict)的使用。

本文的主要内容大概如下:
1、简要介绍Python中字典的特点
2、遍历字典的几种方法
3、字典中的常用方法
4、字典推导式

Python中字典的特点

Python中的字典(dict)是一种非常强大的数据结构,对应到其他编程语言中的“哈希表”这种容器类型。

Python中的字典有如下特点:
1、键值对存储:便于通过键值快速检索、定位数据,比列表的索引方式更加方便。
2、关于顺序:在Python3.7之前,字典中的键值对是无序的。从Python3.7开始,字典中的键值对保持插入的顺序;但是,需要留意的是:自Python3.7开始,dict类型正式“有顺序”了,不过只是保留键的插入顺序。你不能随意重新排列dict中的键。
3、键的不变性:字典中的键必须是不可变的数据类型,比如(字符串、数字、元组),因为底层存储需要通过键进行哈希;值的类型是任意的。
4、可变性:字典是可变的,可以随时修改、添加和删除键值对。

字典的遍历

关于字典中最常用的一个操作,就是对字典的遍历,在Python中有几种常用的遍历方式,可以根据实际需要自行选择:
首先生成测试数据:
还是以人员信息为例,这次我们使用嵌套字典的方式存储,字典的key为name,字典的值为完整的人员信息的字典,包含name、age、gender、height

from faker import Faker
from rich import print
fk = Faker('zh_CN')

# 人员信息的测试数据
persons = {}
for _ in range(10):
    name = fk.unique.name()
    persons[name] = {'name': name, 'age': fk.random_int(1, 150), 'gender': fk.passport_gender(), 'height': fk.random_int(130, 200)}

print(persons)

执行结果:


需要注意的是,每次执行程序,生成的测试数据都是不一样的,所以,上面的执行结果只是一个示例。

方法1:遍历字典的键

for k in persons.keys():
    print(k)

for k in persons:
    print(k)

通过keys()方法进行遍历,与直接对persons进行遍历是一样的。

方法2:遍历字典的值

for p in persons.values():
    print(p) 

方法3:遍历字典的键值对:

for k, v in persons.items():
    print(f"key: {k}, value: {v}")

字典常用方法

关于字典的增、删、改的操作比较简单,这里就不列举了。下面就几个在实际应用中,比较实用的方法做一下简单介绍。
1、根据可迭代对象初始化一个字典:fromkeys()
在实际使用中,有些数据可能是以其他形式存储的,我们在处理过程中,可能首先需要初始化一个字典,然后进行更进一步的处理:
比如,游戏开始之初,对玩家积分进行一个初始化的操作,后续根据游戏进度进行积分的动态更新

players = ['刘备', '关羽', '张飞', '赵云', '诸葛亮']
scores = dict.fromkeys(players, 0)
print(scores)
scores['赵云'] += 10
scores['诸葛亮'] += 100
print(scores)

执行结果:

2、获取字典中的值 get()
实际使用中,要通过键获取对应的值有两种方式:
1)通过[key]的形式
2)通过get()方法
两者的不同在于,[key]索引的形式,当键值不存在时会抛异常;get()方法,键值不存在时默认返回None,也可以设置指定的默认值。

players = ['刘备', '关羽', '张飞', '赵云', '诸葛亮']
scores = dict.fromkeys(players, 0)
print(scores)
scores['赵云'] += 10
scores['诸葛亮'] += 100
print(scores)

# 返回None
print(scores.get('赵云2'))
# 返回指定的默认值
print(scores.get('赵云2', -1))
# 会抛异常
print(scores['赵云2'])

执行结果:

3、setdefault()方法:
以一个简单的人员按照性别分组的需求为例,说明该方法的使用:

# 人员信息的测试数据
persons = {}
for _ in range(10):
    name = fk.unique.name()
    persons[name] = {'name': name, 'age': fk.random_int(1, 150), 'gender': fk.passport_gender(),
                     'height': fk.random_int(130, 200)}

print(persons)
persons_grop_by_gender = {}
for k, v in persons.items():
    if v['gender'] in persons_grop_by_gender:
        persons_grop_by_gender[v['gender']].append(k)
    else:
        persons_grop_by_gender[v['gender']] = [k]
print(persons_grop_by_gender)

上面的代码中,我们需要进行分支判断,如果key在字典中已经存在,则将姓名追加到值的列表中,如果不存在,则首次进行初始化为值列表的操作。
逻辑没有问题,但是,有点繁琐,不太pythonic!
接下来使用setdefault()方法进行改造:

persons_grop_by_gender = {}
for k, v in persons.items():
    names = persons_grop_by_gender.setdefault(v['gender'], [])
    names.append(k)

没有了分支判断的操作,相对简洁了一些。

执行结果:

字典推导式

如同通过列表推导式构造列表对象,Python也支持通过推导式构建字典对象。

字典推到式的语法类似于列表推导式,只需要把[]换为{},单个元素,换为kk: vv形式的元素即可。
如:

dict1 = {i: i**2 for i in range(20}

还是以上面的人员信息的测试数据生成为例,这次,我们改用字典推导式来实现:

from faker import Faker
from rich import print

fk = Faker('zh_CN')

# 人员信息的测试数据
persons = {(name := fk.unique.name()): {'name': name, 'age': fk.random_int(1, 150), 'gender': fk.passport_gender(), 'height': fk.random_int(130, 200)} for _ in range(20)}

print(persons)

执行结果:



可以看到,前面通过for循环生成的测试数据,现在通过字典推导式,只需要一行代码就搞定了。


相关推荐

GANs为何引爆机器学习?这篇基于TensorFlow的实例教程为你解惑!

「机器人圈导览」:生成对抗网络无疑是机器学习领域近三年来最火爆的研究领域,相关论文层出不求,各种领域的应用层出不穷。那么,GAN到底如何实践?本文编译自Medium,该文作者以一朵玫瑰花为例,详细阐...

高丽大学等机构联合发布StarGAN:可自定义表情和面部特征

原文来源:arXiv、GitHub作者:YunjeyChoi、MinjeChoi、MunyoungKim、Jung-WooHa、SungKim、JaegulChoo「雷克世界」编译:嗯~...

TensorFlow和PyTorch相继发布最新版,有何变化

原文来源:GitHub「机器人圈」编译:嗯~阿童木呀、多啦A亮Tensorflow主要特征和改进在Tensorflow库中添加封装评估量。所添加的评估量列表如下:1.深度神经网络分类器(DNNCl...

「2022 年」崔庆才 Python3 爬虫教程 - 深度学习识别滑动验证码缺口

上一节我们使用OpenCV识别了图形验证码躯壳欧。这时候就有朋友可能会说了,现在深度学习不是对图像识别很准吗?那深度学习可以用在识别滑动验证码缺口位置吗?当然也是可以的,本节我们就来了解下使用深度...

20K star!搞定 LLM 微调的开源利器

LLM(大语言模型)微调一直都是老大难问题,不仅因为微调需要大量的计算资源,而且微调的方法也很多,要去尝试每种方法的效果,需要安装大量的第三方库和依赖,甚至要接入一些框架,可能在还没开始微调就已经因为...

大模型DeepSeek本地部署后如何进行自定义调整?

1.理解模型架构a)查看深度求索官方文档或提供的源代码文件,了解模型的结构、输入输出格式以及支持的功能。模型是否为预训练权重?如果是,可以在预训练的基础上进行微调(Fine-tuning)。是否需要...

因配置不当,约5000个AI模型与数据集在公网暴露

除了可访问机器学习模型外,暴露的数据还可能包括训练数据集、超参数,甚至是用于构建模型的原始数据。前情回顾·人工智能安全动态向ChatGPT植入恶意“长期记忆”,持续窃取用户输入数据多模态大语言模型的致...

基于pytorch的深度学习人员重识别

基于pytorch的深度学习人员重识别Torchreid是一个库。基于pytorch的深度学习人员重识别。特点:支持多GPU训练支持图像的人员重识别与视频的人员重识别端到端的训练与评估简单的re...

DeepSeek本地部署:轻松训练你的AI模型

引言:为什么选择本地部署?在AI技术飞速发展的今天,越来越多的企业和个人希望将AI技术应用于实际场景中。然而,对于一些对数据隐私和计算资源有特殊需求的用户来说,云端部署可能并不是最佳选择。此时,本地部...

谷歌今天又开源了,这次是Sketch-RNN

前不久,谷歌公布了一项最新技术,可以教机器画画。今天,谷歌开源了代码。在我们研究其代码之前,首先先按要求设置Magenta环境。(https://github.com/tensorflow/magen...

Tensorflow 使用预训练模型训练的完整流程

前面已经介绍了深度学习框架Tensorflow的图像的标注和训练数据的准备工作,本文介绍一下使用预训练模型完成训练并导出训练的模型。1.选择预训练模型1.1下载预训练模型首先需要在Tensorf...

30天大模型调优学习计划(30分钟训练大模型)

30天大模型调优学习计划,结合Unsloth和Lora进行大模型微调,掌握大模型基础知识和调优方法,熟练应用。第1周:基础入门目标:了解大模型基础并熟悉Unsloth等工具的基本使用。Day1:大模...

python爬取喜马拉雅音频,json参数解析

一.抓包分析json,获取加密方式1.抓包获取音频界面f12打开抓包工具,播放一个(非vip)视频,点击“媒体”单击打开可以复制URL,发现就是我们要的音频。复制“CKwRIJEEXn-cABa0Tg...

五、JSONPath使用(Python)(json数据python)

1.安装方法pipinstalljsonpath2.jsonpath与Xpath下面表格是jsonpath语法与Xpath的完整概述和比较。Xpathjsonpath概述/$根节点.@当前节点...

Python网络爬虫的时候json=就是让你少写个json.dumps()

大家好,我是皮皮。一、前言前几天在Python白银交流群【空翼】问了一个Python网络爬虫的问题,提问截图如下:登录请求地址是这个:二、实现过程这里【甯同学】给了一个提示,如下所示:估计很多小伙伴和...