百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

了解Python集合类型的特性和最佳用例:列表、元组、集合和字典

liuian 2025-02-18 12:24 11 浏览

集合是 Python 编程的重要组成部分。它们允许您将多个值分组到一个变量中,从而更轻松地操作和组织数据。Python 提供了四种主要的集合类型,每种类型都针对特定用例而设计:列表元组字典

列表 — 多功能 Python 集合

从 Lists 开始。列表是 Python 最通用、使用最广泛的数据结构之一。它们是可变的有序集合,允许重复项,并且可以存储任何数据类型,包括其他列表。

创建和访问列表列表是使用方括号 ([]) 创建的。

fruits = ["apple", "banana", "cherry"]
print(fruits[0])  # Output: apple

列表的主要特点

  • 动态调整大小:列表可以动态增大或缩小。
fruits.append("orange")
print(fruits)  # Output: ['apple', 'banana', 'cherry', 'orange']
  • 索引和切片:访问特定元素或子列表。
print(fruits[1:3])  # Output: ['banana', 'cherry']

常用方法

  • append():将项目添加到列表末尾。
  • remove():删除特定项目。
  • sort():按升序对列表进行排序。
  • reverse():反转列表顺序。

示例用例存储一个待办事项列表,其中任务的顺序很重要,并且可能需要更新任务:

tasks = ["Write article", "Review code", "Submit PR"]
tasks.append("Update documentation")
print(tasks)

Tuples — 不可变和有序

元组类似于列表,但不可更改,这意味着它们的元素在创建后无法更改。它们通常用于固定的项目集合。

创建和访问 Tuples元组是使用括号 (()) 创建的。

coordinates = (10, 20, 30)
print(coordinates[1])  # Output: 20

元组的主要功能

  • 不可变性:一旦创建,其元素就无法修改。
dimensions = (1920, 1080)
# dimensions[0] = 1280  # This would raise a TypeError
  • Compact Memory Usage:元组比列表更节省内存。
  • 元组打包和解包
point = (4, 5)
x, y = point  # Unpacking
print(x, y)  # Output: 4 5

示例用例元组非常适合表示固定数据,例如地理坐标或 RGB 颜色值:

rgb_color = (255, 0, 128)  # Immutable representation of a color

Sets — 无序和唯一集合

集是无序、可变且不允许重复值的集合。它们非常适合涉及唯一性或成员资格测试的任务。

创建和访问 Sets集是使用大括号 ({}) 或 set() 构造函数创建的。

unique_numbers = {1, 2, 3, 4, 4}  # Duplicate 4 will be ignored
print(unique_numbers)  # Output: {1, 2, 3, 4}

Sets 的主要特点

  • 无重复项:自动删除重复项。
items = ["apple", "banana", "apple"]
unique_items = set(items)
print(unique_items)  # Output: {'apple', 'banana'}
  • Unordered:元素没有特定的顺序,并且不支持索引。

Set 操作

  • Union:合并两个集合中的元素。
set_a = {1, 2, 3}
set_b = {3, 4, 5}
print(set_a | set_b)  # Output: {1, 2, 3, 4, 5}
  • 交集:集合之间的公共元素。
print(set_a & set_b)  # Output: {3}
  • 差异:元素在一个集合中,但不在另一个集合中。
print(set_a - set_b)  # Output: {1, 2}

示例用例集非常适合从列表中删除重复项或检查成员资格。

emails = ["user1@example.com", "user2@example.com", "user1@example.com"]
unique_emails = set(emails)
print(unique_emails)  # Output: {'user1@example.com', 'user2@example.com'}

Dictionaries — 结构化数据的键值对

字典是强大的数据结构,可将数据存储为键值对。它们是可变的、无序的,并且针对快速查找进行了优化。

创建和访问词典词典是使用大括号 ({}) 创建的,键值对用冒号分隔。

user_profile = {"name": "Alice", "age": 25, "email": "alice@example.com"}
print(user_profile["name"])  # Output: Alice

词典的主要特点

键值对

  • 键必须是唯一且不可变的(例如,字符串、数字、元组)。
  • 值可以是任何数据类型。
user = {"id": 1, "username": "jdoe", "active": True}

添加和更新值

user_profile["location"] = "New York"  # Add a new key-value pair
user_profile["age"] = 26  # Update an existing key
print(user_profile)
  • 常用方法
  • keys():检索所有 key。
  • values():检索所有值。
  • items():以元组形式检索所有键值对。

示例用例字典非常适合表示结构化数据,例如类似 JSON 的对象或配置。

config = {
    "host": "localhost",
    "port": 5432,
    "database": "example_db"
}
print(config["host"])  # Output: localhost

Python 集合类型比较

每种 Python 集合类型都有不同的用途,了解它们的差异可以帮助您为您的使用案例选择合适的集合类型。

Python 中集合类型的功能

示例场景:

  1. 列表:将商品存储在购物车中。
  2. Tuple:表示一对固定的纬度和经度。
  3. Set(设置):检查活动中的唯一参与者。
  4. 字典:存储以标识符作为键的用户配置文件。

集合类型的常见陷阱

虽然 Python 集合用途广泛,但如果处理不当,一些常见的陷阱可能会导致错误或效率低下。

列表

  • 可变性问题:如果多个变量引用同一列表,则就地修改列表可能会导致意外行为。
a = [1, 2, 3]
b = a
b.append(4)
print(a)  # Output: [1, 2, 3, 4]

元组

  • 不可变性假设:虽然元组是不可变的,但它们可以包含可以修改的可变对象。
t = ([1, 2], 3)
t[0].append(4)
print(t)  # Output: ([1, 2, 4], 3)

套装

  • Unhashable Elements:将可变或不可哈希的元素(如列表或字典)添加到集合中将引发 TypeError
s = {1, 2, [3, 4]}  # Raises TypeError: unhashable type: 'list'

词典

  • 密钥错误:尝试访问不存在的密钥将引发 KeyError
user = {"name": "Alice"}
print(user["age"])  # KeyError: 'age'

使用带有默认值的 .get() 来避免这种情况:

print(user.get("age", "N/A"))  # Output: N/A

选择正确的产品系列类型

在决定使用哪个集合时,请考虑任务的特定要求:

  1. 列表用于有序集合、动态集合和通用集合。
  2. 当不可变性和固定顺序很重要时,请使用 Tuples
  3. 使用进行成员资格测试和确保唯一性。
  4. 使用字典进行键值存储和快速查找。

决策示例

  • 您需要确保没有重复项吗?使用集合
  • 您需要将键映射到值吗?使用字典
  • 您需要维护秩序并允许更改吗?使用列表
  • 您需要一个固定的、不变的集合吗?使用元组

相关推荐

GANs为何引爆机器学习?这篇基于TensorFlow的实例教程为你解惑!

「机器人圈导览」:生成对抗网络无疑是机器学习领域近三年来最火爆的研究领域,相关论文层出不求,各种领域的应用层出不穷。那么,GAN到底如何实践?本文编译自Medium,该文作者以一朵玫瑰花为例,详细阐...

高丽大学等机构联合发布StarGAN:可自定义表情和面部特征

原文来源:arXiv、GitHub作者:YunjeyChoi、MinjeChoi、MunyoungKim、Jung-WooHa、SungKim、JaegulChoo「雷克世界」编译:嗯~...

TensorFlow和PyTorch相继发布最新版,有何变化

原文来源:GitHub「机器人圈」编译:嗯~阿童木呀、多啦A亮Tensorflow主要特征和改进在Tensorflow库中添加封装评估量。所添加的评估量列表如下:1.深度神经网络分类器(DNNCl...

「2022 年」崔庆才 Python3 爬虫教程 - 深度学习识别滑动验证码缺口

上一节我们使用OpenCV识别了图形验证码躯壳欧。这时候就有朋友可能会说了,现在深度学习不是对图像识别很准吗?那深度学习可以用在识别滑动验证码缺口位置吗?当然也是可以的,本节我们就来了解下使用深度...

20K star!搞定 LLM 微调的开源利器

LLM(大语言模型)微调一直都是老大难问题,不仅因为微调需要大量的计算资源,而且微调的方法也很多,要去尝试每种方法的效果,需要安装大量的第三方库和依赖,甚至要接入一些框架,可能在还没开始微调就已经因为...

大模型DeepSeek本地部署后如何进行自定义调整?

1.理解模型架构a)查看深度求索官方文档或提供的源代码文件,了解模型的结构、输入输出格式以及支持的功能。模型是否为预训练权重?如果是,可以在预训练的基础上进行微调(Fine-tuning)。是否需要...

因配置不当,约5000个AI模型与数据集在公网暴露

除了可访问机器学习模型外,暴露的数据还可能包括训练数据集、超参数,甚至是用于构建模型的原始数据。前情回顾·人工智能安全动态向ChatGPT植入恶意“长期记忆”,持续窃取用户输入数据多模态大语言模型的致...

基于pytorch的深度学习人员重识别

基于pytorch的深度学习人员重识别Torchreid是一个库。基于pytorch的深度学习人员重识别。特点:支持多GPU训练支持图像的人员重识别与视频的人员重识别端到端的训练与评估简单的re...

DeepSeek本地部署:轻松训练你的AI模型

引言:为什么选择本地部署?在AI技术飞速发展的今天,越来越多的企业和个人希望将AI技术应用于实际场景中。然而,对于一些对数据隐私和计算资源有特殊需求的用户来说,云端部署可能并不是最佳选择。此时,本地部...

谷歌今天又开源了,这次是Sketch-RNN

前不久,谷歌公布了一项最新技术,可以教机器画画。今天,谷歌开源了代码。在我们研究其代码之前,首先先按要求设置Magenta环境。(https://github.com/tensorflow/magen...

Tensorflow 使用预训练模型训练的完整流程

前面已经介绍了深度学习框架Tensorflow的图像的标注和训练数据的准备工作,本文介绍一下使用预训练模型完成训练并导出训练的模型。1.选择预训练模型1.1下载预训练模型首先需要在Tensorf...

30天大模型调优学习计划(30分钟训练大模型)

30天大模型调优学习计划,结合Unsloth和Lora进行大模型微调,掌握大模型基础知识和调优方法,熟练应用。第1周:基础入门目标:了解大模型基础并熟悉Unsloth等工具的基本使用。Day1:大模...

python爬取喜马拉雅音频,json参数解析

一.抓包分析json,获取加密方式1.抓包获取音频界面f12打开抓包工具,播放一个(非vip)视频,点击“媒体”单击打开可以复制URL,发现就是我们要的音频。复制“CKwRIJEEXn-cABa0Tg...

五、JSONPath使用(Python)(json数据python)

1.安装方法pipinstalljsonpath2.jsonpath与Xpath下面表格是jsonpath语法与Xpath的完整概述和比较。Xpathjsonpath概述/$根节点.@当前节点...

Python网络爬虫的时候json=就是让你少写个json.dumps()

大家好,我是皮皮。一、前言前几天在Python白银交流群【空翼】问了一个Python网络爬虫的问题,提问截图如下:登录请求地址是这个:二、实现过程这里【甯同学】给了一个提示,如下所示:估计很多小伙伴和...