集合是 Python 编程的重要组成部分。它们允许您将多个值分组到一个变量中,从而更轻松地操作和组织数据。Python 提供了四种主要的集合类型,每种类型都针对特定用例而设计:列表、元组、集和字典。
列表 — 多功能 Python 集合
从 Lists 开始。列表是 Python 最通用、使用最广泛的数据结构之一。它们是可变的有序集合,允许重复项,并且可以存储任何数据类型,包括其他列表。
创建和访问列表列表是使用方括号 ([]) 创建的。
fruits = ["apple", "banana", "cherry"]
print(fruits[0]) # Output: apple
列表的主要特点
- 动态调整大小:列表可以动态增大或缩小。
fruits.append("orange")
print(fruits) # Output: ['apple', 'banana', 'cherry', 'orange']
- 索引和切片:访问特定元素或子列表。
print(fruits[1:3]) # Output: ['banana', 'cherry']
常用方法:
- append():将项目添加到列表末尾。
- remove():删除特定项目。
- sort():按升序对列表进行排序。
- reverse():反转列表顺序。
示例用例存储一个待办事项列表,其中任务的顺序很重要,并且可能需要更新任务:
tasks = ["Write article", "Review code", "Submit PR"]
tasks.append("Update documentation")
print(tasks)
Tuples — 不可变和有序
元组类似于列表,但不可更改,这意味着它们的元素在创建后无法更改。它们通常用于固定的项目集合。
创建和访问 Tuples元组是使用括号 (()) 创建的。
coordinates = (10, 20, 30)
print(coordinates[1]) # Output: 20
元组的主要功能
- 不可变性:一旦创建,其元素就无法修改。
dimensions = (1920, 1080)
# dimensions[0] = 1280 # This would raise a TypeError
- Compact Memory Usage:元组比列表更节省内存。
- 元组打包和解包:
point = (4, 5)
x, y = point # Unpacking
print(x, y) # Output: 4 5
示例用例元组非常适合表示固定数据,例如地理坐标或 RGB 颜色值:
rgb_color = (255, 0, 128) # Immutable representation of a color
Sets — 无序和唯一集合
集是无序、可变且不允许重复值的集合。它们非常适合涉及唯一性或成员资格测试的任务。
创建和访问 Sets集是使用大括号 ({}) 或 set() 构造函数创建的。
unique_numbers = {1, 2, 3, 4, 4} # Duplicate 4 will be ignored
print(unique_numbers) # Output: {1, 2, 3, 4}
Sets 的主要特点
- 无重复项:自动删除重复项。
items = ["apple", "banana", "apple"]
unique_items = set(items)
print(unique_items) # Output: {'apple', 'banana'}
- Unordered:元素没有特定的顺序,并且不支持索引。
Set 操作:
- Union:合并两个集合中的元素。
set_a = {1, 2, 3}
set_b = {3, 4, 5}
print(set_a | set_b) # Output: {1, 2, 3, 4, 5}
- 交集:集合之间的公共元素。
print(set_a & set_b) # Output: {3}
- 差异:元素在一个集合中,但不在另一个集合中。
print(set_a - set_b) # Output: {1, 2}
示例用例集非常适合从列表中删除重复项或检查成员资格。
emails = ["user1@example.com", "user2@example.com", "user1@example.com"]
unique_emails = set(emails)
print(unique_emails) # Output: {'user1@example.com', 'user2@example.com'}
Dictionaries — 结构化数据的键值对
字典是强大的数据结构,可将数据存储为键值对。它们是可变的、无序的,并且针对快速查找进行了优化。
创建和访问词典词典是使用大括号 ({}) 创建的,键值对用冒号分隔。
user_profile = {"name": "Alice", "age": 25, "email": "alice@example.com"}
print(user_profile["name"]) # Output: Alice
词典的主要特点
键值对:
- 键必须是唯一且不可变的(例如,字符串、数字、元组)。
- 值可以是任何数据类型。
user = {"id": 1, "username": "jdoe", "active": True}
添加和更新值:
user_profile["location"] = "New York" # Add a new key-value pair
user_profile["age"] = 26 # Update an existing key
print(user_profile)
- 常用方法:
- keys():检索所有 key。
- values():检索所有值。
- items():以元组形式检索所有键值对。
示例用例字典非常适合表示结构化数据,例如类似 JSON 的对象或配置。
config = {
"host": "localhost",
"port": 5432,
"database": "example_db"
}
print(config["host"]) # Output: localhost
Python 集合类型比较
每种 Python 集合类型都有不同的用途,了解它们的差异可以帮助您为您的使用案例选择合适的集合类型。
Python 中集合类型的功能
示例场景:
- 列表:将商品存储在购物车中。
- Tuple:表示一对固定的纬度和经度。
- Set(设置):检查活动中的唯一参与者。
- 字典:存储以标识符作为键的用户配置文件。
集合类型的常见陷阱
虽然 Python 集合用途广泛,但如果处理不当,一些常见的陷阱可能会导致错误或效率低下。
列表:
- 可变性问题:如果多个变量引用同一列表,则就地修改列表可能会导致意外行为。
a = [1, 2, 3]
b = a
b.append(4)
print(a) # Output: [1, 2, 3, 4]
元组:
- 不可变性假设:虽然元组是不可变的,但它们可以包含可以修改的可变对象。
t = ([1, 2], 3)
t[0].append(4)
print(t) # Output: ([1, 2, 4], 3)
套装:
- Unhashable Elements:将可变或不可哈希的元素(如列表或字典)添加到集合中将引发 TypeError。
s = {1, 2, [3, 4]} # Raises TypeError: unhashable type: 'list'
词典:
- 密钥错误:尝试访问不存在的密钥将引发 KeyError。
user = {"name": "Alice"}
print(user["age"]) # KeyError: 'age'
使用带有默认值的 .get() 来避免这种情况:
print(user.get("age", "N/A")) # Output: N/A
选择正确的产品系列类型
在决定使用哪个集合时,请考虑任务的特定要求:
- 将列表用于有序集合、动态集合和通用集合。
- 当不可变性和固定顺序很重要时,请使用 Tuples。
- 使用集进行成员资格测试和确保唯一性。
- 使用字典进行键值存储和快速查找。
决策示例:
- 您需要确保没有重复项吗?使用集合。
- 您需要将键映射到值吗?使用字典。
- 您需要维护秩序并允许更改吗?使用列表。
- 您需要一个固定的、不变的集合吗?使用元组。