许多Python新手在数据清洗时,仍在使用笨拙的for循环删除列表元素。殊不知这会导致O(n^2)时间复杂度,当处理百万级数据时,耗时将暴增600%。今天我们来看下列表删除元素的四大天王,看看谁更厉害!
一、remove单杀无敌
首先,我们来看remove()方法,上代码:
animals = ["", "", "", ""]
animals.remove("")
print(animals)
运行结果:
['', '', '']
代码解读:remove()根据值删除元素,但只会删除第一个匹配项。当处理重复数据时,容易造成"漏删"现象,这是列表操作中最常见的隐藏bug。
二、 毁灭者del的AOE
matrix = [[1,2], [3,4], [5,6]]
del matrix[1:3] # 删除索引1到2(不含3)
print(matrix) # [[1, 2]]
del matrix
print(matrix) # NameError: name 'matrix' is not defined
运行结果:
[[1, 2]]
NameError: name 'matrix' is not defined
开发技巧:del支持切片删除和多维数据结构操作,也支持直接删除整个列表变量。可删除后这个变量就被毁灭了,存储的数据也就没了,所以使用del删除操作请务必谨慎!
三、背刺之王pop()的意外惊喜
stack = ["", "", ""]
last_item = stack.pop()
print(f"取出 {last_item},剩余 {stack}")
cache = ["A", "B", "C", "D"]
cache.pop(0)
print(cache)
运行结果:
取出 ,剩余 ['', '']
['B', 'C', 'D']
从代码中我们看出,当无参数的时候,pop()的默认用法是将列表的最后一个元素踢出列表并返回,所以我们可以通过pop()的返回值获取列表的最后一个元素。而给pop()设置一个索引值的时候,我们也可以获取对应索引的值。pop()的返回值特性,使其天然适合实现栈(先进后出)、队列(先进先出)等数据结构,这是其他删除方法做不到的。
四、杀手之王clear()的终极清场
chat_history = ["你好", "吃了吗", "在干嘛"]
chat_history.clear()
print(chat_history)
运行结果:
[]
clear()的用法是直接删除列表中的所有元素。
clear()与del()的区别:这两者都可以删除列表中的所有元素,他们之间有什么区别呢?
temp = [1,2,3];
del temp # 完全销毁
print(temp)
temp2 = [4,5,6]
temp2.clear() # 清空但保留壳
print(temp2) # []
运行结果:
NameError: name 'matrix' is not defined
[]
从运行结果我们可以知道,del()删除的时候是将变量列表都删除了,所以会提示变量'matrix'没有被定义。而clear()则只会删除列表中的元素,存储元素的这个变量外壳还被保留了下来。
易错点警报
- 循环删除黑洞:在遍历列表时删除元素会导致索引错乱(这个错误在Python新手期很常见),请看示例代码:
# 删除列表中的偶数
numbers = [1, 2, 4, 6, 7, 8]
for num in numbers:
if num % 2 == 0:
numbers.remove(num)
print(numbers)
运行结果:
[1, 4, 7]
运行结果中遗留了偶数4,为什么会出现这种情况呢?下面我们来分析一下代码运行的过程:初始列表索引:[0:1, 1:2, 2:4, 3:6, 4:7, 5:8],当删除索引1的元素2后,列表变为 [1,4,6,7,8],循环继续处理下一个索引2(原列表的索引3),此时元素是6(正确应处理新列表的索引1元素4),结果导致元素4被跳过未被删除。
我们可以用以下三种方案来解决这个问题:
# 方法1:创建新列表
numbers = [1, 2, 4, 6, 7, 8]
numbers = [num for num in numbers if num % 2 != 0]
# 方法2:倒序遍历(避免索引前移)
for num in reversed(numbers):
if num % 2 == 0:
numbers.remove(num)
# 方法3:遍历副本
for num in numbers.copy():
if num % 2 == 0:
numbers.remove(num)
运行结果:
[1, 7]
这三种方案都可以完整的删除列表中的偶数,不引起索引的混乱。
- pop()的致命空弹:空列表使用pop会引发IndexError
empty = []
empty.pop()
运行结果:
IndexError: pop from empty list
错误提示:索引错误,对空列表进行pop操作。这个错误提示很直白的告诉我们,不可以对空列表进行pop操作。
练习
基础题:删除列表["","","",""]中所有的瓜类水果(以""结尾)
进阶题:实现函数批量删除列表中的素数(要求时间复杂度O(n))
彩蛋题:当执行 [1,2,3].remove(4) 时会发生什么?如何优雅处理?
上期文章练习参考答案
基础题答案
lst = []
for c in "hello":
lst.append(c)
进阶题答案
class RingBuffer:
def __init__(self):
self.buffer = []
def add(self, item):
if len(self.buffer) >= 5:
self.buffer.pop(0)
self.buffer.append(item)
彩蛋题答案
def reverse_list(lst):
res = []
for x in lst:
res.insert(0, x)
return res