在列表中识别连续重复的最Pythonic方法是什么?
我有一个整数列表,我希望能够识别连续的重复块:也就是说,我想产生一个保存顺序的列表,其中包含每个duples包含的(int_in_question,发生次数)。在列表中识别连续重复的最Pythonic方法是什么?
举例来说,如果我有这样的列表:
[0, 0, 0, 3, 3, 2, 5, 2, 6, 6]
我想要得到的结果是:
[(0, 3), (3, 2), (2, 1), (5, 1), (2, 1), (6, 2)]
我有一个换这样的相当简单的方法循环,温度和计数器:
result_list = []
current = source_list[0]
count = 0
for value in source_list:
if value == current:
count += 1
else:
result_list.append((current, count))
current = value
count = 1
result_list.append((current, count))
但我真的很喜欢Python的func编程习惯用法,我希望能够用简单的生成器表达式来实现这一点。但是,我发现使用生成器时很难保持子计数。我有一种感觉,两步过程可能会让我在那里,但现在我很难过。
是否有一个特别优雅/ pythonic的方式来做到这一点,尤其是与发电机?
>>> from itertools import groupby
>>> L = [0, 0, 0, 3, 3, 2, 5, 2, 6, 6]
>>> grouped_L = [(k, sum(1 for i in g)) for k,g in groupby(L)]
>>> # Or (k, len(list(g))), but that creates an intermediate list
>>> grouped_L
[(0, 3), (3, 2), (2, 1), (5, 1), (2, 1), (6, 2)]
Batteries included,就像他们说的那样。
建议使用和来自JBernardo的生成器表达式;见评论。
非常好,这正是我所期待的。感谢帮助,非常感谢。 – 2011-06-15 02:57:27
@machine:不客气! – 2011-06-15 02:58:00
+1,也许你可以改变'len(list(g))''sum(1 for g)'来避免中间存储。 – JBernardo 2011-06-15 03:03:57
仅供参考,此过程称为: http://en.wikipedia.org/wiki/Run-length_encoding – 2013-04-14 14:57:55