在列表中识别连续重复的最Pythonic方法是什么？

问题描述：

我有一个整数列表，我希望能够识别连续的重复块：也就是说，我想产生一个保存顺序的列表，其中包含每个duples包含的（int_in_question，发生次数）。在列表中识别连续重复的最Pythonic方法是什么？

举例来说，如果我有这样的列表：

[0, 0, 0, 3, 3, 2, 5, 2, 6, 6]

我想要得到的结果是：

[(0, 3), (3, 2), (2, 1), (5, 1), (2, 1), (6, 2)]

我有一个换这样的相当简单的方法循环，温度和计数器：

result_list = [] 
current = source_list[0] 
count = 0 
for value in source_list: 
    if value == current: 
     count += 1 
    else: 
     result_list.append((current, count)) 
     current = value 
     count = 1 
result_list.append((current, count))

但我真的很喜欢Python的func编程习惯用法，我希望能够用简单的生成器表达式来实现这一点。但是，我发现使用生成器时很难保持子计数。我有一种感觉，两步过程可能会让我在那里，但现在我很难过。

是否有一个特别优雅/ pythonic的方式来做到这一点，尤其是与发电机？

仅供参考，此过程称为： http://en.wikipedia.org/wiki/Run-length_encoding – 2013-04-14 14:57:55

答

>>> from itertools import groupby 
>>> L = [0, 0, 0, 3, 3, 2, 5, 2, 6, 6] 
>>> grouped_L = [(k, sum(1 for i in g)) for k,g in groupby(L)] 
>>> # Or (k, len(list(g))), but that creates an intermediate list 
>>> grouped_L 
[(0, 3), (3, 2), (2, 1), (5, 1), (2, 1), (6, 2)]

Batteries included，就像他们说的那样。

建议使用和来自JBernardo的生成器表达式;见评论。

非常好，这正是我所期待的。感谢帮助，非常感谢。 – 2011-06-15 02:57:27

@machine：不客气！ – 2011-06-15 02:58:00

+1，也许你可以改变'len（list（g））''sum（1 for g）'来避免中间存储。 – JBernardo 2011-06-15 03:03:57

在列表中识别连续重复的最Pythonic方法是什么？

相关推荐