如何在新的迭代器中产生迭代器中的元素?
我需要一个迭代器遍历我的JSON对象中的所有叶子。所以我写了这个功能如何在新的迭代器中产生迭代器中的元素?
rec = {'a': {'b': [{'c': {'d': [{'e': 'x1','f': 'x2'}],'g': 'x3'}}],'h': 'x4','i': 'x5','j': [{'k': 'x6'}],'l': [{'m': {'n': 'x7'}}]}}
def yield_leaves(rec, lbl = ''):
if isinstance(rec, dict):
for key, value in rec.items():
for to_yield in yield_leaves(value, key):
yield to_yield
if isinstance(rec, list):
for value in rec:
for to_yield in yield_leaves(value, lbl):
yield to_yield
if isinstance(rec, (int, str)):
for entry in rec.split():
yield entry, lbl
print(list(yield_leaves(rec)))
>>> [('x5', 'i'), ('x4', 'h'), ('x1', 'e'), ('x2', 'f'), ('x3', 'g'), ('x6', 'k'), ('x7', 'n')]
但我觉得有些代码是多余的。以下行
for to_yield in yield_leaves(value, key):
yield to_yield
它遍历一个迭代,并返回值作为一个迭代的一部分。
你知道更有效的方法来编码吗?
你的最后一节
if isinstance(rec, (int, str)):
for entry in rec.split():
yield entry, lbl
是有点怪。如果rec
是int
,它会崩溃,因为整数没有.split
方法。而且你的字符串都不包含空格,所以在它们上调用.split
将返回一个包含单个项目的列表:原始字符串。我想你的真实数据可能包含你想要分割的多字字符串,但如果是这样,你真的需要从int
s分开处理。
因此,假设你不是有你想拆分的多字值,我简化了你的代码。正如你所看到的,我只保留了dict
和list
测试中,由于数据是从JSON解码,任何其他类型的rec
将是某种形式的标量:int
,str
,bool
,或None
,(除非你已经创建一个自定义解码),并且我们可以相同地处理所有这些标量类型。
rec = {
'a': {
'b': [
{
'c': {
'd': [{'e': 'x1', 'f': 'x2'}],
'g': 'x3'
}
}
],
'h': 'x4',
'i': 'x5',
'j': [{'k': 'x6'}],
'l': [{'m': {'n': 'x7'}}]
}
}
def yield_leaves(rec, lbl=''):
if isinstance(rec, dict):
for key, value in rec.items():
yield from yield_leaves(value, key)
elif isinstance(rec, list):
for value in rec:
yield from yield_leaves(value, lbl)
else:
yield rec, lbl
print(list(yield_leaves(rec)))
输出
[('x1', 'e'), ('x2', 'f'), ('x3', 'g'), ('x4', 'h'), ('x5', 'i'), ('x6', 'k'), ('x7', 'n')]
该代码使用Python 3特征yield from
;如果你不使用Python 3,你应该。 :)
是的,''''''产量'''做我想要的。谢谢。 –
关于在整数上调用split,你是对的。不好的复制粘贴在我身边 –
@RobRomijnders不用担心。如果我的回答对你有帮助,请考虑[接受](http://meta.stackexchange.com/a/5235)。 –
尝试使用从收益率而不是为
yeild from yield_leaves(value, key)
附:如果您正在使用python> 3.3
是的,'''yield from'''完成任务! –
从yield_leaves(value,key)'yield 3 on Python 3 –