递归解析所有XML文件并排除文件夹
问题描述:
我想解析给定文件夹/子文件夹中的所有XML文件,并搜索并替换该XML内的文本。同时排除子文件夹“存档”。我得到的错误“AttributeError:'NoneType'对象没有属性'替换'”不知道我错过了什么,但是我的循环似乎死了一旦它到达ElementTree来打开和解析XML。递归解析所有XML文件并排除文件夹
for roots, dirs, files in os.walk("C:\test", topdown=True):
if 'Archive' in dirs:
dirs.remove('Archive')
#dirs[:] = [d for d in dirs if 'Archive' not in d]
for f in files:
if f.endswith('.xml'):
try:
with open(os.path.join(roots, f), 'r') as xml:
tree = ET.parse(xml)
root = tree.getroot()
for elem in root.getiterator():
try:
print (elem.text)
elem.text = elem.text.replace('_THUMBNAIL.jpg', '.mxd.jpg')
except ET.ParseError:
pass
tree.write(xml, encoding='utf-8')
except FileNotFoundError:
pass
答
我猜并不是所有的XML标签都有文本。所以你应该使用
if elem.text is not None :
try:
print (elem.text)
elem.text = elem.text.replace('_THUMBNAIL.jpg', '.mxd.jpg')
嗯没有骰子。这似乎忽略了一切。 – Infinity8
你可以显示你的xml的一小部分吗?看起来很奇怪。 – VdF