使用Python解析目录中所有文件的XML标记值

问题描述:

尽管存在类似的问题,但我无法完成跳跃。帮助将受到重视!使用Python解析目录中所有文件的XML标记值

  • 我试图递归解析在目录/子目录所有XML文件
  • 我找一个出现在该标签“操作员ID”

示例源XML值:

<Operators> 
    <Operator id="OId_LD"> 
    <OperatorCode>LD</OperatorCode> 
    <OperatorShortName>ARRIVA THE SHIRES LIMIT</OperatorShortName> 

这是代码我迄今:

from xml.dom.minidom import parse 
import os 
def jarv(target_folder): 
    for root,dirs,files in os.walk(target_folder): 
     for targetfile in files: 
      if targetfile.endswith(".xml"): 
       print targetfile 
       dom=parse(targetfile) 
       name = dom.getElementsByTagName('Operator_id') 
       print name[0].firstChild.nodeValue 

这是我运行的终端命令:

python -c "execfile('xml_tag.py'); jarv('/Users/admin/Projects/AtoB_GTFS')" 

这是错误我收到:

tfl_64-31_-37434-y05.xml

encodings.xml 
Traceback (most recent call last): 
    File "<string>", line 1, in <module> 
    File "xml_tag.py", line 8, in jarv 
    dom=parse(targetfile) 
    File "/usr/local/Cellar/python/2.7.8_1/Frameworks/Python.framework/Versions/2.7/lib/python2.7/xml/dom/minidom.py", line 1918, in parse 
    return expatbuilder.parse(file) 
    File "/usr/local/Cellar/python/2.7.8_1/Frameworks/Python.framework/Versions/2.7/lib/python2.7/xml/dom/expatbuilder.py", line 922, in parse 
    fp = open(file, 'rb') 
IOError: [Errno 2] No such file or directory: 'encodings.xml' 
(frigo)andytmac:AtoB_GTFS admin$ python -c "execfile('xml_tag.py'); jarv('/Users/admin/Projects/AtoB_GTFS')" 
tfl_64-31_-37434-y05.xml 

如果我评论在“打印目标文件”行后面的代码列出了所有我拥有的xml文件。

感谢您的帮助,

安迪

你不看在正确的地方(相对路径):当您使用for root, dirs, files in os.walk(target_folder):files是在目录root的文件名列表,而不是他们的绝对路径。

尝试换装dom=parse(targetfile) by dom = parse(os.sep.join(root, targetfile))