如何删除以特定字符开头和结尾的文件的明确行

问题描述:

我有许多行的测试文件。我想删除具有特定开始和结束字符的行。如何删除以特定字符开头和结尾的文件的明确行

这里是我的代码:

with open('test.txt', 'r') as f, open('output.txt', 'w') as out: 
    for i, line in enumerate(f): 
     if (line.startswith('E3T') and line.endswith('3')): 
      out.write(line) 
     elif (line.startswith('E4Q') and line.endswith('3')): 
      out.write(line) 
     elif (line.startswith('E4Q') and line.endswith('4')): 
      out.write(line) 
     elif (line.startswith('E4Q') and line.endswith('3')): 
      out.write(line) 
     elif line.startswith('BC'): 
      break 

这是我的test.txt文件

E3T 1 2 1 3 3 
E3T 2 4 2 5 1 
E3T 3 3 5 2 4 
E3T 3326 2001 2008 1866 10 
E4Q 3327 1869 2013 2011 1867 9 
E4Q 3328 1867 2011 2012 1868 8 
E4Q 3329 1870 2014 2013 1869 4 
E3T 8542 4907 4908 4760 5 
E3T 8543 4768 4909 4761 9 
E3T 8544 4909 4763 4761 6 
E3T 17203 9957 9964 10161 3 
E3T 17204 9957 10161 9959 2 
BC 1 "Zulauf: Temperatur" 12 0 1 "HYDRO_WT-2D" 
BC_DEF 12 1 "Temperatur [°C]" 5 "Zeit [s]" "Temperatur [°C]" 

和输出应该是这样的:

E3T 1 2 1 3 3 
E3T 3 3 5 2 4 
E4Q 3329 1870 2014 2013 1869 4 
E3T 17203 9957 9964 10161 3 

我认为,它确实因空间而不工作。有没有这样做pythonic方式,或者我必须拆分线,然后比较第一和最后charachters?

当你以这种方式阅读一条线时,在它的末尾会有一个换行符或一个换行符/换行符,这通常对您来说是“不可见”的。你需要以某种方式处理,否则endswith将处理它,而不是你想要处理的角色。然后,当你输出一行时,你需要把换行符放回去。

with open('test.txt', 'r') as f, open('output.txt', 'w') as out: 

    for i, line in enumerate(f): 
     line = line.strip() 
     if (line.startswith('E3T') and line.endswith('3')): 
      out.write(line+'\n') 
     elif (line.startswith('E4Q') and line.endswith('3')): 
      out.write(line+'\n') 
     elif (line.startswith('E4Q') and line.endswith('4')): 
      out.write(line+'\n') 
     elif (line.startswith('E4Q') and line.endswith('3')): 
      out.write(line+'\n') 
     elif line.startswith('BC'): 
      break 

在这种情况下,我用strip丢弃在每行的开头和结尾的空白。这是一个非常粗糙的方法。它会更好用,

line = line.rstrip() 

它只从字符串的右端剥离空白区域。

编辑,在回答中注释的问题:

替换最后一行上面这几行,

out.write(line+'\n') 
else: 
    continue 
+0

谢谢你的解决方案!如果我想写下其余的线并且不要中断,我该怎么办?这意味着文件的其余部分应该与输入文件相同! –

+0

请参阅编辑。 –