如何删除以特定字符开头和结尾的文件的明确行
问题描述:
我有许多行的测试文件。我想删除具有特定开始和结束字符的行。如何删除以特定字符开头和结尾的文件的明确行
这里是我的代码:
with open('test.txt', 'r') as f, open('output.txt', 'w') as out:
for i, line in enumerate(f):
if (line.startswith('E3T') and line.endswith('3')):
out.write(line)
elif (line.startswith('E4Q') and line.endswith('3')):
out.write(line)
elif (line.startswith('E4Q') and line.endswith('4')):
out.write(line)
elif (line.startswith('E4Q') and line.endswith('3')):
out.write(line)
elif line.startswith('BC'):
break
这是我的test.txt文件
E3T 1 2 1 3 3
E3T 2 4 2 5 1
E3T 3 3 5 2 4
E3T 3326 2001 2008 1866 10
E4Q 3327 1869 2013 2011 1867 9
E4Q 3328 1867 2011 2012 1868 8
E4Q 3329 1870 2014 2013 1869 4
E3T 8542 4907 4908 4760 5
E3T 8543 4768 4909 4761 9
E3T 8544 4909 4763 4761 6
E3T 17203 9957 9964 10161 3
E3T 17204 9957 10161 9959 2
BC 1 "Zulauf: Temperatur" 12 0 1 "HYDRO_WT-2D"
BC_DEF 12 1 "Temperatur [°C]" 5 "Zeit [s]" "Temperatur [°C]"
和输出应该是这样的:
E3T 1 2 1 3 3
E3T 3 3 5 2 4
E4Q 3329 1870 2014 2013 1869 4
E3T 17203 9957 9964 10161 3
我认为,它确实因空间而不工作。有没有这样做pythonic方式,或者我必须拆分线,然后比较第一和最后charachters?
答
当你以这种方式阅读一条线时,在它的末尾会有一个换行符或一个换行符/换行符,这通常对您来说是“不可见”的。你需要以某种方式处理,否则endswith
将处理它,而不是你想要处理的角色。然后,当你输出一行时,你需要把换行符放回去。
with open('test.txt', 'r') as f, open('output.txt', 'w') as out:
for i, line in enumerate(f):
line = line.strip()
if (line.startswith('E3T') and line.endswith('3')):
out.write(line+'\n')
elif (line.startswith('E4Q') and line.endswith('3')):
out.write(line+'\n')
elif (line.startswith('E4Q') and line.endswith('4')):
out.write(line+'\n')
elif (line.startswith('E4Q') and line.endswith('3')):
out.write(line+'\n')
elif line.startswith('BC'):
break
在这种情况下,我用strip
丢弃在每行的开头和结尾的空白。这是一个非常粗糙的方法。它会更好用,
line = line.rstrip()
它只从字符串的右端剥离空白区域。
编辑,在回答中注释的问题:
替换最后一行上面这几行,
out.write(line+'\n')
else:
continue
谢谢你的解决方案!如果我想写下其余的线并且不要中断,我该怎么办?这意味着文件的其余部分应该与输入文件相同! –
请参阅编辑。 –