如何在python中读取yaml文件时跳过行?
我很熟悉类似的问题,但他们似乎没有解决什么应该是一个简单的问题。我正在使用Python 2.7x并尝试读取与此类似的YAML文件:如何在python中读取yaml文件时跳过行?
%YAML:1.0
radarData: !!opencv-matrix
rows: 5
cols: 2
dt: u
data: [0, 0, 0, 0, 0, 10, 5, 3, 1, 22]
现在我只需要'data:'文档。我尝试了一种香草方法,然后尝试强制跳过前四行(注释掉的第二个代码片段)。两种方法都有错误。
import yaml
stream = file('test_0x.yml', 'r')
yaml.load(stream)
# alternative code snippet
# with open('test_0x.yml') as f:
# stream = f.readlines()[4:]
# yaml.load(stream)
任何关于如何跳过前几行的建议将非常感激。
其实,你只需要跳过前两行。
import yaml
skip_lines = 2
with open('test_0x.yml') as infile:
for i in range(skip_lines):
_ = infile.readline()
data = yaml.load(infile)
>>> data
{'dt': 'u', 'rows': 5, 'data': [0, 0, 0, 0, 0, 10, 5, 3, 1, 22], 'cols': 2}
>>> data['data']
[0, 0, 0, 0, 0, 10, 5, 3, 1, 22]
跳过前5行也可以。
我完全错过了这里的观点,但我留下了我的原始答案在底部作为一个谦卑的提醒。
mhawke的回答简短而甜蜜,可能更可取。一个更复杂的解决方案:去除格式错误的指令,更正自定义标签并为其添加构造函数。这样做的好处是无论出现在文件中的哪个位置都要纠正该标签,而不仅仅是前几行。
我在这里的实现确实有一些缺点 - 它搅乱了整个文件,而且它还没有在复杂的数据上进行过测试,用适当的替换标记的效果可能会与预期不同。
import yaml
def strip_malformed_directive(yaml_file):
"""
Strip a malformed YAML directive from the top of a file.
Returns the slurped (!) file.
"""
lines = list(yaml_file)
first_line = lines[0]
if first_line.startswith('%') and ":" in first_line:
return "\n".join(lines[1:])
else:
return "\n".join(lines)
def convert_opencvmatrix_tag(yaml_events):
"""
Convert an erroneous custom tag, !!opencv-matrix, to the correct
!opencv-matrix, in a stream of YAML events.
"""
for event in yaml_events:
if hasattr(event, "tag") and event.tag == u"tag:yaml.org,2002:opencv-matrix":
event.tag = u"!opencv-matrix"
yield event
yaml.add_constructor("!opencv-matrix", lambda loader, node: None)
with open("test_0x.yml") as yaml_file:
directive_processed = strip_malformed_directive(yaml_file)
yaml_events = yaml.parse(directive_processed)
matrix_tag_converted = convert_opencvmatrix_tag(yaml_events)
fixed_document = yaml.emit(matrix_tag_converted)
data = yaml.load(fixed_document)
print data
原来的答案
这yaml.load
功能你用回报的字典,它可以像这样访问:
import yaml
with open("test_0x.yml") as yaml_file:
test_data = yaml.load(yaml_file)
print test_data["data"]
这是否帮助?
我认为你错过了这一点,这是第2升ines不是有效的YAML,必须跳过。 – mhawke 2015-01-21 03:31:36
你完全正确。好,赶快,谢谢。 – spirulence 2015-01-21 03:42:56
我已经aruco_calibration_fromimages.exe生成的摄像机矩阵,这里是YML文件:
%YAML:1.0
---
image_width: 4000
image_height: 3000
camera_matrix: !!opencv-matrix
rows: 3
cols: 3
dt: d
data: [ 3.1943912478853654e+03, 0., 1.9850941722590378e+03, 0.,
3.2021356095317910e+03, 1.5509955246019449e+03, 0., 0., 1. ]
distortion_coefficients: !!opencv-matrix
rows: 1
cols: 5
dt: d
data: [ 1.3952810090687282e-01, -3.8313647492178071e-01,
5.0555840762660396e-03, 2.3753464602670597e-03,
3.3952514744179502e-01 ]
加载此阳明与此代码:
import cv2
fs = cv2.FileStorage("./calib_asus_chess/cam_calib_asus.yml", cv2.FILE_STORAGE_READ)
fn = fs.getNode("camera_matrix")
print(fn.mat())
而得到这样的结果:
[[ 3.19439125e+03 0.00000000e+00 1.98509417e+03]
[ 0.00000000e+00 3.20213561e+03 1.55099552e+03]
[ 0.00000000e+00 0.00000000e+00 1.00000000e+00]]
感谢双方抽出时间,但@mhawke是正确的。 FWIW--数据文件的一次转化有4个非yaml行。再次,谢谢! – Aengus 2015-01-21 11:09:00
我身上的那个坚持者说要小心,把这些行称为“非YAML”。从长远来看,如果您遇到很多我称之为“不太严格”的YAML,那么建立预处理步骤可以使数据稳健地符合数据,而不是依赖数据中的键的顺序。也就是说,不要修补没有破坏的东西。 – spirulence 2015-01-21 16:54:37