解析含有作为R

问题描述:

多个节的文本文件我有一个包含130个表,由分隔符' DLM'分离的文本文件。我尝试在R中使用包reader,并按如下方式定义了默认分隔符,但它仍然读取整个文件。解析含有作为R

reader::reader("Path_to_file.txt", def= "\\' DLM'", one.byte = FALSE) 

是否可以解析文件并只读取特定于表名的行?例如,如果我指定'B2',我可以只读取表格B2的行吗?我似乎无法解决阅读器中的分隔符问题。任何帮助表示赞赏!

样本数据集:

'A1',2018,10,'655033655206 1',,,81, 
'A1',2019,4,'655033655206 1',,,63, 
'A1',2011,1,'655034655045 1',.03486,.05829,52, 


' DLM','B2',2011,1,'5BON AQUA TP',361239,161,,,0, 
'B2',2001,1,'5BON AQUA TN',361240,161,22.7,4.97,0, 
'B2',2002,1,'5CON FIRE TN',363240,161,22.7,4.97,0, 


' DLM','C1','CGDF09', 
'C1','W XYZ', 
'C1','A BCD', 

也许尝试删除分隔符,然后检查其符合'B2'开始? 您可以使用此功能stringi包:

stri_startswith_fixed(c("A1,1,2,3","B2,3,4,5","C2,3,,5"), "B2") 
# [1] FALSE TRUE FALSE 
+1

谢谢,这真的帮助。我能够根据字符串匹配来解析表格。每个表格的标题必须以稍微不同的方式获得,因为它与分隔符“DLM”位于同一行。 –

+0

如果答案是有帮助的,你可以接受和赞成它。 :) – bartektartanus

+1

我在一个小时前接受它;我现在会赞成它:) –