试图让之间的站点名称列表“的
问题描述:
cat file | grep "<span class='s-name'>" | awk '/"<span class='s-name'>"/ && /</span>
试图让之间的站点名称列表“的<span class =‘S-名’></span>
一些有关这似乎是错误的。我的意思是,比其他不工作。
我也希望把它变成我敢肯定一个文件就是“文件名”处结束。
答
使用GNUgrep
输入
$ cat infile
<div class='signer'> <span class='s-name'>Bob Lepine</span> <span class='s-title'>Vice President of Content, FamilyLife</span> </div>
输出
$ grep -Po "(?<=<span class='s-name'>).*?(?=</span>)" infile
Bob Lepine
$ grep -Po "(?<=<span class='s-title'>).*?(?=</span>)" infile
Vice President of Content, FamilyLife
答
使用XML/HTML解析器被适当的方式来解析XML/HTML内容,xmlstarlet溶液:
xmlstarlet sel -t -v "//span[@class='s-name']" yourfile
的输出:
Bob Lepine
是否在您的文件中嵌套'span's? – dorukayhan
是的,一行看起来像这样 '
我希望取消标题,所有我关心的是名称,除非我可以同时获得CSV格式。 –