SED替代正则表达式匹配
问题描述:
部分我的数据集的是管道分隔CSV文件:SED替代正则表达式匹配
|B20005G |77|B20005G 077|$2,500 to $4,999|
|B20005G |78|B20005G 078|$5,000 to $7,499|
|B20005G |79|B20005G 079|$7,500 to $9,999|
我的第三个字段与此SED则表达式的行匹配:
sed -n '/|[[:alnum:]]\{7\} [[:digit:]]\{3\}|/p'
现在,有告诉sed的一个方式,在第三个字段删除空间得到这个:
|B20005G |77|B20005G077|$2,500 to $4,999|
|B20005G |78|B20005G078|$5,000 to $7,499|
|B20005G |79|B20005G079|$7,500 to $9,999|
答
像这样
\([[:alnum:]]{7}\) \([[:digit:]]{3}\)
一个正则表达式定义\(\)
之间两个组,那些,我们可以通过参考在所述取代\1
,\2
,所以
sed -n 's/\([[:alnum:]]\{7\}\) \([[:digit:]]\{3\}\)/\1\2/' myfile.txt
它摆脱了两组之间的空间。
答
试试这个awk
方法
awk -F'|' 'BEGIN {OFS="|"} {sub(/ +/,"",$4)}1' FileName
输出:
|B20005G |77|B20005G077|$2,500 to $4,999|
|B20005G |78|B20005G078|$5,000 to $7,499|
|B20005G |79|B20005G079|$7,500 to $9,999|
谢谢你的优雅awk解决方案! –