week4--Linux三剑客sed
一、 Sed 文本处理工具原理及使用
Sed是一种非交互式的流编辑器,可动态编辑文件;流编辑器则会在编辑器处理数据之前基于预先提供的一组
规则来编辑数据流
Sed本身是一个管道命令,可以分析 standard input 的,主要是用来分析关键字的使用、统计等,此外还可
以将数据进行替换、删除、选中、选取特定行等功能
Sed主要用来自动编辑一个或多个文件,可以将数据行进行替换、删除、新增、选取等特定工作,简化对文件的反复操作,编写转换程序等
sed参数表
sed常用命令
sed替换标记:
sed元字符集
^ 匹配行开始,如:/^sed/匹配所有以sed开头的行;
$ 匹配行结束,如:/sed$/匹配所有以sed结尾的行;
. 匹配一个非换行符的任意字符,如:/s.d/匹配s后接一个任意字符,最后是d;
- 匹配0个或多个字符,如:/*sed/匹配所有模板是一个或多个空格后紧跟sed的行;
[] 匹配一个指定范围内的字符,如/[ss]ed/匹配sed和Sed;
[^] 匹配一个不在指定范围内的字符,如:/[^A-RT-Z]ed/匹配不包含A-R和T-Z的一个字母开头,紧跟ed的行;
(…) 匹配子串,保存匹配的字符,如s/(love)able/\1rs,loveable被替换成lovers;
& 保存搜索字符用来替换其他字符,如s/love/&/,love这成love;
< 匹配单词的开始,如:/
> 匹配单词的结束,如/love>/匹配包含以love结尾的单词的行;
x{m} 重复字符x,m次,如:/0{5}/匹配包含5个0的行;
x{m,} 重复字符x,至少m次,如:/0{5,}/匹配至少有5个0的行;
x{m,n} 重复字符x,至少m次,不多于n次,如:/0{5,10}/匹配5~10个0的行;
测试参数详解
1.替换操作
替换操作:替换不在原文本文件中操作,原文本文件不发生改变。
book匹配仅匹配每行开始的第一个book,后续不发生改变。
2.全局替换:g
3.删除操作:d
sed ‘/^KaTeX parse error: Expected 'EOF', got '#' at position 10: /d' file #̲删除空白行 sed '2d' …d’ file #删除第二行到末尾行
sed ‘$d’ file #删除最后一行
sed '/^test/'d file#删除开头以test的行
4.特殊用法
已匹配字符串标记&
正则表达式 \w+ 匹配每一个单词,使用 [&] 替换它,& 对应于之前所匹配到的单词
如下图,&代表匹配到的单词
5.子串匹配标记
#命令中 a 7,被替换成了 7。样式匹配到的子串是 7,**(…) 用于匹配子串,**对于匹配到的第一个子串就标记为 \1,依此类推匹配到的第二个结果就是 \2
代码中利用子串\2替代以匹配的子串6.选定行的范围:,
删除1-3行内容
匹配 book-sk之间的行
#对于模板jack和aaa之间的行,每行的末尾用字符串aaa bbb替换7.从文件读入:r
将file的内容显示在文件/file的匹配行下
追加(行下):a
插入(行上): i