读《大型分布式网站架构 设计与实践》
一本大杂会的书,什么都提到点。
可能是作者把自己遇到过的技术点都写一些吧。
URL 链接风格:
RPC 风格
REST 风格
基于 HTTP 协议的 RPC 的实现
sed 编辑器方便动态地修改文本
awk 在流编辑方面比 sed 更为先进
awk '/google/{print $5,$6}' access.log | head -10
筛选指定的行,并且打印出其中一部分列,查找 google 的行并且打印第五、第六列。
awk 'length($0)>40{print $3}' access.log | head -10
筛选长度大于40的第一列,打印出第3列
离线数据分析 Hadoop