读《大型分布式网站架构 设计与实践》

读《大型分布式网站架构 设计与实践》

一本大杂会的书,什么都提到点。

可能是作者把自己遇到过的技术点都写一些吧。

 

URL 链接风格:

RPC 风格

REST 风格

 

基于 HTTP 协议的 RPC 的实现

 

sed 编辑器方便动态地修改文本

awk 在流编辑方面比 sed 更为先进

awk '/google/{print $5,$6}' access.log | head -10

筛选指定的行,并且打印出其中一部分列,查找 google 的行并且打印第五、第六列。

awk 'length($0)>40{print $3}' access.log | head -10

筛选长度大于40的第一列,打印出第3列

 

离线数据分析 Hadoop