Linux 命令行里的“瑞士军刀”

这里说的“瑞士军刀”是指那些简单的一句命令就能完成其它高级语言一大片代码才能完成的工作。

下面的这些内容是Quora网站上Joshua Levy网友的总结：

通过sort/uniq获取文件内容的交集、合集和不同之处：假设有a、b两个文本文件，文件本身已经去除了重复内容。下面是效率最高的方法，可以处理任何体积的文件，甚至几个G的文件。(Sort对内存没有要求，但也许你需要用 -T 参数。)可以试着比较一下，你可以看看如果用JAVA来处理磁盘上文件的合并，需要用多少行代码。

cat a b | sort | uniq > c # c 是a和b的合集

cat a b | sort | uniq -d > c # c 是a和b的交集

cat a b b | sort | uniq -u > c # c 是a和b的不同

awk ‘{ x += $3 } END { print x }’ myfile

find . -type f -ls

使用xargs命令。这个命令非常的强大。注意每行上你可以控制多少个东西的执行。如果你不确定它是正确的执行，先使用xargs echo。同样，-I{} 也非常有用。例子：

find . -name \*.py | xargs grep some_function

cat hosts | xargs -I{} SSH root@{} hostname

cat access.log | egrep -o ‘acct_id=[0-9]+’ | cut -d= -f2 | sort | uniq -c | sort -rn