文件操作
help——列出cygwin支持的所有命令
pwd——顯示當前的路徑
ls——顯示當前文件夾中的所有文件
mkdir——建立目錄
rmdir——刪除目錄
rm——刪除文件
cat bj.log ——打開文件
-----------------------------------------------------------------------------------------------------------------------
grep 查找命令
cat access.log | grep 'swf' >1.log——查找包含swf的數(shù)據(jù)并導入到1.log文件中
-----------------------------------------------------------------------------------------------------------------------
wc 統(tǒng)計命令
wc -l log.log ——統(tǒng)計文件行數(shù)
wc -c log.log ——統(tǒng)計文件字節(jié)數(shù)
wc -w log.log ——統(tǒng)計文件單詞數(shù)
-----------------------------------------------------------------------------------------------------------------------
綜合查詢
cat baidu.log|awk '{if($9 ~"200") print $7}'|wc -l ——查詢?nèi)罩疚募?00狀態(tài)碼的行數(shù)
cat baidu.log|grep 'Baiduspider'|awk '{if($9 ~"200") print $7}'|wc -l ——查詢?nèi)罩疚募邪珺aiduspider且狀態(tài)碼為200的行數(shù)
cat baidu.log | awk '{if ($9 ~"200") print $4}'|awk -F ":" '{print $2}'|sort|uniq -c|sort -nrk 1,1|less ——查詢?nèi)罩疚募?00狀態(tài)碼的訪問時間排行
cat baidu.log|awk '{if ($9~ "200") print $7}'||sort|uniq -c|sort -nrk 1,1|less ——查看網(wǎng)站訪問最多的鏈接
cat baidu.txt|awk '{print $9}’|sort|uniq -c ——判斷404情況:統(tǒng)計狀態(tài)碼的指令
cat 404.txt|awk '{print $7}’>>baidu404.txt ——導出鏈接
cat baidu.txt|awk '{print $7}’|sort|uniq -c ——查看一個鏈接被重復抓取的次數(shù)
cat sougou.log|awk '{print $9}'|sort|uniq -c ——統(tǒng)計所有狀態(tài)碼數(shù)量
cat spz.log awk '{print $1}' |sort |uniq|wc -l ——統(tǒng)計有多少IP訪問
cat baidu.log | awk '{print $1}’ | sort | uniq -c | sort -k1r ——每個IP訪問次數(shù)