LINUX SHELL复习1

1 假如知道一个应用运行，想知道其进程id，可以用：
   pgrep xxxx获得其进程id
再通过
   cat /proc/进程id号/environ
获得其环境变量

2 获得字符串长度
   var=1233333
    length=${#var}

3 判断当前脚本是否超级管理员执行
    if [ $UID -ne 0]; then
    .......

root用户的uid为0

4 sort排序
    sork -nrk 1 data.txt //按第1列逆序排列
其中-k 指定按哪个键进行排序，-r说明是逆序排列，-n表示按数字排序
sort -k 2 data.txt 按data.txt的第2列排序

5 uniq，消除重复的内容
     sort data.txt |uniq
    输出data.txt中不重复的内容
找出文件中重复的行
      sort data.txt |uniq -d
6 根据扩展名切分文件名，比如从sample.jpg中提取文件名
     file_jpg="sample.jpg"
      name=${file_jpg%.*}
      echo $name //输出sample

    extension=${file_jpg#*.}
    输出jpg

   其中，${var%.*}作用为从右到左，删除位于%右侧的字符 ${var%%.*},则右向左匹配最长的字符
   var=asd.sdsdf.fdfdf.txt
   echo ${var%.*} 输出 asd.sdsdf.fdfdf
   echo ${var%%.*} 输出asd
   而#*.则是从左到右，删除#找到的通配符的左测的字符，##则是找最长的
   则echo ${var#*.}输出sdsdf.fdfdf.txt echo ${var##*.} 输出 txt

7 pushd和popd
    这两个命令可以将目录压入栈中，而不用复制粘贴
   pushd /var/www
   则栈中压入了/var/www ，再压入
    pushd /usr/src
   再dirs
   当要切换到某个目录时，则pushd +3 //则切换到目录第3层，从0开始编号
移除 popd

8 grep检索
    1）正则表达式 grep -E "[a-z]+" // 使用E选项
    2）递归检索文件
         grep "xxxx" . -R -n //当前目录下多级递归检索目录
     3）grep -i "HELLO" -i选项，忽略大小写

     4）grep 搜索中包括和排除某些文件
        grep 'test" . -r --include *.{c,txt} 只搜索后缀为c,txt的文件
       不包括：
        grep "test" . -r --exclude "readme"

9 sed
    可以替换给定文本中的字符串
   sed 'xxxxxxx' file
   移除空白行
      sed '/^$d' file

10 AWK
   1）AWK 'BEGIN 语句块' pattern 语句块   end 语句块’
    先执行begin语句块中的语句，然后从文件或者stdin中读取一行，再执行pattern，重复这个过程，直到
文件被完全读完；当读到输入流未尾时，执行end语句块结束
    echo -e "line1\nline2" |awk 'BEGIN {print "start"} {print} end {print "end"}}'
   则输出 Start
          line1
          line2
          end
   2）打印每一行的第2个字段和第3个字段
      awk '{print $2,$3}' file
    3) 统计文件中的行数
        awk 'end {print NR}' file

11 wget -c url //断点续传
   限制速度： wget --limit-rate 20k http://xxxx/xxxx.iso
curl -C url //断点续传
   curl http://xxxxx/index.html -O 将输出写到同名的文件中去
12 使用curl查找网页上的无效链接的bash脚本
    f [ $# -eq 2 ];
then
echo -e "$Usage $0 URL\n"
exit -1;
fi

echo Broken links:

mkdir /tmp/$$.lynx

cd /tmp/$$.lynx

lynx -traversal $1 > /dev/null
count=0;

sort -u reject.dat > links.txt

while read link;
do
output=`curl -I $link -s | grep "HTTP/.*OK"`;
if [[ -z $output ]];
then
echo $link;
let count++
fi

done < links.txt

[ $count -eq 0 ] && echo No broken links found.

首先lynx -traversal url会在工作目录下生成数个文件，其中包括reject.dat,这个文件
中保存网站的所有链接，sort -u用来建立不重复的列表，每次循环则用curl 去检测HTTP 头部

13 tar的几个用法
   1）添加文件
     tar -rvf xxx.tar abc.txt
2) 列出其中内容
     tar -tf aaa.tar
3)只解压缩指定的文件
       tar -xf aaa.tar file1 file3
4)删除tar中的某些文件
    tar --delete --file xxx.tar 要删除的文件

14 查看磁盘空间
    du -h xxx.txt
    du -c -h xxxx（目录名）

15 列出1小时内占用CPU最多的10个进程
   #!/bin/bash
#Name: pcpu_usage.sh
#Description: Script to calculate cpu usage by processes for 1 hour

SECS=3600
#Change the SECS to custom seconds

STEPS=$(( $SECS / 60 ))

echo Watching CPU usage... ;

for((i=0;i<STEPS;i++))
do
ps -eo comm,pcpu | tail -n +2 >> /tmp/cpu_usage.$$
sleep 60
done

echo
echo CPU eaters :

cat /tmp/cpu_usage.$$ | \
awk '
{ process[$1]+=$2; }
END{
for(i in process)
{
print i, process[i] ;
}

   }' | sort -nrk 2 | head | cut -d" " -f1

   其中：ps -eo comm,pcpu | tail -n +2 >> /tmp/cpu_usage.$$的tail -n +2 去掉输出的头部command 和CPU
cpu_usage.$$中的$$表示当前脚本进程的id.

16 编写一个检测入侵检测的脚本
#!/bin/bash
#Filename: intruder_detect.sh
#Description: Intruder reporting tool with auth.log input
AUTHLOG=/var/log.auth.log

if [[ -n $1 ]];
then
AUTHLOG=$1
echo Using Log file : $AUTHLOG
fi

LOG=/tmp/valid.$$.log
grep -v "invalid" $AUTHLOG > $LOG
users=$(grep "Failed password" $LOG | awk '{ print $(NF-5) }' | sort | uniq)

printf "%-5s|%-10s|%-10s|%-13s|%-33s|%s\n" "Sr#" "User" "Attempts" "IP address" "Host_Mapping" "Time

range"

ucount=0;

ip_list="$(egrep -o "[0-9]+\.[0-9]+\.[0-9]+\.[0-9]+" $LOG | sort | uniq)"

forip in $ip_list;
do
grep $ip $LOG > /tmp/temp.$$.log

foruser in $users;
do
grep $user /tmp/temp.$$.log> /tmp/$$.log
cut -c-16 /tmp/$$.log > $$.time
tstart=$(head -1 $$.time);
start=$(date -d "$tstart" "+%s");

tend=$(tail -1 $$.time);
end=$(date -d "$tend" "+%s")

limit=$(( $end - $start ))

if [ $limit -gt 120 ];
then
    letucount++;

    IP=$(egrep -o "[0-9]+\.[0-9]+\.[0-9]+\.[0-9]+" /tmp/$$.log | head -1 );

    TIME_RANGE="$tstart-->$tend"

    ATTEMPTS=$(cat /tmp/$$.log|wc -l);

    HOST=$(host $IP | awk '{ print $NF }' )

printf "%-5s|%-10s|%-10s|%-10s|%-33s|%-s\n" "$ucount" "$user" "$ATTEMPTS" "$IP" "$HOST"

"$TIME_RANGE";
fi
done
done
   其中是默认以/var/log/auth.log来进行检验，检验得出登陆失败，尝试次数，IP地址，时间范围的用户


17 找出系统用户的活跃活动时段
   #!/bin/bash
#Filename: active_users.sh
#Description: Reporting tool to find out active users
log=/var/log/wtmp
if [[ -n $1 ]];
then
log=$1
fi
printf "%-4s %-10s %-10s %-6s %-8s\n" "Rank" "User" "Start" "Logins"
"Usage hours"
last -f $log | head -n -2 > /tmp/ulog.$$
cat /tmp/ulog.$$ | cut -d' ' -f1 | sort | uniq> /tmp/users.$$
(
while read user;
do
grep ^$user /tmp/ulog.$$ > /tmp/user.$$
seconds=0
while read t
do
   s=$(date -d $t +%s 2> /dev/null)
let seconds=seconds+s
done< <(cat /tmp/user.$$ | awk '{ print $NF }' | tr -d ')(')
firstlog=$(tail -n 1 /tmp/user.$$ | awk '{ print $5,$6 }')
nlogins=$(cat /tmp/user.$$ | wc -l)
hours=$(echo "$seconds / 60.0" | bc)
printf "%-10s %-10s %-6s %-8s\n" $user "$firstlog" $nlogins $hours
done< /tmp/users.$$
) | sort -nrk 4 | awk '{ printf("%-4s %s\n", NR, $0) }'
rm /tmp/users.$$ /tmp/user.$$ /tmp/ulog.$$

18 tr
   tr option set1 set2
    将来自stdin的输入字符从set1映射到set2，比如将输入字符由大写转换为小写
   $echo "HELLO" |tr 'A-Z','a-z'
tr 删除字符
    echo "heelo 1234 " |tr -d '0-9' //将其中的数字删除并打印出来

猜你喜欢