【Linux入门教程】3 进程管理、网络通信工具、vi编辑器、文件系统、文件存储结构

Linux进程管理

当我们运行程序时,Linux会为程序创建一个特殊的环境,该环境包含程序运行需要的所有资源,以保证程序能够独立运行,不受其他程序的干扰。这个特殊的环境就称为进程。
每个 Linux 命令都与系统中的程序对应,输入命令,Linux 就会创建一个新的进程。例如使用 ls 命令遍历目录中的文件时,就创建了一个进程。
简而言之,进程就是程序的实例。
系统通过一个五位数字跟踪程序的运行状态,这个数字称为 pid 或进程ID。每个进程都拥有唯一的 pid。
理论上,五位数字是有限的,当数字被用完时,下一个 pid 就会重新开始,所以 pid 最终会重复。但是,两个 pid 一样的进程不能同时存在,因为Linux会使用 pid 来跟踪程序的运行状态。

创建进程

有两种方式来创建进程:前台进程和后台进程。

前台进程

默认情况下,用户创建的进程都是前台进程;前台进程从键盘读取数据,并把处理结果输出到显示器。
我们可以看到前台进程的运行过程。例如,使用 ls 命令来遍历当前目录下的文件:

$ls ch*.doc
ch01-1.doc   ch010.doc  ch02.doc    ch03-2.doc
ch04-1.doc   ch040.doc  ch05.doc    ch06-2.doc
ch01-2.doc   ch02-1.doc

这个程序就运行在前台,它会直接把结果输出到显示器。如果 ls 命令需要数据(实际上不需要),那么它会等待用户从键盘输入。
当程序运行在前台时,由于命令提示符($)还未出现,用户不能输入其他命令;即使程序需要运行很长时间,也必须等待程序运行结束才能输入其他命令。

后台进程

后台进程与键盘没有必然的关系。当然,后台进程也可能会等待键盘输入。
后台进程的优点是不必等待程序运行结束就可以输入其他命令。
创建后台进程最简单的方式就是在命令的末尾加 &,例如:

$ls ch*.doc &
ch01-1.doc   ch010.doc  ch02.doc    ch03-2.doc
ch04-1.doc   ch040.doc  ch05.doc    ch06-2.doc
ch01-2.doc   ch02-1.doc

如果 ls 命令需要输入(实际上不需要),那么它会暂停,直到用户把它调到前台并从键盘输入数据才会继续运行。

查看正在运行的进程

可以使用 ps 命令查看进程的运行状态,包括后台进程,例如:

$ps
PID       TTY      TIME        CMD
18358     ttyp3    00:00:00    sh
18361     ttyp3    00:01:31    abiword
18789     ttyp3    00:00:00    ps

还可以结合 -f 选项查看更多信息,f 是 full 的缩写,例如:

$ps -f
UID      PID  PPID C STIME    TTY   TIME CMD
amrood   6738 3662 0 10:23:03 pts/6 0:00 first_one
amrood   6739 3662 0 10:22:54 pts/6 0:00 second_one
amrood   3662 3657 0 08:10:53 pts/6 0:00 -ksh
amrood   6892 3662 4 10:51:50 pts/6 0:00 ps -f

每列的含义如下:

描述
UID 进程所属用户的ID,即哪个用户创建了该进程。
PID 进程ID。
PPID 父进程ID,创建该进程的进程称为父进程。
C CPU使用率。
STIME 进程被创建的时间。
TTY 与进程有关的终端类型。
TIME 进程所使用的CPU时间。
CMD 创建该进程的命令。


ps 命令还有其他一些选项:

选项 说明
-a 显示所有用户的所有进程。
-x 显示无终端的进程。
-u 显示更多信息,类似于 -f 选项。
-e 显示所有进程。

终止进程

当进程运行在前台时,可以通过 kill 命令或 Ctrl+C 组合键来结束进程。

如果进程运行在后台,那么首先要通过 ps 命令来获取进程ID,然后使用 kill 命令“杀死”进程,例如:

$ps -f
UID      PID  PPID C STIME    TTY   TIME CMD
amrood   6738 3662 0 10:23:03 pts/6 0:00 first_one
amrood   6739 3662 0 10:22:54 pts/6 0:00 second_one
amrood   3662 3657 0 08:10:53 pts/6 0:00 -ksh
amrood   6892 3662 4 10:51:50 pts/6 0:00 ps -f
$kill 6738
Terminated

如上所示,kill 命令终结了 first_one 进程。

如果进程忽略 kill 命令,那么可以通过 kill -9 来结束:

$kill -9 6738
Terminated

父进程和子进程

每个 Linux 进程会包含两个进程ID:当前进程ID(pid)和父进程ID(ppid)。可以暂时认为所有的进程都有父进程。
由用户运行的大部分命令都将 Shell 作为父进程,使用 ps -f 命令可以查看当前进程ID和父进程ID。

僵尸进程和孤儿进程

正常情况下,子进程被终止时会通过 SIGCHLD 信号通知父进程,父进程可以做一些清理工作或者重新启动一个新的进程。但在某些情况下,父进程会在子进程之前被终止,那么这些子进程就没有了“父亲”,被称为孤儿进程
init 进程会成为所有孤儿进程的父进程。init 的 pid 为1,是Linux系统的第一个进程,也是所有进程的父进程。
如果一个进程被终止了,但是使用 ps 命令仍然可以查看该进程,并且状态为 Z,那么这就是一个僵尸进程。僵尸进程虽然被终止了,但是仍然存在于进程列表中。一般僵尸进程很难杀掉,你可以先杀死他们的父进程,让他们变成孤儿进程,init 进程会自动清理僵尸进程。

常驻进程

常驻进程一般是系统级进程,以 root 权限运行在后台,可以处理其他进程的请求。
常驻进程没有终端,不能访问 /dev/tty 文件,如果使用 ps -ef 查看该进程,tty 这一列会显示问号(?)。
更确切地说,常驻进程通常运行在后台,等待指定事件发生,例如打印进程是一个常驻进程,它会等待用户输入打印相关的命令并进行处理。

top命令

top 命令是一个很有用的工具,它可以动态显示正在运行的进程,还可以按照指定条件对进程进行排序,与Windows的任务管理器类似。
top 命令可以显示进程的很多信息,包括物理内存、虚拟内存、CPU使用率、平均负载以及繁忙的进程等。例如:

$top

这里仅给出一个示意图,读者最好亲自运行一下:

任务和进程

任务(task)是最抽象的,是一个一般性的术语,指由软件完成的一个活动。一个任务既可以是一个进程,也可以是多个进程。简而言之,它指的是一系列共同达到某一目的的操作。例如,读取数据并将数据放入内存中。这个任务可以由一个进程来实现,也可以由多个进程来实现。  每个任务都有一个数字表示的任务号。
进程(process)常常被定义为程序的执行。可以把一个进程看成是一个独立的程序,在内存中有其完备的数据空间和代码空间。一个进程所拥有的数据和变量只属于它自己。
jobs 命令可以用来查看系统中正在运行的任务,包括后台运行的任务。该命令可以显示任务号及其对应的进程ID。一个任务可以对应于一个或者多个进程号。
jobs 命令的 -l 选项可以查看当前任务包含的进程ID:

$jobs -l
[1] + 1903 running                 ls ch*.doc &
$

其中,第一列表示任务号,第二列表示任务对应的进程ID,第三列表示任务的运行状态,第四列表示启动任务的命令。

前台任务和后台任务的切换

fg 命令可以将后台任务调到前台,语法为:

$fg %jobnumber

jobnumber 是通过 jobs 命令获取的后台任务的的序号,注意不是pid。如果后台只有一个任务,可以不指定 jobnumber。
bg 命令可以将后台暂停的任务,调到前台继续运行,语法为:

$bg %jobnumber

jobnumber 同样是通过 jobs 命令获取的后台任务的的序号,注意不是pid。如果前台只有一个任务,可以不指定 jobnumber。
如果希望将当前任务转移到后台,可以先 Ctrl+z 暂停任务,再使用 bg 命令。任务转移到后台可以空出终端,继续输入其他命令。



Linux网络通信工具

现在是一个互联网的时代,你不可避免的要和其他用户进行远程交流,连接到远程主机。

ping 命令

ping 命令会向网络上的主机发送应答请求,根据响应信息可以判断远程主机是否可用。

ping 命令的语法:

$ping hostname or ip-address

如果网络畅通,很快就可以看到响应信息。

例如,检测是否可以连接到谷歌的主机:

$ping google.com
PING google.com (74.125.67.100) 56(84) bytes of data.
64 bytes from 74.125.67.100: icmp_seq=1 ttl=54 time=39.4 ms
64 bytes from 74.125.67.100: icmp_seq=2 ttl=54 time=39.9 ms
64 bytes from 74.125.67.100: icmp_seq=3 ttl=54 time=39.3 ms
64 bytes from 74.125.67.100: icmp_seq=4 ttl=54 time=39.1 ms
64 bytes from 74.125.67.100: icmp_seq=5 ttl=54 time=38.8 ms
--- google.com ping statistics ---
22 packets transmitted, 22 received, 0% packet loss, time 21017ms
rtt min/avg/max/mdev = 38.867/39.334/39.900/0.396 ms
$

如果主机没有响应,可以看到类似下面的信息:

$ping giiiiiigle.com
ping: unknown host giiiiigle.com
$

ftp 工具

ftp 是 File Transfer Protocol 的缩写,称为文件传输协议。通过 ftp 工具,能够将文件上传到远程服务器,也可以从远程服务器下载文件。

ftp 工具有自己的命令(类似Linux命令),可以:

  • 连接并登录远程主机;
  • 查看目录,遍历目录下的文件;
  • 上传或下载文件,包括文本文件、二进制文件等。


ftp 命令的用法如下:

$ftp hostname or ip-address

接下来会提示你输入用户名和密码,验证成功后会进入主目录,然后就可以使用 ftp 工具的命令进行操作了。
 

ftp命令 说明
put filename 将本地文件上传到远程主机。
get filename 将远程文件下载到本地。
mput file list 将多个本地文件上传到远程主机。
mget file list 将多个远程文件下载到本地。
prompt off 关闭提示。默认情况下,使用 mput 或 mget 命令会不断提示你确认文件的上传或下载。
prompt on 打开提示。
dir 列出远程主机当前目录下的所有文件。
cd dirname 改变远程主机目录。
lcd dirname 改变本地目录。
quit 退出登录。


注意,所有的上传和下载都是针对本地主机和远程主机的当前目录,如果你希望上传指定目录下的文件,首先要 cd 到该目录,然后才能上传。

ftp 工具使用举例:

$ftp amrood.com
Connected to amrood.com.
220 amrood.com FTP server (Ver 4.9 Thu Sep 2 20:35:07 CDT 2009)
Name (amrood.com:amrood): amrood
331 Password required for amrood.
Password:
230 User amrood logged in.
ftp> dir
200 PORT command successful.
150 Opening data connection for /bin/ls.
total 1464
drwxr-sr-x   3 amrood   group       1024 Mar 11 20:04 Mail
drwxr-sr-x   2 amrood   group       1536 Mar  3 18:07 Misc
drwxr-sr-x   5 amrood   group        512 Dec  7 10:59 OldStuff
drwxr-sr-x   2 amrood   group       1024 Mar 11 15:24 bin
drwxr-sr-x   5 amrood   group       3072 Mar 13 16:10 mpl
-rw-r--r--   1 amrood   group     209671 Mar 15 10:57 myfile.out
drwxr-sr-x   3 amrood   group        512 Jan  5 13:32 public
drwxr-sr-x   3 amrood   group        512 Feb 10 10:17 pvm3
226 Transfer complete.
ftp> cd mpl
250 CWD command successful.
ftp> dir
200 PORT command successful.
150 Opening data connection for /bin/ls.
total 7320
-rw-r--r--   1 amrood   group       1630 Aug  8 1994  dboard.f
-rw-r-----   1 amrood   group       4340 Jul 17 1994  vttest.c
-rwxr-xr-x   1 amrood   group     525574 Feb 15 11:52 wave_shift
-rw-r--r--   1 amrood   group       1648 Aug  5 1994  wide.list
-rwxr-xr-x   1 amrood   group       4019 Feb 14 16:26 fix.c
226 Transfer complete.
ftp> get wave_shift
200 PORT command successful.
150 Opening data connection for wave_shift (525574 bytes).
226 Transfer complete.
528454 bytes received in 1.296 seconds (398.1 Kbytes/s)
ftp> quit
221 Goodbye.
$

telnet工具

Telnet 工具可以让我们连接并登录到远程计算机。

一旦连接到了远程计算机,就可以在上面进行各种操作了,例如:

C:>telnet amrood.com
Trying...
Connected to amrood.com.
Escape character is '^]'.

login: amrood
amrood's Password:
*****************************************************
*                                                   *
*                                                   *
*            WELCOME TO AMROOD.COM                  *
*                                                   *
*                                                   *
*****************************************************

Last unsuccessful login: Fri Mar  3 12:01:09 IST 2009
Last login: Wed Mar  8 18:33:27 IST 2009 on pts/10

   {  do your work }

$ logout
Connection closed.
C:>

finger工具

finger 可以让我们查看本地主机或远程主机上的用户信息。有些系统为了安全会禁用 finger 命令。

例如,查看本机在线用户:

$ finger
Login     Name       Tty      Idle  Login Time   Office
amrood               pts/0          Jun 25 08:03 (62.61.164.115)

查看本机指定用户的信息:

$ finger amrood
Login: amrood                           Name: (null)
Directory: /home/amrood                 Shell: /bin/bash
On since Thu Jun 25 08:03 (MST) on pts/0 from 62.61.164.115
No mail.
No Plan.

查看远程主机上的在线用户:

$ finger @avtar.com
Login     Name       Tty      Idle  Login Time   Office
amrood               pts/0          Jun 25 08:03 (62.61.164.115)

查看远程主机上某个用户的信息:

$ finger [email protected]
Login: amrood                           Name: (null)
Directory: /home/amrood                 Shell: /bin/bash
On since Thu Jun 25 08:03 (MST) on pts/0 from 62.61.164.115
No mail.
No Plan.


Linux vi编辑器

Linux下的文本编辑器有很多种,vi 是最常用的,也是各版本Linux的标配。注意,vi 仅仅是一个文本编辑器,可以给字符着色,可以自动补全,但是不像 Windows 下的 word 有排版功能。

vi 是十年磨一剑的产品,虽然命令繁多,并且大多数功能都是依靠键盘输入来完成,但是一旦你熟悉后,会发现 vi 的功能和效率是其他图形界面编辑器无法比拟的。

Vim 是 Vimproved 的缩写,是 vi 的改进版。在Linux中,vi 被认为是事实上的标准编辑器,因为:

  • 所有版本的 Linux 都带有 vi 编辑器;
  • 占用资源少;
  • 与 ed、ex 等其他编辑器相比,vi 对用户更加友好。


你可以使用 vi 编辑器编辑现有的文件,也可以创建一个新文件,还能以只读模式打开文本文件。

进入 vi 编辑器

可以通过以下方式进入 vi 编辑器:

命令 描述
vi filename 如果filename存在,则打开;否则会创建一个新文件再打开。
vi -R filename 以只读模式(只能查看不能编辑)打开现有文件。
view filename 以只读模式打开现有文件。


例如,使用 vi 编辑器创建一个新文件并打开:

$vi testfile
|
~
~
~
~
~
~
~
~
~
~
~
~
"testfile" [New File]

竖线(|)代表光标的位置;波浪号(~)代表该行没有任何内容。如果没有 ~,也看不到任何内容,那说明这一行肯定是有空白字符(空格、tab 缩进、换行符等)或不可见字符。

工作模式

进一步了解 vi 之前先来了解一下 vi 的工作模式,vi 有三种工作模式:

1) 普通模式

由Shell进入vi编辑器时,首先进入普通模式。在普通模式下,从键盘输入任何字符都被当作命令来解释。普通模式下没有任何提示符,输入命令后立即执行,不需要回车,而且输入的字符不会在屏幕上显示出来。

普通模式下可以执行命令、保存文件、移动光标、粘贴复制等。

2) 编辑模式

编辑模式主要用于文本的编辑。该模式下用户输入的任何字符都被作为文件的内容保存起来,并在屏幕上显示出来。

3) 命令模式

命令模式下,用户可以对文件进行一些高级处理。尽管普通模式下的命令可以完成很多功能,但要执行一些如字符串查找、替换、显示行号等操作还是必须要进入命令模式。

注意:有些教程中称有两种工作模式,是把命令模式合并到普通模式。

工作模式切换:

  • 在普通模式下输入 i(插入)、c(修改)、o(另起一行) 命令时进入编辑模式;按 esc 键退回到普通模式。
  • 在普通模式下输入冒号(:)可以进入命令模式。输入完命令按回车,命令执行完后会自动退回普通模式。


提示:如果不确定当前处于哪种模式,按两次 Esc 键将回到普通模式。

退出 vi 编辑器

一般在命令模式下退出 vi 编辑器。
 

退出命令 说明
q 如果文件未被修改,会直接退回到Shell;否则提示保存文件。
q! 强行退出,不保存修改内容。
wq w 命令保存文件,q 命令退出 vi,合起来就是保存并退出。
ZZ 保存并退出,相当于 wq,但是更加方便。


退出之前,你也可以在 w 命令后面指定一个文件名,将文件另存为新文件,例如:

w filename2

将当前文件另存为 filename2。

注意:vi 编辑文件时,用户的操作都是基于缓冲区中的副本进行的。如果退出时没有保存到磁盘,则缓冲区中的内容就会被丢失。

移动光标

为了不影响文件内容,必须在普通模式(按两次 Esc 键)下移动光标。使用下表中的命令每次可以移动一个字符:

命令 描述
k 向上移动光标(移动一行)
j 向下移动光标(移动一行)
h 向左移动光标(移动一个字符)
l 向右移动光标(移动一个字符)


两点提醒:

  • vi 是区分大小写的,输入命令时注意不要锁定大写。
  • 可以在命令前边添加一个数字作为前缀,例如,2j 将光标向下移动两行。


当然,还有很多其他命令来移动光标,不过记住,一定要在普通模式(按两次 Esc 键)下。
 

用来移动光标的命令
命令 说明
0 或 | 将光标定位在一行的开头。
$ 将光标定位在一行的末尾。
w 定位到下一个单词。
b 定位到上一个单词。
( 定位到一句话的开头,句子是以 ! . ? 三种符号来界定的。
) 定位到一句话的结尾。
{ 移动到段落开头。&&&&&&
} 移动到段落结束。&&&&&&&&&
[[ 回到段落的开头处。&&&&&&&&&&
]] 向前移到下一个段落的开头处。&&&&&&&&&&
n| 移动到第 n 列(当前行)。
1G 移动到文件第一行。
G 移动到文件最后一行。
nG 移动到文件第 n 行。
:n 移动到文件第 n 行。
H 移动到屏幕顶部。
nH 移动到距离屏幕顶部第 n 行的位置。
M 移动到屏幕中间。
L 移动到屏幕底部。
nL 移动到距离屏幕底部第 n 行的位置。
:x x 是一个数字,表示移动到行号为 x 的行。

控制命令

有一些控制命令可以与 Ctrl 键组合使用,如下:

命令 描述
CTRL+d 向前滚动半屏
CTRL+f 向前滚动全屏
CTRL+u 向后滚动半屏
CTRL+b 向后滚动整屏
CTRL+e 向上滚动一行
CTRL+y 向下滚动一行
CTRL+I 刷新屏幕

编辑文件

切换到编辑模式下才能编辑文件。有很多命令可以从普通模式切换到编辑模式,如下所示:

命令 描述
i 在当前光标位置之前插入文本
I 在当前行的开头插入文本
a 在当前光标位置之后插入文本
A 在当前行的末尾插入文本
o 在当前位置下面创建一行
O 在当前位置上面创建一行

删除字符

下面的命令,可以删除文件中的字符或行:

命令 说明
x 删除当前光标下的字符
X 删除光标前面的字符
dw 删除从当前光标到单词结尾的字符
d^ 删除从当前光标到行首的字符
d$ 删除从当前光标到行尾的字符
D 删除从当前光标到行尾的字符
dd 删除当前光标所在的行


可以在命令前面添加一个数字前缀,表示重复操作的次数,例如,2x  表示连续两次删除光标下的字符,2dd 表示连续两次删除光标所在的行。

建议各位读者多加练习上面的命令,再进一步深入学习。

修改文本

如果你希望对字符、单词或行进行修改,可以使用下面的命令:

命令 描述
cc 删除当前行,并进入编辑模式。
cw 删除当前字(单词),并进入编辑模式。
r 替换当前光标下的字符。
R 从当前光标开始替换字符,按 Esc 键退出。
s 用输入的字符替换当前字符,并进入编辑模式。
S 用输入的文本替换当前行,并进入编辑模式。

粘贴复制

vi 中的复制粘贴命令:

命令 描述
yy 复制当前行
nyy 复制n行
yw 复制一个字(单词)
nyw 复制n行
p 将复制的文本粘贴到光标后面
P 将复制的文本粘贴到光标前面

高级命令

下面的一些命令虽然看起来有些古怪,但是会让你的工作更有效率,如果你是 vi 重度用户,就了解一下吧。

命令 说明
J 将当前行和下一行连接为一行
<< 将当前行左移一个单位(一个缩进宽度)
>> 将当前行右移一个单位(一个缩进宽度)
~ 改变当前字符的大小写
^G Ctrl+G组合键可以显示当前文件名和状态
U 撤销对当前行所做的修改
u 撤销上次操作,再次按 'u' 恢复该次操作
:f 以百分号(%)的形式显示当前光标在文件中的位置、文件名和文件的总行数
:f filename 将文件重命名为 filename
:w filename 保存修改到 filename
:e filename 打开另一个文件名为 filename 的文件
:cd dirname 改变当前工作目录到 dirname
:e # 在两个打开的文件之间进行切换
:n 如果用 vi 打开了多个文件,可以使用 :n 切换到下一个文件
:p 如果用 vi 打开了多个文件,可以使用 :n 切换到上一个文件
:N 如果用 vi 打开了多个文件,可以使用 :n 切换到上一个文件
:r file 读取文件并在当前行的后边插入
:nr file 读取文件并在第 n 行后边插入

文本查找

如果希望进行全文件搜索,可以在普通模式(按两次 Esc 键)下输入 / 命令,这时状态栏(最后一行)出现"/"并提示输入要查找的字符串,回车即可。

/ 命令是向下查找,如果希望向上查找,可以使用 ? 命令。

这时,输入 n 命令可以按相同的方向继续查找,输入 N 命令可以按相反的方向继续查找。

搜索的字符串中可以包含一些有特殊含义的字符,如果希望搜索这些字符本身,需要在前面加反斜杠(\)。
 

部分特殊字符列表
字符 说明
^ 匹配一行的开头
. 匹配一个字符
* 匹配0个或多个字符
$ 匹配一行的结尾
[ ] 匹配一组字符


如果希望搜索某行中的单个字符,可以使用 f 或 F 命令,f 向上搜索,F 向下搜索,并且会把光标定位到匹配的字符。

也可以使用 t 或 T 命令:t 命令向上搜索,并把光标定位到匹配字符的前面;T 命令向下搜索,并把光标定位到匹配字符的后面。

set 命令

set 命令可以对 vi 编辑器进行一些设置。使用 set 命令需要进入命令模式。
 

:set 命令选项
命令 说明
:set ic 搜索时忽略大小写。
:set ai 设置自动缩进(自动对齐)。
:set noai 取消自动缩进(自动对齐)。
:set nu 显示行号。
:set sw 设置缩进的空格数,例如,将缩进空格数设置为4::set sw=4。
:set ws 循环搜索:如果直到文件末尾也没有查找到指定字符,那么会回到开头继续查找。
:set wm 设置自动换行,例如,设置距离边际2个字符时换行::set wm=2 。
:set ro 将文件类型改为只读。
:set term 输出终端类型。
:set bf 忽略输入的控制字符,如 BEL(响铃)、BS(退格)、CR(回车)等。

运行命令

切换到命令模式,再输入 ! 命令即可运行 Linux 命令。

例如,保存文件前,如果希望查看该文件是否存在,那么输入

:! ls

即可列出当前目录下的文件。

按任意键回到 vi 编辑器。

文本替换

切换到命令模式,再输入 s/ 命令即可对文本进行替换。语法为:

:s/search/replace/g

search 为检索的文本,replace 为要替换的文本,g 表示全局替换。

几点提示

vi 编辑器的使用讲解完毕,但是请记住下面几点:

  • 输入冒号(:)进入命令模式,按两次 Esc 键进入普通模式。
  • 命令大小写的含义是不一样的。
  • 必须在编辑模式下才能输入内容。


Linux文件系统

文件系统就是分区或磁盘上的所有文件的逻辑集合。

文件系统不仅包含着文件中的数据而且还有文件系统的结构,所有Linux 用户和程序看到的文件、目录、软连接及文件保护信息等都存储在其中。

不同Linux发行版本之间的文件系统差别很少,主要表现在系统管理的特色工具以及软件包管理方式的不同,文件目录结构基本上都是一样的。

文件系统有多种类型,如:

  • ext2 : 早期linux中常用的文件系统;
  • ext3 : ext2的升级版,带日志功能;
  • RAMFS : 内存文件系统,速度很快;
  • iso9660:光盘或光盘镜像;
  • NFS : 网络文件系统,由SUN发明,主要用于远程文件共享;
  • MS-DOS : MS-DOS文件系统;
  • FAT : Windows XP 操作系统采用的文件系统;
  • NTFS : Windows NT/XP 操作系统采用的文件系统。

分区与目录

文件系统位于磁盘分区中;一个硬盘可以有多个分区,也可以只有一个分区;一个分区只能包含一个文件系统。

Linux文件系统与Windows有较大的差别。Windows的文件结构是多个并列的树状结构,最顶部的是不同的磁盘(分区),如 C、D、E、F等。

Linux的文件结构是单个的树状结构,根目录是“/”,其他目录都要位于根目录下。

每次安装系统的时候我们都会进行分区,Linux下磁盘分区和目录的关系如下:

  • 任何一个分区都必须对应到某个目录上,才能进行读写操作,称为“挂载”。
  • 被挂载的目录可以是根目录,也可以是其他二级、三级目录,任何目录都可以是挂载点。
  • 目录是逻辑上的区分。分区是物理上的区分。
  • 根目录是所有Linux的文件和目录所在的地方,需要挂载上一个磁盘分区。


下图是常见的目录和分区的对应关系:


为什么要分区,如何分区?

  • 可以把不同资料,分别放入不同分区中管理,降低风险。
  • 大硬盘搜索范围大,效率低。
  • /home、/var、/usr/local 经常是单独分区,因为经常会操作,容易产生碎片。


为了便于定位和查找,Linux中的每个目录一般都存放特定类型的文件,下表列出了各种Linux发行版本的常见目录:

目录 说明
/ 根目录,只能包含目录,不能包含具体文件。
/bin 存放可执行文件。很多命令就对应/bin目录下的某个程序,例如 ls、cp、mkdir。/bin目录对所有用户有效。
/dev 硬件驱动程序。例如声卡、磁盘驱动等,还有如 /dev/null、/dev/console、/dev/zero、/dev/full 等文件。
/etc 主要包含系统配置文件和用户、用户组配置文件。
/lib 主要包含共享库文件,类似于Windows下的DLL;有时也会包含内核相关文件。
/boot 系统启动文件,例如Linux内核、引导程序等。
/home 用户工作目录(主目录),每个用户都会分配一个目录。
/mnt 临时挂载文件系统。这个目录一般是用于存放挂载储存设备的挂载目录的,例如挂载CD-ROM的cdrom目录。
/proc 操作系统运行时,进程(正在运行中的程序)信息及内核信息(比如cpu、硬盘分区、内存信息等)存放在这里。/proc目录伪装的文件系统proc的挂载目录,proc并不是真正的文件系统。
/tmp 临时文件目录,系统重启后不会被保存。
/usr /user目下的文件比较混杂,包含了管理命令、共享文件、库文件等,可以被很多用户使用。
/var 主要包含一些可变长度的文件,会经常对数据进行读写,例如日志文件和打印队列里的文件。
/sbin 和 /bin 类似,主要包含可执行文件,不过一般是系统管理所需要的,不是所有用户都需要。

常用文件管理命令

你可以通过下面的命令来管理文件:

Command Description
cat filename 查看文件内容。
cd dirname 改变所在目录。
cp file1 file2 复制文件或目录。
file filename 查看文件类型(binary, text, etc)。
find filename dir 搜索文件或目录。
head filename 显示文件的开头,与tail命令相对。
less filename 查看文件的全部内容,可以分页显示,比more命令要强大。
ls dirname 遍历目录下的文件或目录。
mkdir dirname 创建目录。
more filename 查看文件的全部内容,可以分页显示。
mv file1 file2 移动文件或重命名。
pwd 显示用户当前所在目录。
rm filename 删除文件。
rmdir dirname 删除目录。
tail filename 显示文件的结尾,与head命令相对。
touch filename 文件不存在时创建一个空文件,存在时修改文件时间戳。
whereis filename 查看文件所在位置。
which filename 如果文件在环境变量PATH中有定义,那么显示文件位置。

df命令

管理磁盘分区时经常会使用 df (disk free) 命令,df -k 命令可以用来查看磁盘空间的使用情况(以千字节计),例如:

$df -k
Filesystem      1K-blocks      Used   Available Use% Mounted on
/dev/vzfs        10485760   7836644     2649116  75% /
/devices                0         0           0   0% /devices
$

每一列的含义如下:

说明
Filesystem 代表文件系统对应的设备文件的路径名(一般是硬盘上的分区)。
kbytes 分区包含的数据块(1024字节)的数目。
used 已用空间。
avail 可用空间。
capacity 已用空间的百分比。
Mounted on 文件系统挂载点。


某些目录(例如 /devices)的 kbytes、used、avail 列为0,use列为0%,这些都是特殊(或虚拟)文件系统,即使位于根目录下,也不占用硬盘空间。

你可以结合 -h (human readable) 选项将输出信息格式化,让人更易阅读。 

du 命令

du (disk usage) 命令可以用来查看特定目录的空间使用情况。

du 命令会显示每个目录所占用数据块。根据系统的不同,一个数据块可能是 512 字节或 1024 字节。举例如下:

$du /etc
10     /etc/cron.d
126    /etc/default
6      /etc/dfs
...
$

结合 -h 选项可以让信息显示的更加清晰:

$du -h /etc
5k    /etc/cron.d
63k   /etc/default
3k    /etc/dfs
...
$

挂载文件系统

挂载是指将一个硬件设备(例如硬盘、U盘、光盘等)对应到一个已存在的目录上。 若要访问设备中的文件,必须将文件挂载到一个已存在的目录上, 然后通过访问这个目录来访问存储设备。

这样就为用户提供了统一的接口,屏蔽了硬件设备的细节。Linux将所有的硬件设备看做文件,对硬件设备的操作等同于对文件的操作。

注意:挂载目录可以不为空,但挂载后这个目录下以前的内容将不可用。

需要知道的是,光盘、软盘、其他操作系统使用的文件系统的格式与linux使用的文件系统格式是不一样的,挂载需要确认Linux是否支持所要挂载的文件系统格式。

查看当前系统所挂载的硬件设备可以使用 mount 命令:

$ mount
/dev/vzfs on / type reiserfs (rw,usrquota,grpquota)
proc on /proc type proc (rw,nodiratime)
devpts on /dev/pts type devpts (rw)
$

一般约定,/mnt 为临时挂载目录,例如挂载CD-ROM、远程网络设备、软盘等。

也可以通过mount命令来挂载文件系统,语法为:

mount -t file_system_type device_to_mount directory_to_mount_to

例如:

$ mount -t iso9660 /dev/cdrom /mnt/cdrom

将 CD-ROM 挂载到 /mnt/cdrom 目录。

注意:file_system_type用来指定文件系统类型,通常可以不指定,Linux会自动正确选择文件系统类型。

挂载文件系统后,就可以通过 cd、cat 等命令来操作对应文件。

可以通过 umount 命令来卸载文件系统。例如,卸载 cdrom:

$ umount /dev/cdrom

不过,大部分现代的Linux系统都有自动挂载卸载功能,unmount 命令较少用到。

用户和群组配额

用户和群组配额可以让管理员为每个用户或群组分配固定的磁盘空间。

管理员有两种方式来分配磁盘空间:

  • 软限制:如果用户超过指定的空间,会有一个宽限期,等待用户释放空间。
  • 硬限制:没有宽限期,超出指定空间立即禁止操作。


下面的命令可以用来管理配额:

命令 说明
quota 显示磁盘使用情况以及每个用户组的配额。
edquota 编辑用户和群组的配额。
quotacheck 查看文件系统的磁盘使用情况,创建、检查并修复配额文件。
setquota 设置配额。
quotaon 开启用户或群组的配额功能。
quotaoff 关闭用户或群组的配额功能。
repquota 打印指定文件系统的配额。


Linux文件存储结构,包括目录项、inode、数据块

大部分的Linux文件系统(如ext2、ext3)规定,一个文件由目录项、inode和数据块组成:

  • 目录项:包括文件名和inode节点号。
  • Inode:又称文件索引节点,包含文件的基础信息以及数据块的指针。
  • 数据块:包含文件的具体内容。

先说inode

理解inode,要从文件储存说起。文件储存在硬盘上,硬盘的最小存储单位叫做"扇区"(Sector),每个扇区储存512字节(相当于0.5KB)。

操作系统读取硬盘的时候,不会一个扇区一个扇区地读取,这样效率太低,而是一次性连续读取多个扇区,即一次性读取一个"块"(block)。这种由多个扇区组成的"块",是文件存取的最小单位。"块"的大小,最常见的是4KB,即连续八个 sector组成一个 block。

文件数据都储存在"块"中,那么很显然,我们还必须找到一个地方储存文件的元信息,比如文件的创建者、文件的创建日期、文件的大小等等。这种储存文件元信息的区域就叫做inode,中文译名为"索引节点"。

inode包含文件的元信息,具体来说有以下内容:

  • 文件的字节数。
  • 文件拥有者的User ID。
  • 文件的Group ID。
  • 文件的读、写、执行权限。
  • 文件的时间戳,共有三个:ctime指inode上一次变动的时间,mtime指文件内容上一次变动的时间,atime指文件上一次打开的时间。
  • 链接数,即有多少文件名指向这个inode。
  • 文件数据block的位置。


可以用stat命令,查看某个文件的inode信息:

stat demo.txt

总之,除了文件名以外的所有文件信息,都存在inode之中。至于为什么没有文件名,下文会有详细解释。

当查看某个文件时,会先从inode表中查出文件属性及数据存放点,再从数据块中读取数据。

请看文件存储结构示意图:

inode的大小

inode也会消耗硬盘空间,所以硬盘格式化的时候,操作系统自动将硬盘分成两个区域。一个是数据区,存放文件数据;另一个是inode区(inode table),存放inode所包含的信息。

每个inode节点的大小,一般是128字节或256字节。inode节点的总数,在格式化时就给定,一般是每1KB或每2KB就设置一个inode。假定在一块1GB的硬盘中,每个inode节点的大小为128字节,每1KB就设置一个inode,那么inode table的大小就会达到128MB,占整块硬盘的12.8%。

查看每个硬盘分区的inode总数和已经使用的数量,可以使用df -i 命令。

查看每个inode节点的大小,可以用如下命令:

sudo dumpe2fs -h /dev/hda | grep "Inode size"

由于每个文件都必须有一个inode,因此有可能发生inode已经用光,但是硬盘还未存满的情况。这时,就无法在硬盘上创建新文件。

inode号码

每个inode都有一个号码,操作系统用inode号码来识别不同的文件。

这里值得重复一遍,Linux系统内部不使用文件名,而使用inode号码来识别文件。对于系统来说,文件名只是inode号码便于识别的别称或者绰号。表面上,用户通过文件名,打开文件。实际上,系统内部这个过程分成三步:首先,系统找到这个文件名对应的inode号码;其次,通过inode号码,获取inode信息;最后,根据inode信息,找到文件数据所在的block,读出数据。

使用ls -i命令,可以看到文件名对应的inode号码,例如:

ls -i demo.txt

目录项

Linux系统中,目录(directory)也是一种文件。打开目录,实际上就是打开目录文件。

目录文件的结构非常简单,就是一系列目录项(dirent)的列表。每个目录项,由两部分组成:所包含文件的文件名,以及该文件名对应的inode号码。

ls命令只列出目录文件中的所有文件名:

ls /etc

ls -i命令列出整个目录文件,即文件名和inode号码:

ls -i /etc

如果要查看文件的详细信息,就必须根据inode号码,访问inode节点,读取信息。ls -l命令列出文件的详细信息。

ls -l /etc

硬链接和软链接

硬链接

一般情况下,文件名和inode号码是"一一对应"关系,每个inode号码对应一个文件名。但是,Linux系统允许,多个文件名指向同一个inode号码。这意味着,可以用不同的文件名访问同样的内容;对文件内容进行修改,会影响到所有文件名;但是,删除一个文件名,不影响另一个文件名的访问。这种情况就被称为"硬链接"(hard link)。

ln命令可以创建硬链接,语法为:

ln source_file target_file

运行上面这条命令以后,源文件与目标文件的inode号码相同,都指向同一个inode。inode信息中有一项叫做"链接数",记录指向该inode的文件名总数,这时就会增加1。反过来,删除一个文件名,就会使得inode节点中的"链接数"减1。当这个值减到0,表明没有文件名指向这个inode,系统就会回收这个inode号码,以及其所对应block区域。

这里顺便说一下目录文件的"链接数"。创建目录时,默认会生成两个目录项:"."和".."。前者的inode号码就是当前目录的inode号码,等同于当前目录的"硬链接";后者的inode号码就是当前目录的父目录的inode号码,等同于父目录的"硬链接"。所以,任何一个目录的"硬链接"总数,总是等于2加上它的子目录总数(含隐藏目录),这里的2是父目录对其的“硬链接”和当前目录下的".硬链接“。

软链接

除了硬链接以外,还有一种特殊情况。文件A和文件B的inode号码虽然不一样,但是文件A的内容是文件B的路径。读取文件A时,系统会自动将访问者导向文件B。因此,无论打开哪一个文件,最终读取的都是文件B。这时,文件A就称为文件B的"软链接"(soft link)或者"符号链接(symbolic link)。

这意味着,文件A依赖于文件B而存在,如果删除了文件B,打开文件A就会报错:"No such file or directory"。这是软链接与硬链接最大的不同:文件A指向文件B的文件名,而不是文件B的inode号码,文件B的inode"链接数"不会因此发生变化。

ln -s命令可以创建软链接,语法为:

ln source_file target_file

猜你喜欢

转载自blog.csdn.net/HelloZEX/article/details/81359954
今日推荐