标准IO:标准I/O是ANSI C建立的一个标准I/O模型,是一个标准函数包和stdio.h头文件中的定义,具有一定的可移植性。标准IO库处理很多细节。例如缓存分配,以优化长度执行IO等。标准的IO提供了三种类型的缓存。
(1)全缓存:当填满标准IO缓存后才进行实际的IO操作。 (2)行缓存:当输入或输出中遇到新行符时,标准IO库执行IO操作。 (3)不带缓存:stderr就是了。
文件IO:文件IO称之为不带缓存的IO(unbuffered I/O)。不带缓存指的是每个read,write都调用内核中的一个系统调用。也就是一般所说的低级I/O——操作系统提供的基本IO服务,与os绑定,特定于linix或unix平台。
2区别
首先:两者一个显著的不同点在于,标准I/O默认采用了缓冲机制,比如调用fopen函数,不仅打开一个文件,而且建立了一个缓冲区(读写模式下将建立两个缓冲区),还创建了一个包含文件和缓冲区相关数据的数据结构。低级I/O一般没有采用缓冲,需要自己创建缓冲区,不过其实在linix或unix系统中,都是有使用称为内核缓冲的技术用于提高效率,读写调用是在内核缓冲区和进程缓冲区之间进行的数据复制。
其次从操作的设备上来区分,文件I/O主要针对文件操作,读写硬盘等,它操作的是文件描述符,标准I/O针对的是控制台,打印输出到屏幕等,它操作的是字符流。对于不同设备得特性不一样,必须有不同api访问才最高效。
标准 IO 与文件 IO 的区别标准 IO 与文件 IO 比较
文件IO |
标准IO |
|||||
POSIX 系统调用 |
ANSI C 库函数 |
|||||
低层次 IO |
高层次 IO,对系统调用的扩展和封装 |
|||||
只能在 POSIX 操作系统上移植 |
可移植到任何操作系统 |
|||||
非缓冲 IO |
缓冲 IO |
|||||
利用文件描述符操作文件 |
利用文件指针操作文件 |
|||||
|
读写普通文件,还可以读写设备文件管 |
|
|
一般用于读写普通文件 |
|
|
道等 |
|
|
||||
在谈两者区别之前,先来了解下什么是标准IO以及文件IO。
1定义
标准IO:
标准 I/O 是 ANSI C 建立的一个标准 I/O 模型,是一个标准函数包和 stdio.h 头中的定义,具有一定的可移植性。标准 IO 库处理很多细节。例如缓存分配,以优化长度执行 IO 等。标准的 IO 提供了三种类型的缓存。
- 全缓存:当填满标准 IO 缓存后才进行实际的 IO 操作。
- 行缓存:当输入或输出中遇到新行符时,标准 IO 库执行 IO 操作。
- 不带缓存:stderr 就是了。
文件IO:
文件IO称之为不带缓存的IO(unbuffered I/O)。不带缓存指的是每个read, write 都调用内核中的一个系统调用。也就是一般所说的低级 I/O——操作系统提供的基本 IO 服务,与 os 绑定,特定于*nix 平台。
2区别
首先:两者一个显著的不同点在于,标准 I/O 默认采用了缓冲机制,比如调用 fopen 函数,不仅打开一个文件,而且建立了一个缓冲区(读写模式下将建立一个缓冲区),还创建了一个包含文件和缓冲区相关数据的数据结构
(FILE *)。低级 I/O 一般没有采用缓冲,需要自己创建缓冲区,不过其实在
*nix 系统中,都是有使用称为内核缓冲的技术用于提高效率,读写调用是在内核缓冲区和进程缓冲区之间进行的数据复制。使用标准 IO 就不需要自己维护缓冲区了,标准 IO 库会根据 stdin/stdout 来选择缓冲类型,也就是说当你使用标准 IO 的时候,要清楚它的 stdin/stdou 是什么类型以及其默认的缓冲模式,如果不合适,你需要用 setvbuf 先设置,再使用,例如协同进程的标准输入和输出的类型都是管道,所以其默认的缓冲类型是全缓冲的,如果要使用标准 IO,就需要现设置行缓冲。对于文件 IO,只要你自己能维护好缓冲区,完全可以不用标准 IO。
其次从名字上来区分,文件 I/O 主要针对文件操作,读写硬盘等,标准
I/O,主要是打印输出到屏幕等。因为他们设备不一样,文件 io 针对的是文件,标准 io 是对控制台,操作的是字符流。对于不同设备得特性不一样,必须有不同 api 访问才最高效。
最后来看下他们使用的函数
|
标准IO |
文件IO(低级 IO) |
打开 |
fopen,freopen,fdopen |
open |
关闭 |
fclose |
close |
读 |
getc,fgetc,getchar fgets,gets fread |
read |
写 |
putc,fputc,putchar fputs,puts, fwrite |
write |
|
|
|
1.fopen 与 open
标准 I/O 使用 fopen 函数打开一个文件:
FILE* fp=fopen(const char* path,const char *mode)
其中 path 是文件名,mode 用于指定文件打开的模式的字符串,比如 "r","w","w+","a"等等,可以加上字母 b 用以指定以二进制模式打开(对于 *nix 系统,只有一种文件类型,因此没有区别),如果成功打开,返回一个 FILE 文件指针,如果失败返回 NULL,这里的文件指针并不是指向实际的文件,而是一个关于文件信息的数据包,其中包括文件使用的缓冲区信息。
*nix 系统使用 open 函数用于打开一个文件: int fd=open(char *name,int how);
与 fopen 类似,name 表示文件名字符串,而 how 指定打开的模式:O_RDONLY(只读),O_WRONLY(只写),O_RDWR (可读可写),还有其他模式请 man 2 open。
成功返回一个正整数称为文件描述符,这与标准 I/O 显著不同,失败的话返回-1,与标准 I/O 返回 NULL 也是不同的。
2.fclose 与 close
与打开文件相对的,标准 I/O 使用 fclose 关闭文件,将文件指针传入即可,
如果成功关闭,返回 0,否则返回 EOF 比如:
if(fclose(fp)!=0)
printf("Error in closing file");
而*nix 使用 close 用于关闭 open 打开的文件,与 fclose 类似,只不过当错误发生时返回的是-1,而不是 EOF,成功关闭同样是返回 0。C 语言用 error code 来进行错误处理的传统做法。
3.读文件,getc,fscanf,fgets 和 read
标准 I/O 中进行文件读取可以使用 getc,一个字符一个字符的读取,也可以使用 gets(读取标准 io 读入的)、fgets 以字符串单位进行读取(读到遇到的第一个换行字符的后面),gets(接受一个参数,文件指针)不判断目标数组是否能够容纳读入的字符,可能导致存储溢出(不建议使用),而 fgets 使用三个参数 char * fgets(char *s, int size, FILE *stream); 第一个参数和 gets 一样,用于存储输入的地址,第二个参数为整数,表示输入字符串的最大长度,最后一个参数就是文件指针,指向要读取的文件。最后是 fscanf,与 scanf 类似,只不过增加了一个参数用于指定操作的文件,比如 fscanf(fp,"%s",words)
*nix 系统中使用 read 函数用于读取 open 函数打开的文件,函数原型如下: ssize_t numread=read(int fd,void *buf,size_t qty);其中 fd 就是 open 返回的文件描述符,buf 用于存储数据的目的缓冲区,而 qty 指定要读取的字节数。如果成功读取,就返回读取的字节数目(小于等于 qty)。
4.判断文件结尾
如果尝试读取达到文件结尾,标准 IO 的 getc 会返回特殊值 EOF,而 fgets 碰到 EOF 会返回 NULL,而对于*nix 的 read 函数,情况有所不同。read 读取 qty 指定的字节数,最终读取的数据可能没有你所要求的那么多(qty),而当读到结尾再要读的话,read 函数将返回 0.
5.写文件:putc,fputs,fprintf 和 write
与读文件相对应的,标准 C 语言 I/O 使用 putc 写入字符,比如:putc(ch,fp); 第一个参数是字符,第二个是文件指针。而 fputs 与此类似:fputs(buf,fp);仅仅是第一个参数换成了字符串地址。而 fprintf 与 printf 类似,增加了一个参数用于指定写入的文件,比如:fprintf(stdout,"Hello %s.\n","dennis");切记 fscanf 和 fprintf 将 FILE 指针作为第一个参数,而 putc,fputs 则是作为第二个参数。
在*nix 系统中提供 write 函数用于写入文件,原型与 read 类似:ssize_t result=write(int fd,void *buf ,size_t amt);fd 是文件描述符,buf 是将要写入的内存数据,amt 是要写的字节数。如果写入成功返回写入的字节数,通过 result 与 amt 的比较可以判断是否写入正常,如果写入失败返回-1
6.随机存取:fseek()、ftell()和 lseek()
标准 I/O 使用 fseek 和 ftell 用于文件的随机存取,先看看 fseek 函数原型 int fseek(FILE *stream, long offset, int whence);第一个参数是文件指针,第二个参数是一个 long 类型的偏移量(offset),表示从起始点开始移动的距离。第三个参数就是用于指定起始点的模式,stdio.h 指定了下列模式常量:
SEEK_SET 文件开始处
SEEK_CUR 当前位置 SEEK_END 文件结尾处看几个调用例子:
fseek(fp,0L,SEEK_SET); //找到文件的开始处 fseek(fp,0L,SEEK_END); //定位到文件结尾处 fseek(fp,2L,SEEK_CUR); //文件当前位置向前移动 2 个字节数
而 ftell 函数用于返回文件的当前位置,返回类型是一个 long 类型,比如下面的调用:
fseek(fp,0L,SEEK_END);//定位到结尾 long last=ftell(fp); //返回当前位置
那么此时的 last 就是文件指针 fp 指向的文件的字节数。
与标准 I/O 类似,*nix 系统提供了 lseek 来完成 fseek 的功能,原型如下:
off_t lseek(int fildes, off_t offset, int whence); fildes 是文件描述符,而 offset
也是偏移量,whence 同样是指定起始点模式,唯一的不同是 lseek 有返回值,如果成功就返回指针变化前的位置,否则返回-1。whence 的取值与 fseek 相同: SEEK_SET,SEEK_CUR,SEEK_END,但也可以用整数 0,1,2 相应代替。
lseek : fseek + ftell;