328 lines
7.5 KiB
Markdown
328 lines
7.5 KiB
Markdown
# I/O操作
|
||
|
||
输入输出是一切实现的基础。
|
||
|
||
标准IO:`stdio`
|
||
|
||
系统调用IO(文件IO):`sysio`
|
||
|
||
优先使用标准IO,兼容性更好,还有合并系统调用的优势。
|
||
|
||
## 标准IO
|
||
|
||
```c
|
||
/* stdio */
|
||
/* FILE类型贯穿始终 */
|
||
|
||
FILE *fopen(const char *path, const char *mode);
|
||
/**
|
||
* fopen 返回指针的储存位置? 1.栈 2.静态区 3.堆
|
||
* 正确答案:3.堆。
|
||
* 因为如果是栈,就是函数内部局部变量,无法返回地址。
|
||
* 如果是静态区,无法确定需要多少个这个变量。
|
||
*
|
||
* 只有 r 和 r+ 一定要求文件存在
|
||
* 另外几种不存在会创建
|
||
*
|
||
* 创建文件的权限
|
||
* 0666 & ~umask
|
||
*
|
||
* 对于普通用户
|
||
* umask 得到 022
|
||
*
|
||
*/
|
||
int fclose(FILE *fp);
|
||
|
||
int fputc(FILE *stream);
|
||
int fgetc(int c, FILE *stream);
|
||
|
||
char *fgets(char *s, int size, FILE *stream);
|
||
/**
|
||
* 两种正常返回的情况:
|
||
* 1. 读了 size-1 个字节,最后一个字节留给 '\0'
|
||
* 2. 读到了 '\n'
|
||
*
|
||
* eg. 加入用fgets(buf, 5, stream) 来读 abcd
|
||
* 是会读两次的
|
||
* 第一次:abcd'\0'
|
||
* 第二次:'\n''\0'
|
||
*/
|
||
int fputs(const char *restrict s, FILE *restrict stream);
|
||
|
||
/**
|
||
* 这一对函数常用但是无法验证边界
|
||
* 尽量一次只读单字节,更安全
|
||
*
|
||
* 返回值:成功读/写的对象的数量
|
||
*/
|
||
size_t fread(void *ptr, size_t size, size_t nemmb, FILE *stream);
|
||
size_t fwrite(const void *ptr, size_t size, size_t nmemb, FILE *stream);
|
||
|
||
|
||
int printf(const char *restrict format, ...);
|
||
/**
|
||
* 常用于 fprintf(stderr,...)
|
||
*/
|
||
int fprintf(FILE *restrict stream, const char *restrict format, ...);
|
||
|
||
// TODO:
|
||
int dprintf(int fd, const char *restrict format, ...);
|
||
|
||
/**
|
||
* 将格式化内容输出到一个字符串
|
||
*
|
||
* 和 atoi() 正好相反
|
||
*
|
||
*/
|
||
int sprintf(char *restrict str, const char *restrict format, ...);
|
||
|
||
/**
|
||
* 比sprintf多了size参数,更安全
|
||
*/
|
||
int snprintf(char str[restrict.size],
|
||
size_t size,
|
||
const char *restrict format,
|
||
...)
|
||
|
||
// !!! 慎用%s
|
||
int scanf(const char *restrict format, ...);
|
||
int fscanf(FILE *restrict stream,
|
||
const char *restrict format, ...);
|
||
|
||
|
||
/**
|
||
* 移动文件当前位置指针
|
||
*
|
||
* 可用于生成空洞文件,下载器原理
|
||
*
|
||
* @prarm: offset 移动多远
|
||
* @prarm: whence 移动方向
|
||
* SEEK_SET, SEEK_CUR, SEEK_END
|
||
*
|
||
* @return 成功0,失败-1
|
||
*/
|
||
int fseek(FILE *stream, long offset, int whence);
|
||
|
||
/**
|
||
* 反映当前文件指针所在位置
|
||
*
|
||
* 这个long的负值部分无法使用。
|
||
* 所以文件无法超过2G。
|
||
*
|
||
*/
|
||
long ftell(FILE *stream);
|
||
|
||
/**
|
||
* 解决上面long的问题。
|
||
*
|
||
* 最好编译时加上
|
||
* #define _FILE_OFFSET_BITS 64
|
||
* 可以写入makefile
|
||
*
|
||
* 但是这俩函数是方言,前面那个long的一对支持C89,C99
|
||
*
|
||
*/
|
||
int fseeko(FILE *stream, off_t offset, int whence);
|
||
off_t ftello(FILE *stream);
|
||
|
||
/**
|
||
* 将文件指针置于文件首
|
||
* equivalent to:
|
||
* fseek(stream, 0L, SEEK_SET);
|
||
*/
|
||
void rewind(FILE *stream);
|
||
|
||
/**
|
||
* 缓冲区的作用:
|
||
* 大多数情况下是好事,合并系统调用
|
||
*
|
||
* 行缓冲: 换行时候刷新,满了的时候刷新,强制刷新(标准输出是这样的,因为是终端设备)
|
||
*
|
||
* 全缓冲: 满了的时候刷新,强制刷新(默认,只要不是终端设备)
|
||
*
|
||
* 无缓冲: 如stderr,需要立即输出的内容
|
||
*/
|
||
fflush();
|
||
|
||
/**
|
||
* @prarm: mode
|
||
* _IONBF
|
||
* _IOLBF
|
||
* _IOFBF
|
||
*/
|
||
int setvbuf(FILE *stream, char *buf, int mode, size_t size);
|
||
|
||
/**
|
||
* 为了读取一行
|
||
*
|
||
* 使用办法:
|
||
* #define _GNU_SOURCE 这个不想写到代码里面的话可以写到makefile
|
||
* eg. CFLAGS+=-D_FILE_OFFSET_BITS=64 -D_GNU_SOURCE
|
||
* #include <stdio.h>
|
||
*
|
||
* !!! 里面有 malloc 动作,未释放
|
||
* !!! 是方言,可以自己封装一个mygetline和mygetline_free
|
||
*
|
||
*/
|
||
ssize_t getline(char **lineptr, size_t *n, FILE *stream);
|
||
|
||
/**
|
||
* 临时文件
|
||
* 1. 如何不冲突的创建
|
||
* 2. 及时销毁
|
||
*
|
||
* tmpnam: 创建临时文件名字
|
||
* 有并发危险,因为产生名字和创建文件是两步
|
||
*
|
||
* tmpfile: 创建临时文件
|
||
* 是匿名文件,ls -a 都看不到
|
||
* 避免冲突
|
||
*/
|
||
char *tmpnam(char *s);
|
||
FILE *tmpfile(void);
|
||
|
||
```
|
||
|
||
|
||
## 文件IO/系统调用IO
|
||
|
||
文件描述符(`fd`)是在文件IO中贯穿始终的类型。
|
||
|
||
### 文件描述符的概念
|
||
是一个整型数,是一个指针数组的下标。
|
||
优先使用当前可用范围内最小的。
|
||
|
||
### 文件IO操作相关函数:
|
||
- open
|
||
- close
|
||
- read
|
||
- write
|
||
- lsee
|
||
|
||
```c
|
||
|
||
/**
|
||
* r -> O_RDONLY
|
||
* r+ -> O_RDWR
|
||
* w -> O_WRONLY | O_CREAT | O_TRUNC
|
||
* w+ -> O_RDWR | O_TRUNC | O_CREAT
|
||
*
|
||
* 如果有creat就必须用三参数的形式
|
||
* C语言没有重载,这是变参函数
|
||
*
|
||
* @prarm: pathname 文件路径
|
||
* @prarm: flags 文件打开方式
|
||
* @prarm: mode 文件权限
|
||
*
|
||
*/
|
||
int open(const char *pathname, int flags);
|
||
int open(const char *pathname, int flags, mode_t mode);
|
||
|
||
int close(int fd);
|
||
|
||
/**
|
||
* read from a file descriptor
|
||
*
|
||
* @return 读取的字节数,失败返回-1
|
||
*/
|
||
ssize_t read(int fd, void *buf, size_t count);
|
||
|
||
/**
|
||
* write to a file descriptor
|
||
*
|
||
* @return 写入的字节数,失败返回-1
|
||
*/
|
||
ssize_t write(int fd, const void *buf, size_t count);
|
||
|
||
/**
|
||
* 移动文件指针
|
||
*
|
||
* @prarm: offset 移动多远
|
||
* @prarm: whence 移动方向
|
||
* SEEK_SET, SEEK_CUR, SEEK_END
|
||
*
|
||
* @return 成功0,失败-1
|
||
*/
|
||
off_t lseek(int fd, offt offset, int whence);
|
||
|
||
```
|
||
|
||
|
||
### 文件IO与标准IO的区别
|
||
区别:响应速度&吞吐量
|
||
文件IO需要频繁进入内核,标准IO通过缓冲区合并系统调用。
|
||
响应速度快就文件IO,吞吐量大就标准IO。
|
||
> [!warning]
|
||
> 二者不可混用
|
||
|
||
转换方法:`fileno`, `fdopen`
|
||
|
||
### IO的效率问题
|
||
习题:将`mycpy.c`程序进行更改,将`BUFSIZE`的值放大,观察进程消耗的时间,注意性能出现拐点的值以及程序何时段错误。
|
||
|
||
### 文件共享
|
||
多个任务共同操作一个文件或者协同完成任务
|
||
|
||
面试题:写程序删除一个文件的第10行
|
||
补充函数:
|
||
```c
|
||
// 截断文件到某长度
|
||
int truncate(const char *path, off_t length);
|
||
int ftruncate(int fd, off_t length);
|
||
```
|
||
|
||
```c
|
||
// 最简单思路,将11行开始的内容到第10行开始处覆盖写
|
||
while()
|
||
{
|
||
lseek 11 + read +lseek 10 + write
|
||
}
|
||
|
||
// 优化思路,两个文件描述符,一个读一个写
|
||
1 -> open r -> fd1 -> lseek 11
|
||
2 -> open r+ -> fd2 -> lseek 10
|
||
|
||
while()
|
||
{
|
||
1->fd1-> read
|
||
2->fd2-> write
|
||
}
|
||
|
||
// 两个进程, 设计进程间通信
|
||
process1 -> open -> r
|
||
process2 -> open -> r+
|
||
|
||
p1->read -> p2->write
|
||
|
||
```
|
||
|
||
### 原子操作
|
||
指不可分割的操作
|
||
作用:解决竞争和冲突
|
||
如`tmpnam`函数,产生文件名和创建文件是两步,会有并发问题。
|
||
|
||
|
||
### 程序中的重定向:`dup`, `dup2`
|
||
```c
|
||
int dup(int oldfd);
|
||
int dup2(int oldfd, int newfd);
|
||
```
|
||
|
||
### 同步
|
||
同步内核层面的buffer和cache
|
||
```c
|
||
void sync(void);
|
||
int fsync(int fd);
|
||
int fdatasync(int fd); // 只刷新数据,不刷新亚数据
|
||
|
||
// 文件描述符所有的操作几乎都来源于该函数
|
||
int fcntl(int fd, int cmd, ... /* arg */);
|
||
|
||
// 设备相关的内容
|
||
int ioctl(int fd, unsigned long request, ... /* arg */);
|
||
|
||
```
|
||
|
||
### /dev/fd/目录
|
||
**虚目录**:显示当前进程的文件描述符信息
|