【c语言】文件操作详解 - 从打开到关闭

🕗 发布于 2024-11-27 07:28 c语言 开发语言

在这里插入图片描述

1. 为什么使用文件？

如果没有文件，我们写的程序的数据存储在电脑的内存当中，如果程序退出，内存回收，数据就丢失了，再次运行程序时，看不到上次程序的数据，如果要将数据进行持久化的保存，我们可以使用文件。

2. 什么是文件？

硬盘或磁盘上的文件就叫做文件。
在程序设计中我们一般会谈两种文件：程序文件、数据文件（从文件功能的角度来分类）

程序文件:
包括程序的源程序文件，目标文件（windows环境后缀为.obj)，可执行程序文件（windows环境后缀为.exe）
数据文件：
文件的内容不一定是程序，而是程序运行时读写的数据，比如程序运行需要从中读取数据的文件，或者输出内容的文件。

在以前各章所处理数据的输入输出都是以终端为对象的，即从终端的键盘输入数据，运行结果显示到显示器上。
其实有时候我们会把信息输出到磁盘上，当需要的时候再从磁盘上把数据读取到内存中使用，这里处理的就是磁盘上文件。

3. 如何标识文件？

⼀个文件要有⼀个唯一的文件标识，以便用户识别和引用。其实就是文件名。
文件名包含3部分：文件路径 + 文件名主干 + 文件后缀
例如：

c:\code\test.txt

为了方便起见，文件标识常被称为文件名。

4. 二进制文件和文本文件？

根据数据的组织形式，数据文件被称为文本文件或二进制文件。
数据在内存中以二进制的形式存储，如果不加转换的输出到外存的⽂件中，就是二进制文件。
如果要求在外存上以ASCII码的形式存储，则需要在存储前转换。以ASCII字符的形式存储的文件就是文本文件。

那么一个数据在文件中是如何存储的呢？
字符⼀律以ASCII形式存储，数值型数据既可以用ASCII码形式存储，也可以使用二进制形式存储。
以10000为例，如果以ASCII码的形式输出到磁盘，则磁盘中占用5个字节（每个字符⼀个字节），而二进制形式输出，则在磁盘上只占4个字节。
在这里插入图片描述

5. 文件的打开和关闭

5.1 流和标准流

5.1.1 流

流（Stream）是一个抽象的概念，用于表示数据的流动。流可以是输入流（Input Stream）或输出流（Output Stream），分别用于从某个源读取数据和向某个目标写入数据。

C程序针对文件、画面、键盘等的数据输入输出操作都是通过流操作的。
一般情况下，我们要想向流里写数据，或者从流中读取数据，都是要打开流，然后操作。

5.1.2 标准流

那为什么我们从键盘输⼊数据，向屏幕上输出数据，并没有打开流呢？
那是因为C语言程序在启动的时候，默认打开了3个流：

• stdin: 标准输入流，在大多数的环境中从键盘输入，scanf函数就是从标准输⼊流中读取数据。
• stdout: 标准输出流，大多数的环境中输出至显示器界面,\，printf函数就是将信息输出到标准输出流中。
• stderr： 标准错误流，⼤多数环境中输出到显示器界面。

这是默认打开了这三个流，我们使用scanf、printf等函数就可以直接进行输入输出操作的。
stdin、stdout、stderr三个流的类型是：FILE*，通常称为文件指针。
C语言中，就是通过 FILE* 的文件指针来维护流的各种操作的。

5.2 文件指针

缓冲文件系统中，关键的概念是文件类型指针，简称文件指针。
每个被使用的文件都在内存中开辟了一个相应的文件信息区，用来存放文件的相关信息（如文件的名字，文件状态及文件当前的位置等）。这些信息是保存在⼀个结构体变量中的。该结构体类型是由系统声明的，取名FILE.

例如vs2013下stdio.h头文件中包含的文件有如下的定义

struct _iobuf 
{
char* _ptr;
int _cnt;
char* _base;
int _flag;
int _file;
int _charbuf;
int _bufsiz;
char* _tmpfname;
};
typedef struct _iobuf FILE;

不同的编译器对文件的定义方式不同，但大同小异。
每当打开一个文件的时候，系统会根据文件的情况自动创建⼀个FILE结构的变量，并填充其中的信息，使用者不必关心细节。
一般都是通过一个FILE的指针来维护这个FILE结构的变量，这样使用起来更加放便。

下面我们可以创建一个FILE*的指针变量:

FILE* pf;  //⽂件指针变量

定义的pf是⼀个指向FILE类型数据的指针变量。可以使pf指向某个文件的文件信息区（是一个结构体变量）。通过该文件信息区中的信息就能够访问该文件。也就是说，通过文件指针变量能够间接找到与它关联的文件。
比如：
在这里插入图片描述

5.3 文件的打开和关闭

文件在读写之前首先应当打开文件，使用结束之后应当关闭文件
在编写程序的时候，在打开文件的同时，都会返回一个FILE*的指针指向该文件，相当于建立了文件和指针的关系。
ANSIC规定使用fopen函数来打开文件， fclose函数来关闭文件。

//打开文件
FILE* fopen(const char * filename, const char * mode);//第一个参数为文件名，第二个参数为文件的打开方式
//关闭文件
int fclose(FILE * stream);

mode表示文件的打开模式，下面都是文件的打开模式：

文件使用方式	含义	如果指定文件不存在
“r“（只读）	为了输入数据打开一个已经存在的文件	出错
“w”（只写）	为了输出数据，打开一个文本文件	建立一个新的文件
“a”（追加）	向文本文件尾添加数据	建立一个新的文件
“rb”（只读）	为了输入数据，打开一个二进制⽂件	出错
“wb”（只写）	为了输出数据，打开一个二进制⽂件	建立一个新的文件
“ab”（追加）	向一个二进制⽂件尾添加数据	建立一个新的文件
“r+”（读写）	为了读和写，打开一个文本文件	出错
“w+”（读写）	为了读和写，建立一个新的文件	建立一个新的文件
“a+”（读写）	打开一个文件，在文件尾进行读写	建立一个新的文件
“rb+”（读写）	为了读和写打开一个⼆进制文件	出错
“wb+”（读写）	为了读和写，新建一个新的二进制文件	建立一个新的文件
“ab+”（读写）	打开一个⼆进制文件，在文件尾进行读和写	建立一个新的文件

代码实现：

int main()
{
//打开文件
//打开文件成功，返回有效的指针
//打开失败，返回NULL
FILE* pf = fopen("data.txt","w");
if (pf == NULL)
{
perror("fopen");
return 1;
}
//写文件


//关闭文件
fclose(pf);

pf = NULL; //关闭之后应将pf置为空，否则将会成为野指针

return 0;
}

6. 文件的读写顺序

6.1 顺序读写函数

函数名	功能	适用于
fgetc	字符输⼊函数	所有输⼊流
fputc	字符输出函数	所有输出流
fgets	文本行输⼊函数	所有输⼊流
fputs	文本行输出函数	所有输出流
fscanf	格式化输⼊函数	所有输⼊流
fprintf	格式化输出函数	所有输出流
fread	⼆进制输⼊	文件
fwrite	⼆进制输出	文件

举例fputc：

int main()
{
FILE* pf = fopen("data.txt","w");
if (pf == NULL)
{
perror("fopen");
return 1;
}
//写文件
fputc('a', pf);
fputc('b', pf);
fputc('c', pf);
fputc('d', pf);
fputc('e', pf);

//关闭文件
fclose(pf);

pf = NULL;

return 0;
}

我们可以看到data.txt文件中多了abcde
在这里插入图片描述
举例fgutc：

int main()
{
FILE* pf = fopen("data.txt", "r");
if (pf == NULL)
{
perror("fopen");
return 1;
}
//读文件
int ch = fgetc(pf);
printf("%c", ch);

ch = fgetc(pf);
printf("%c", ch);

ch = fgetc(pf);
printf("%c", ch);

ch = fgetc(pf);
printf("%c", ch);

ch = fgetc(pf);
printf("%c", ch);

//关闭文件
fclose(pf);

pf = NULL;

return 0;
}

程序的运行结果：
在这里插入图片描述

上面说的适用于所有输入流⼀般指适用于标准输入流和其他输入流（如文件输入流）；所有输出流⼀般指适用于标准输出流和其他输出流（如文件输出流）。

int main()
{
int ch = fgetc(stdin);//从键盘上（标准输入流）上读取
fputc(ch,stdout); //将字符输出（写）到屏幕（标准输出流）

return 0;
}

6.2 对比一组函数

scanf/printf:针对标准输入流/标准输出流的格式化输入/输出函数
fscanf/fprintf:针对所有输入流/所有输出流的格式化输入/输出函数
sscanf/sprintf:将格式化的数据转化成字符串/从字符串中提取格式化数据
sprinft: 从字符串中提取格式化的数据（将字符串转化为格式化数据）
sscanf: 将格式化的数据写到字符串中（将格式化的数据转化成字符串）

7. 文件的随机读写

7.1 fseek

根据文件指针的位置和偏移量来定位文件指针（文件内容的光标）。

int fseek ( FILE * stream, long int offset, int origin );//参数分别是文件指针，偏移量（可以是正值，也可以是负值），起始位置

代码演示：

int main()
{
//1.打开文件
FILE* pf = fopen("data.txt", "r");
if (pf == NULL)
{
perror("fopen");
return 1;
}
//2.读文件

//fseek
int ch = 0;
fseek(pf, 4, SEEK_SET);//SEEK_SET起始位置
ch = fgetc(pf);
printf("%c\n", ch);
fseek(pf, 2, SEEK_CUR);//SEEK_CUR当前位置
ch = fgetc(pf);
printf("%c\n", ch);
fseek(pf, -2, SEEK_END);//SEEK_END文件末尾
ch = fgetc(pf);
printf("%c\n", ch);

//3.关闭文件
fclose(pf);

pf = NULL;

return 0;
}

在这里插入图片描述
输出结果：

7.2 ftell

返回文件指针相对于起始位置的偏移量

long int ftell ( FILE * stream );

示例：

int main()
{
//1.打开文件
FILE* pf = fopen("data.txt", "r");
if (pf == NULL)
{
perror("fopen");
return 1;
}
//2.读文件
int ch = 0;
ch = fgetc(pf);
printf("%c\n", ch);//a
ch = fgetc(pf);
printf("%c\n", ch);//b

//fseek
fseek(pf, -2, SEEK_END);//SEEK_END文件末尾
ch = fgetc(pf);
printf("%c\n", ch);//e

//输出文件指针相较于起始位置的偏移量
printf("%d\n",ftell(pf));

//3.关闭文件
fclose(pf);

pf = NULL;

return 0;
}

输出结果：
在这里插入图片描述

7.3 rewind

让文件指针的位置回到文件的起始位置。

void rewind ( FILE * stream );

代码演示：

int main()
{
//1.打开文件
FILE* pf = fopen("data.txt", "r");
if (pf == NULL)
{
perror("fopen");
return 1;
}
//2.读文件
int ch = 0;
ch = fgetc(pf);
printf("%c\n", ch);//a
ch = fgetc(pf);
printf("%c\n", ch);//b

//fseek
fseek(pf, -2, SEEK_END);//SEEK_END文件末尾
ch = fgetc(pf);
printf("%c\n", ch);//e

//输出文件指针相较于起始位置的偏移量
printf("%d\n",ftell(pf)); //5

rewind(pf);
ch = fgetc(pf);
printf("%c\n", ch);

//3.关闭文件
fclose(pf);

pf = NULL;

return 0;
}

输出结果：
在这里插入图片描述
可以看到光标又指回了a

8. 文件读取结束的判定

8.1 被错误使用的`feof`

EOF - end of file :文件结束的标志
所以大家都会认为feof函数是用来判断文件是否结束的，但是其实并不是。

feof的作用： 当文件读取结束的时候，判断读取结束的原因是不是：遇到文件结尾结束

在读取文件的过程中，有可能读取文件结束，结束的原因是：

遇到文件结尾
遇到错误了

1.文本文件读取是否结束，判断返回值是否为 EOF （ fgetc ），或者 NULL （ fgets ）。
例如：

fgetc判断是否为 EOF 。
fgets 判断返回值是否为 NULL .

2.二进制文件的读取结束判断，判断返回值是否小于实际要读的个数。
例如：

fread判断返回值是否小于实际要读的个数。

9. 文件缓冲区

ANSIC 标准采用缓冲文件系统处理数据文件的，所谓的缓冲文件系统是指系统自动地在内存中为程序中的每一个正在使用的文件开辟一块文件缓冲区。从内存向磁盘输出数据先会送到内存中的缓冲区，装满缓冲区后才一起送到磁盘上。如果从磁盘向计算机读入数据，则从磁盘文件中读取数据输入到内存缓冲区（充满缓冲区），然后再从缓冲区逐个地将数据送到程序数据区（程序变量等）。缓冲区的大小根据c编译系统决定的。
在这里插入图片描述
代码验证：

#include <stdio.h>
#include <windows.h>
int main()
{
FILE* pf = fopen("data.txt","w");
fputs("abcdef",pf);   //先将abcdef放在输出缓冲区
printf("睡眠10秒，打开data.txt发现没有内容\n");
Sleep(10000);

printf("刷新缓冲区\n");
fflush(pf);  //刷新缓冲区时，才将输出缓冲区的数据写到文件（磁盘）
printf("再睡眠10秒，再次打开data.txt文件，文件有内容了\n");
Sleep(10000);


fclose(pf);
//注：fclose在关闭文件的时候，也会刷新缓冲区 
pf = NULL;

return 0;
}

结论：
因为有缓冲区的存在，C语言在操作文件的时候，需要做刷新缓冲区或者在文件操作结束的时候关闭文件。

如果这篇文章对你有帮助，记得点赞，评论+收藏，最后别忘了关注作者，作者将带领你探索更多关于c语言方面的问题。

原文地址：https://blog.csdn.net/2301_81290732/article/details/143983220

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：【排版教程】Word、WPS 分节符(奇数页等) 自动变成分节符(下一页) 解决办法
下一篇：Could not connect to Redis at 127.0.0.1:6380: Connection refused

OpenCV相机标定与3D重建(7)鱼眼镜头立体校正的函数stereoRectify()的使用
cv::fisheye::stereoRectify 是 OpenCV 中用于鱼眼镜头立体校正的函数。该函数计算两个相机之间的校正变换，使得从两个相机拍摄的图像中的对应点在行上对齐。这一步骤对于后续的
阅读更多2024-11-28
酷！用豆包MarsCode 写了一个五子棋小游戏
2017 年，当时大学三本毕业前端工作一年，去深圳找工作面试，在拉勾上海投，接到某公司前端开发团队回复询问邮箱账号，喜滋滋的以为可以有面试了。一看邮箱，抛给我一道面试题，写完发到对方邮箱。。编写一个单
阅读更多2024-11-28
Spring自动注入机制与@Autowired、@Resource注解的区别
Spring的自动注入机制为开发者提供了极大的便利，使得代码更加简洁和易于维护。@Autowired和@Resource作为两种常用的注入注解，各有其特点和适用场景。开发者应根据实际需求选择合适的注解
阅读更多2024-11-28
WireShark
去官网下载安装包之后按照安装向导进行安装。安装完成后，用户可以在桌面或应用程序中找到Wireshark的图标，双击打开软件。
阅读更多2024-11-28
C++优质学习资源汇总
该课程基本把面试所需要的C++常用的网络等教程均进行讲解，满足基本需求。
阅读更多2024-11-28
48-基于单片机的LCD12864时间调控和串口抱站
基于51单片机的公交报站系统，可以手动报站，站名十个。在lcd12864上显示时间（年月日时分秒）和站名，时间可以设置，仿真中可以语音播报。加一个用串口模拟语音播报。
阅读更多2024-11-28
Spring中实现动态数据源切换，基于AbstractRoutingDataSource
Spring中动态数据源切换，AbstractRoutingDataSource
阅读更多2024-11-28
关于node全栈项目打包发布linux项目问题总集
因为某些linux服务器为了兼容一些特定的项目使用的老的版本的linux系统，比如我此时用的就是centOS7，因为centOS7在2024年的6月份就把此linux版本的yum源镜像归档了，所以会导
阅读更多2024-11-28
【rustdesk】客户端和服务端的安装和部署（自建服务器，docker，远程控制开源软件rustdesk）
开源工具rustdesk的安装和使用
阅读更多2024-11-28
C++游戏开发
C++ 是一种强大且高效的编程语言，广泛应用于游戏开发中。其性能和灵活性使其成为许多大型游戏引擎和开发团队的首选。
阅读更多2024-11-28