【经典问题】统计文件的字符数


1、题目

统计文件的字符数

2、代码

/*******************************************************************************************************
** 题    目: 统计文件的字符数
********************************************************************************************************/
#include <stdio.h>
#include <stdlib.h>

int main(void)
{
	char fname[80];/*存贮文件名*/
	FILE *rfp;
	long count;/*文件字符计数器*/

	printf("请输入文件名:");
	scanf("%s",fname);
	if((rfp=fopen(fname,"r"))==NULL)
	{
		printf("Can't open file %s.\n",fname);
		exit(1);
	}
	count = 0;
	while(fgetc(rfp)!=EOF)
	{
		count++;
	}
	fclose(rfp);/*关闭文件*/
	printf("共有 %ld 个字符在文件 %s 中。\n",count,fname);
	
	return 0;
}

3、测试结果及分析

首先,在与该源文件相同文件夹下建一个test.txt的文件,里面输入你要统计的内容:

其实,不同的编码,其字符(中文、英文字符)的占用的字节数是不一样的。下面测试一下:

(1)utf-8编码下的英文字符统计

可见,utf-8编码下,一个英文字符占用一个字节。

(2)utf-8编码下的中文字符统计

可见,utf-8编码下,一个中文字符占用三个字节。

(3)GB2312编码下的英文字符统计

可见,GB2312编码下,一个英文字符占用一个字节。

(4)GB2312编码下的中文字符统计

可见,GB2312编码下,一个中文字符占用两个字节。

4、总结

中、英文字符占用的字节数与编码有关。在notepad++中可修改编码,如:



文章作者: 杂烩君
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 杂烩君 !
  目录