利用位运算统计文本文档中的汉字字数 - 代码天地

利用位运算统计文本文档中的汉字字数

其他 2018-11-10 08:40:56 阅读次数: 0

在做C++教材练习题时，其中一题要求统计文本文档中的汉字个数，当我直接按char ch做的时候，发现统计出的字数和文本文档的字节数相同。why?
也就是说，常规方法下统计的实际不是文本文档中的字符个数，而是这些字符的字节和。
下面是我原先的代码：

#include <iostream>
#include <strstream>
#include <fstream>
#include <io.h>
#include <string.h>

using namespace std;

int FrequencyCounts(char *);

int main()
{
    long handle;
    struct _finddata_t info;
    handle = _findfirst("*.txt", &info);
    if (handle == -1)
        return 0;
    int count[3];
    int i = 0;
    do
    {
        count[i] = FrequencyCounts(info.name);
        ++i;
    } while (_findnext(handle, &info) == 0);
    char output_name[100];
    strcpy(output_name, "多个文件汉字字频统计结果.txt");
    ofstream out;
    out.open(output_name, ios::app);
    if (!out)
    {
        cout << "Can't open the file!" << output_name << endl;
        exit(0);
    }
    for (i = 0; i < 3; ++i)
    {
        out << "test" << i+1 << ".txt" << "中共有" << count[i] << "个字" << endl;
    }
    out.close();

    cout << "统计完毕" << endl;

    return 0;
}

int FrequencyCounts(char *a)
{
    ifstream in(a);
    if (!in)
    {
        cout << "Can't open the file!" << a << endl;
        exit(0);
    }
    char ch;
    int count = 0;
    while (in.get(ch))
    {
        count++;
    }
    in.close();

    return count;
}

最后如何改正呢？参考https://blog.csdn.net/bufanq/article/details/51034156的文章，
改为：

    while (in.get(ch))
    {
        if((ch & 0x80) == 0x80)
            count++;
    }

仅此记录。

猜你喜欢

转载自blog.csdn.net/t11383/article/details/80687543

利用位运算统计文本文档中的汉字字数

将对象写入文本文档、从文本文档中读取对象

文本文档的处理

新建文本文档.

Java 写一段字符到指定的文本文档中，如果该文本文档不存在，则创建该文本文档

js汉字字数统计

从C++程序中输出文本文档

Java 读取文本文档中的内容

vue中前端怎么读取txt文本文档？

C语言文本文档汉字乱码处理问题

关于java解析文本文档

富文本文档学习

vim 加密(crypt)文本文档

富文本文档结构说明

新建文本文档 (3)

新建文本文档 (2)

用文本文档运行Java

对文本文档操作

易语言编写“文本文档”

新建文本文档

Java 打开一个文本文档，统计单词出现的次数。

打开一个文本文档，统计单词出现的次数

利用字节流复制文本文档，并且替换选中的特殊字符

利用字符流复制文本文档，并且替换选中的特殊字符2

利用字符流复制文本文档，并且替换选中的特殊字符1

统计给定文本文件中汉字的个数。

win7系统桌面右键中没有了新建文本文档的选项

matlab中读取txt数据文件(txt文本文档)

文本文档中各字母出现次数汇总（java)

php遍历文本文档txt文件中的链接内容为数组

今日推荐

手把手教你用 LangChain 实现大模型 Agent

外星人入侵（python）

超全的免费chatGPT列表【建议收藏】

52.2k star! 自己部署gpt4free, 免费使用各种GPT

2024年（第十届）全国大学生统计建模大赛优秀论文解析——中国经济发展与碳排放库兹涅茨曲线的验证研究

【自动驾驶技术】自动驾驶汽车AI芯片汇总——NVIDIA篇

7个免费的ChatGPT网站，给大家送上

Angular v18 正式发布！

【VMware】 vCenter Converter standalone 6.6.0正式版下载

开源日报 | Angular v18；大模型价格战下的推理优化；Mistral AI以开源模型瞄准美国市场；硅谷有自己的鲁迅

数学建模Matlab之数据预处理方法

充电桩---ISO15118协议详细介绍

周排行

慧测学习课件

Mscordacwks.dll/SOS.dll 调试归档

关于深度学习人工智能模型的探讨（二）（7）

Stop Using the text-indent:-9999px

Least Common Multiple（HDU - 1019 ）

Comparator接口的使用方法--例子

修改framework Camera的API,旋转摄像头

机器学习时代的“大数据+”：数据平台的设计与搭建

vue 项目部署到nginx

webstorm 常用插件集合

每日归档

更多

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)

2024-05-23(9)

2024-05-22(41)

2024-05-21(8)

2024-05-20(36)