java统计文章中单词出现的次数 - 代码天地

java统计文章中单词出现的次数

其他 2018-08-21 00:03:37 阅读次数: 0

统计一篇文章中单词出现的次数，要存储单词和次数，根据次数排序输出，要用Map数据结构保存键值对。首先想到是用TreeMap<String, Integer>，它为有序映射表，但默认按照键Key排序，要让Map按照Value值排序，难以直接实现，所以用先存储再排序的方法。先用HashMap<String, Integer>存储单词和单词的次数，利用Map的entrySet()方法获取映射关系视图，再由此构建ArrayList<Map.Entry<String, Integer>>，最后用Collections.sort()方法，自定义一个比较Integer的comparator，对该ArrayList排序。

import java.util.*;

public class WordCountTest
{

	public static void main(String[] args)
	{
		//读取
		Map<String,Integer> map = new HashMap<>();
		Scanner in = new Scanner(System.in);
		while (in.hasNext())
		{
			String word = in.next();
			word =word.replace(",", " ").replace(".", " ").replace("\"", " ").replace("“", " ").replace("”", " ").replace(";", " ");
			if (!map.containsKey(word))
				map.put(word, 1);
			else
				map.put(word, (map.get(word)+1));
		}
		//排序
		List<Map.Entry<String, Integer>> arraylist = new ArrayList<Map.Entry<String, Integer>>(map.entrySet());
		Collections.sort(arraylist,new Comparator<Map.Entry<String, Integer>>(){
			public int compare(Map.Entry<String, Integer> obj1, Map.Entry<String, Integer> obj2)
			{
				return ((Integer) obj2.getValue()).compareTo((Integer) obj1.getValue());
			}
		});
		// 输出次数前20的单词
		List<Map.Entry<String, Integer>> list = arraylist.subList(0, 20);
		System.out.println("出现频率前20的单词：");
		for (Map.Entry<String, Integer> item : list)
			System.out.println(item.getKey() + "=" + item.getValue());
		
	}

}

运行结果：

猜你喜欢

转载自blog.csdn.net/u014108439/article/details/53065380

java统计文章中单词出现的次数

Hadoop 统计文件中单词出现的次数

【Python】统计文本中单词的出现次数

Linux统计文件中单词出现的次数

统计单词出现的次数，Java实现

统计一篇超过10G的文章中每个单词出现的次数

统计文章中英语单词出现的次数

统计单词出现次数的mapreduce

Java -- 客户端利用Hadoop集群上的MapReduce统计文本中单词的出现次数

java-统计一段句子中各单词出现的次数

java使用map统计某个数组中单词出现的次数

【BigData】Java基础_读取文件并统计文件中每个单词出现的次数

阿里研发工程师编程题——统计一篇文章中每个单词出现的次数

Hadoop 统计文件中某个单词出现的次数

linux统计txt文件中单词出现次数并排序

hadoop案例一（统计文本中单词出现的次数）

Java实现统计英语句子中每个单词出现的次数（不区分单词大小写）

JAVA-统计英文句子中出现次数最多的单词和出现的次数

统计一篇英文文章中出现次数最多的10个单词

Hadoop入门---(wordcount)统计单词出现的次数

统计单词出现的次数并进行排

统计文件中单词出现频率最高的10个以及他们出现的次数

统计文章中单词个数

统计文章单词个数-java

（java）统计若干段英文中的单词数量，并统计每个单词出现的次数按降序排序。

统计一篇英文文章内每个单词出现频率，并返回出现频率最高的前10个单词及其出现次数

统计英文文章单词出现的频率

JAVA算法：按照给定的段落统计单词出现次数（JAVA代码）

java统计字符出现次数

java语言找出文章中出现次数最多的单词

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)