spark wordcount 单词统计 - 代码天地

spark wordcount 单词统计

其他 2018-12-17 10:30:57 阅读次数: 0

spark wordcount 单词统计

文件1.txt

hello world
hello tom
hello lucy
tom lucy
hello python

# -*- coding:utf-8 -*-
import os
import shutil

from pyspark import SparkContext

inputpath = '1.txt'
outputpath = 'result'

sc = SparkContext('local', 'wordcount')

# 读取文件
input = sc.textFile(inputpath)
# 切分单词
words = input.flatMap(lambda line: line.split(' '))
# 转换成键值对并计数
counts = words.map(lambda word: (word, 1)).reduceByKey(lambda x, y: x + y)

# 输出结果
result=counts.collect()
print result
for (word,count) in result:
    print word,count


# 删除输出目录
if os.path.exists(outputpath):
    shutil.rmtree(outputpath, True)

# 将统计结果写入结果文件
counts.saveAsTextFile(outputpath)

猜你喜欢

转载自blog.csdn.net/u011243684/article/details/84988689

spark wordcount 单词统计

Spark系列 —— 单词统计WordCount (Scala/Python/Java)

单词统计wordcount

Spark本地环境实现wordCount单词计数

linux中用spark进行单词数统计--wordCount例子操作详解【scala版】

使用Scala实现Spark wordcount统计

Spark的简单使用之WordCount统计

Scala版的WordCount单词统计

MapReduce实例——wordcount（单词统计）

MapReduce单词统计案例，WordCount

Hadoop_WordCount单词统计

Spark WordCount

Spark的WordCount

spark的学习（1）之使用spark进行WordCount词数统计

Spark实战：单词统计

spark学习03之wordCount统计并排序(java)

利用Hadoop MapReduce实现单词统计——Wordcount

Mapreduce实例---统计单词个数（wordcount）

用Python统计单词的个数写wordcount

WordCount 统计行数、字符数、单词数

Storm-wordcount实时统计单词次数

MapReduce——WordCount案例（统计单词个数）

Storm 流计算实现wordcount(单词统计)

Hadoop入门---(wordcount)统计单词出现的次数

Scala集合实现WordCount单词统计代码

spark eclipse写wordcount

Spark入门之WordCount

Spark wordCount案例

spark 例子wordcount topk

Spark的WordCount练习（二）

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)