基于电影知识图谱的智能问答系统（三） -- Spark环境搭建 - 代码天地

基于电影知识图谱的智能问答系统（三） -- Spark环境搭建

其他 2018-07-03 11:07:26 阅读次数: 0

上一篇：基于电影知识图谱的智能问答系统（二） -- Neo4j导入CSV文件

由于该项目后期会涉及到spark的朴素贝叶斯分类器，而该分类器可以通过训练问题集合进行问题模板概率匹配，因此，系统中是否搭建了spark环境对项目是否能run起来至关重要。

一、工具包及环境搭建简易说明

由于工具包比较大，涉及scala语言安装包、hadoop安装包以及spark-hadoop安装包，故只提供百度网盘的下载链接

下载地址：https://pan.baidu.com/s/10XUKpYBXqQ16UqDRTFerWg

二、Windows下Spark环境的搭建

本想着自己写个搭建过程，但是感觉没什么必要了，都是流水账了，推荐看下下面提供的博文，非常详细

Spark在Windows下的环境搭建

三、验证Spark环境是否搭建成功

（1）任意目录下，运行 Win+R，并输入spark-shell脚本命令，测试spark

什么是spark-shell？

spark-shell是提供给用户即时交互的一个命令窗口，你可以在里面编写spark代码，然后根据你的命令进行相应的运算

（2）实例化SparkContext对象

什么是SparkContext？

SparkContext是编写Spark程序用到的第一个类，其中包含了Spark程序用到的几乎所有的核心对象，可见其重要性

master：local[*] == 本地运行模式[也可以是集群的形式]，*表示多个线程并行执行

在Java中实例化SparkContext对象的demo如下

（3）通过scala语言，编写spark代码，利用reduce计算集合1,2,3,4,5的和

通过调用SparkContext的parallelize方法，在一个已经存在的Scala集合上创建一个Seq对象。集合的对象将会被拷贝，创建出一个可以被并行操作的分布式数据集RDD

体现在Java中的demo如下

体现在脚本语言中如下：

关于reduce，有点类似于Python的高阶函数reduce，有兴趣的可以参考我的博文：Python3学习(12)--高阶函数（二）

下一篇：基于电影知识图谱的智能问答系统（四） --HanLP分词器

猜你喜欢

转载自blog.csdn.net/appleyk/article/details/80334716

基于电影知识图谱的智能问答系统（三） -- Spark环境搭建

基于电影知识图谱的智能问答系统（五） --Spark朴素贝叶斯分类器

python构建基于知识图谱的京东商城问答系统-实验环境和实验数据准备

从零开始搭建医药领域知识图谱实现智能问答与分析服务（含码源）：含Neo4j基于垂直网站数据的医药知识图谱构建、医药知识图谱的自动问答等

python+neo4j构建基于知识图谱的电影知识智能问答系统

基于Spark 2.0.0搭建Hive on Spark环境

基于电影知识图谱的智能问答系统 --HanLP分词器

基于电影知识图谱的智能问答系统（八） -- 终极完结篇

基于电影知识图谱的智能问答系统（七） -- Neo4j语句那点事

基于电影知识图谱的智能问答系统（六） -- 问题训练样本集敲定

基于电影知识图谱的智能问答系统（四） --HanLP分词器

基于电影知识图谱的智能问答系统（二） -- Neo4j导入CSV文件

电影知识图谱和基于模板的问答系统构建

Spark(三): spark集群环境搭建

基于hadoop的Spark环境搭建

基于知识图谱的智能问答

基于知识图谱的问答系统(三): 信息抽取

基于Docker的Spark环境搭建理论部分

基于知识图谱的问答系统(一)

基于知识图谱的问答系统(KBQA)

基于知识图谱的问答系统

Spark深入解析（三）：Spark环境搭建（不同模式）

电影知识图谱问答系统项目总结

图谱实战 | 京东基于时序知识图谱的问答系统

知识图谱的搭建

基于知识图谱的智能问答机器人

基于知识图谱和相似度匹配的肝病智能问答系统

从0到1构建一个基于知识图谱的智能问答系统

基于neo4j知识图谱的智能问答系统

基于知识图谱的智能决策系统

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)