Greenplum GPText(一) 全文检索 安装部署

1.GPText介绍

  GPText通过Solr索和 MADlib分析库加入Greenplum数据库大规模并行处理数据库服务器,以提供大规模分析处理和业务决策支持。GPText包括全文检索以及对全文分析的支持。
 

2.GPText功能

  • GPText提供对Apache Solr索引和搜索的数据库内访问
  • 使用数据库数据或外部文档构建索引,并使用GPText API搜索
  • 用于国际文本和社交媒体文本的自定义标记生成器
  • 通用查询处理器,它接受来自受支持的Solr查询处理器的混合语法查询
  • 多面搜索结果
  • 结果中的术语突出显示
  • 自然语言处理,包括词性标记和命名实体提取
  • 强调高可用性
 

3.安装前环境准备

(1)GPText在Red Hat Enterprise Linux 5.x,6.x和7.x上运行。
(2)安装和配置Greenplum Database系统,版本4.3.6或更高版本。
(3)安装Java JRE 1.8.x并将该bin目录添加到PATH群集中的所有主机上。
(4)Greenplum集群主机全部安装netcat:
yum -y install nc
(5)Greenplum集群主机全部安装lsof:
yum -y install lsof
(6)GPText无法安装到 shared NFS mount。
(7)GPText节点可以与Greenplum段一起安装在Greenplum Database集群主机上,也可以安装在Greenplum集群网络上可访问的其他非数据库主机上。参与GPText系统的所有主机必须具有相同的操作系统和配置,并且对gpadmin用户具有无密码ssh访问权限。
(8)确保在配置Greenplum数据库时为GPText保留内存。要确定为GPText预留的内存,请将每个Greenplum段主机上创建的GPText节点数乘以JVM最大大小。在计算Greenplum数据库gp_vmem_protect_limit服务器配置参数的值时,从物理RAM中减去此内存。
 

4.GPText安装

本次安装使用greenplum-text-3.1.0版本
(1)在Master上,解压
cd /home/gpadmin
tar -xvfz greenplum-text-<version>-<platform>.tar.gz  
例子: 
tar -zxvf greenplum-text-3.1.0-rhel6_x86_64.tar.gz
在当前目录有两个文件gptext_install_config和greenplum-text-3.1.0-rhel6_x86_64.bin
 
(2)添加执行权限
chmod +x /home/gpadmin/greenplum-text-<version>-<platform>.bin
例子:
chmod +x /home/gpadmin/greenplum-text-3.1.0-rhel6_x86_64.bin
 
(3)用root用户在/usr/local 进行安装目录
a. source /usr/local/greenplum-db-<version>/greenplum_path.sh
b. 创建一个文本文件,其中包含将安装GPText的所有主机的名称列表,每行一个,包括主主机名和备用主机名。
c. 启动gpssh,指定带有主机名的文本文件。
d. 创建gptext安装目录和greenplum-solr目录,并设置所有权和权限。例如,如果要在默认目录中安装GPText,请执行以下操作/usr/local:
mkdir /usr/local/greenplum-text-3.1.0
mkdir /usr/local/greenplum-solr
chown gpadmin:gpadmin /usr/local/greenplum-text-3.1.0
chmod 775 /usr/local/greenplum-text-3.1.0
chown gpadmin:gpadmin /usr/local/greenplum-solr
chmod 775 /usr/local/greenplum-solr
exit
    也可以手动在seg节点上手动创建
e. 以gpadmin用户身份完成剩余的步骤。
 
(4)编辑gptext_install_config文件以设置安装参数
 
(5)执行下列命令
./gptext-<version>.bin -c <gptext_install_config>
例子:
./greenplum-text-3.1.0-rhel6_x86_64.bin -c gptext_install_config
 

猜你喜欢

转载自blog.csdn.net/qq_35260875/article/details/107235920