Elasticsearch中文名聚合分组 - 代码天地

Elasticsearch中文名聚合分组

其他 2019-01-24 00:03:03 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载 https://blog.csdn.net/weixin_43841760/article/details/84643236

Elasticsearch中文名聚合分组

在用Elasticsearch对中文字段进行聚合统计的时候，出现中文被分词的情况，这个时候需要设置需要被聚合字段的mapping属性。
请求地址： http://192.168.0.1:9200/index/_mapping/type/

{
  "properties": {
		"author": {
             "type": "text",
             "fielddata" : true,
             "fields": {"raw": {"type": "keyword"}}
		}
	}
}

在java代码里调用

public JSONArray queryRelation(Integer evnetId) {
		Client client = ElasticsearchWrapper.getTransportClient();
		BoolQueryBuilder bq = QueryBuilders.boolQuery();
		bq.must(QueryBuilders.matchQuery("eventId", evnetId));
		bq.must(QueryBuilders.matchQuery("docType", "event"));
		TermsAggregationBuilder authorTermsBuilder = AggregationBuilders.terms("authorAgg").size(100)
				.field("author.keyword");
		SearchResponse sr = client.prepareSearch(indexName).setTypes(esType).setSearchType(SearchType.QUERY_THEN_FETCH)
				.setQuery(bq).addAggregation(authorTermsBuilder).execute().actionGet();
		StringTerms hhf = sr.getAggregations().get("authorAgg");
		JSONArray jsonArray = new JSONArray();
		for (StringTerms.Bucket bb : hhf.getBuckets()) {
			JSONObject json = new JSONObject();
			json.put("name", bb.getKey());
			json.put("value", bb.getDocCount());
			jsonArray.add(json);
		}
		return jsonArray;
	}

返回结果效果：

[ {
    "name" : "魔都之家",
    "value" : 34
  }, {
    "name" : "TG实习狗",
    "value" : 19
  }, {
    "name" : "上海温度",
    "value" : 19
  }, {
    "name" : "拾实咨询",
    "value" : 14
  }, {
    "name" : "宝山就业",
    "value" : 13
  }, {
    "name" : "成长无忧选好课",
    "value" : 11
  }, {
    "name" : "浦东国际人才城",
    "value" : 10
  }]

猜你喜欢

转载自blog.csdn.net/weixin_43841760/article/details/84643236

Elasticsearch中文名聚合分组

获取枚举中文名

手机开发中文名

excel中文名转拼音

SugarCRM下载时中文名乱码

中文名字按姓氏排序

中文名实体识别

PHP中文名称乱码

下载的文件有中文名

【Zabbix】创建主机支持中文名

rabbitmq 的启动路径有中文名

JAVA 中文名字转拼音

elasticsearch中的分组聚合

linux下swftools转中文名的PDF报错

Firefox下载文件时中文名乱码问题

使用poi 导出Excel文件并解决中文名乱码

js动态设置tb显示的中文名称

Java文件下载中文名不显示&乱码

python的open()方法,操作中文名文件问题

文件下载、excel导出、支持中文名字

文件下载中文名字乱码解决

Android 文件下载中文名乱码的解决办法

HSSFWorkbook生成excel中文名下载防乱码

java 文件下载中文名称乱码解决

mysql 按照中文名称排序

postman导入和给接口取中文名字

读取中文名的文件，并复制到指定目录

jsp无法引用中文名资源的问题

严重支持用中文名做变量名

django view返回中文名称文件

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)