Solr /export 海量数据导出实现 - 代码天地

Solr /export 海量数据导出实现

企业开发 2018-05-09 20:26:45 阅读次数: 2

Solr需要流式导出海量数据，导出数据是基于流式的，当服务端match到第一条数据之后就会向客户端flush出数据。

需要导出的列需要将schema中field元素的docvalue设置为true，并且在solrconfig.xml中配置

<requestHandler name="/export" class="solr.SearchHandler">
 <lst name="invariants">
   <str name="rq">{!xport}</str>
   <str name="wt">xsort</str>
   <str name="distrib">false</str>
 </lst>
 <arr name="components">
   <str>query</str>
 </arr>
</requestHandler>

客户端的查询代码如下：

                final String[] fl = StringUtils.split(fields, ",");
		SolrClient client = new HttpSolrClient(url);

		query.setDistrib(false);
		query.setFields(fields);
		query.setRows(9999999);

		final PrintWriter writer = new PrintWriter(new OutputStreamWriter(
				FileUtils.openOutputStream(outfile), Charset.forName("utf8")));

		for (String f : fl) {
			writer.print(f);
			writer.print(",");
		}

		final AtomicInteger count = new AtomicInteger(0);
		QueryResponse result = client.queryAndStreamResponse(query,
				new StreamingResponseCallback() {
					@Override
		public void streamSolrDocument(SolrDocument doc) {
						// process doc
					}

		public void streamDocListInfo(long numFound, long start,
							Float maxScore) {
						// writer.println("numFound:" + numFound);
					}
				});
		writer.close();
		System.out.println("numFound:" + result.getResults().getNumFound());
		client.close();

solr服务端相关的代码：

QP：

ExportQParserPlugin 在export handler中使用QP

查询结果流式排序输出：

SortingResponseWriter

猜你喜欢

转载自mozhenghua.iteye.com/blog/2341768

Solr /export 海量数据导出实现

Django import / export实现数据库导入导出

export命名导出与默认导出

sqoop export导出数据到mysql

Sqoop export 数据导出覆盖与更新

Export

export.jsp 导入、导出

export default 导出对象的写法

导入import和导出export

HBase 数据备份 | export | import

Django-xadmin+django-import-export导入导出的实现

【转】hbase导出工具Export介绍

[vue]js模块导入导出export default

Oralce import,export 导入导出及备份

三、导出表（Export Table）解析

db2 export导出文件

EXPORT_SYMBOL 符号导出实例

模块导出简介：module.exports与export

docker 容器导入导出（export/impo）教程

idea仿eclipse的export导出功能

typescript es6的export导出

Javascript 模块导入导出（import export）

solr 数据备份还原，导入导出

Hive中数据导入导出（Import和Export）

通过ArcCatalog的export工具导出数据带别名

sqlite3 import/export db sqlite 导入导出数据

迟延(Lazy)加载导出部件(Export Part)与元数据（Metadata）

database-export 导出数据库设计文档

solr中文分词的实现

Solr实现全文检索

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)