中科院分词ictclas2013使用java调用 - 代码天地

中科院分词ictclas2013使用java调用

企业开发 2018-05-13 20:26:36 阅读次数: 4

中科院ictclas2013版分词系统，现在改为NLPIR汉语分词系统--http://ictclas.nlpir.org/，功能上已经足够强大了，由于项目需要，整合分词到系统中来。参考官网的java调用说明，在使用过程中有些要注意的地方。

下面贴出配置过程：

1.进入官网下载

ictclas2013下载包，目前更新到0416版，ictclas2013-Win-32-jni或者64位的。如果系统是32位的就下载32位的，如果是64位的系统，那就要看你安装的java虚拟机是32位还是64位。若是32为jdk，还是要下载使用32位的JNI，而且Eclipse也用32位的。

2.准备文件

打开ictclas2013文件，需要的数据是：Data,Bin,Text三个文件，其中Bin文件夹里面只要：NLPIR.dll文件,里面内容不要轻易更改。打开Win-32bit_JNI-lib文件，里面有个NLPIL_JNI.dll文件。

3.创建项目

a.直接将java示例程序导入到src目录下，TestNLPIR.java和kevin同级，不要更改包名。

b.创建file文件夹，跟src同级目录，将Data文件夹放入里面。把测试文本Test放入到项目里面，也跟src是同级目录。

c.导入dll文件，将NLPIR.dll和NLPIL_JNI.dll文件同时导入到项目中，使用右键点击项目，import方法，从文件中导入，选择这两个文件。

d,设置程序，下面给出test()方法的简单说明

NLPIR testNLPIR = new NLPIR();
        String argu = "./file/";
	System.out.println("NLPIR_Init");
	//0表示编码为GBK，设为1，在Eclipse调用文字乱码
	if (testNLPIR.NLPIR_Init(argu.getBytes("GB2312"),0) == false)
		{
			System.out.println("Init Fail!");
			return;
		}
	//导入用户词典前,设置为0，表示去除了角色标注；设置1，加上角色标注
byte nativeBytes[] = testNLPIR.NLPIR_ParagraphProcess(sInput.getBytes("GB2312"), 0);
String nativeStr = new String(nativeBytes, 0, nativeBytes.length, "GB2312");
System.out.println("分词结果为： " + nativeStr);

4.最后说明

附上已经整合好的项目，当然只是简单的。实际中效果还是很理想的。

猜你喜欢

转载自cjp1989.iteye.com/blog/1856613

中科院分词ictclas2013使用java调用

中科院分词系统 ICTCLAS2013 添加新词功能

[转]中科院分词工具ICTCLAS Java JNI接口

ICTCLAS2013 Java版本的使用方法

中科院分词ICTCLAS5.0 配置错误处理

中科院分词调用代码，无词性标注

java程序打包成jar文件（自己实践和查网页解决，以中科院分词工具ICTCLAS5.0 为例）

中科院分词系统NLPIR的JAVA代码（补充2）

中科院分词系统NLPIR的JAVA代码（补充）

中科院分词系统NLPIR的JAVA代码（补充3）

中科院分词系统的大致流程

中科院分词系统NLPIR的JAVA代码（批量读取文件）

中科院分词系统（NLPIR）常见错误处理JAVA

针对中科院汉语分词系统nlpir中的中文分词部分在java环境的部署（Linux和windows）（获取关键词）

SeetaFace编译使用中科院人脸识别SDK

中科院实习（9）

中科院预警名单

中科院分词libICTCLAS2011部署日志

中科院- 生物特征识别概述

ROS中科院软件所

中科院大学模式识别

中科院孙应飞老师

中科院研究所

【科研】JCR分区与中科院分区

如何查看中科院分区

中科院博士，已被解救！

Lucene初步学习(二) eclipse中配置lucene环境及nlpir中科院分词器的lucene支持

中科院ChatGPT Academic开源安装使用过程中的网络代理问题

java版中文分词-ICTCLAS小例子

中文分词ictclas的Java改造版本

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)