再次脱线的Tomoe酱

移动开发 2018-05-14 18:33:52 阅读次数: 2

之前移植了libspark的Tomoe（原版是用AS2实现）到Java上，后来发现她只能识别不含请浊音的平假名。这几天抽时间想补完它，在网上找到了一个开源项目tegaki（手書），它是基于tomoe（巴）和zinnia（百日草）。

http://tegaki.org/

它的主要作用是提供跨平台的图形界面（用Python实现）。它的代码仓库里有一个平片假名的训练数据包，格式是XML。

https://github.com/tegaki/tegaki/tree/master/tegaki-models/data/train/japanese

我用Java的SAX解释器分析它（虽然标签层次有点不同，但它可以用Tomoe模型数据的XML读取方法读取），然后导出为Java的代码，粘贴到代码中。

本以为大功告成，谁知Tomoe不能识别原始的片假名模型数据。想了几天，对比原来的AS2版本，后来我放宽了候选字的过滤条件，加大候选字的输出个数，终于可以勉强识别到了。

猜你喜欢

转载自weimingtom.iteye.com/blog/1632353

再次脱线的Tomoe酱

TradingView + WebSocket 实时推送 K 线脱坑指南

酱板鸭

突破16%“生死线”！央视点名鸿蒙，华为再次“改口”

栗酱的异或和

栗酱数数

兔子与鹰酱

森蝶蝶酱

酱狗(Django)的初级应用

柚子酱的Mysql学习笔记

和python酱贴贴（（

脱坑-JPA配置

mysql脱坑

防脱库策略

英国脱欧的影响

手脱UPX(3.91)

手脱NsPacK壳

PC快脱单了

脱单啦~

脱单特质

脱不到的长衫

再次开篇

再次启程

再次改变

再次总结

再次重逢

再次起航

再次扫地

再次声明：

Android 7.0脱坑指南

今日推荐

技术解析 GPT-4o：即时语音交互的突破与 GenAI 发展策略

开源大模型与闭源大模型

微信小程序授权登录获取用户的openid

亿级流量系统架构设计与实战

人工智能时代的程序设计教学与课程设计

纽交所技术问题致伯克希尔 (BRK.A) 显示跌近 100%

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

周排行

tensorflow 笔记：二（北大）

fork函数详解

unity单利模板

mac下的特殊键位指引（转自apple）

c语言入门-注释

Python--多任务[线程，进程，协程]

深度对抗学习在图像分割和超分辨率中的应用

【转】【Maven】Project configuration is not up-to-date with pom.xml错误解决方法

基本数据类型与常量池

部署自己的Intell项目的经历

每日归档

2024-06-07(0)

2024-06-06(0)

2024-06-05(0)

2024-06-04(10)

2024-06-03(52)

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)