朴素贝叶斯算法java实现(多项式模型)

网上有很多对朴素贝叶斯算法的说明的文章,在对算法实现前,参考了一下几篇文章: NLP系列(2)_用朴素贝叶斯进行文本分类(上) NLP系列(3)_用朴素贝叶斯进行文本分类(下) 带你搞懂朴素贝叶斯分类算法 其中“带你搞懂朴素贝叶斯算法”在我看来比较容易理解,上面两篇比较详细,更深入。 算法java实现 第一步对训练集进行预处理,分词并计算词频,得到存储训练集的特征集合 /** * 所有训练集分词特征集合 * 第一个String代表分类标签,也就是存储该类别训练
分类: 其他 发布时间: 05-26 21:41 阅读次数: 1

c# 利用委托、事件、evenhandler,泛型,lambda表达式给Form窗体之间传值,以及一些总结.

10年了,第二贴. 第一帖还是在在大学, 第二贴已经是10年之后了...哎,我还是没有走进CODER,最后选择了事业单位,, 就当无聊学习吧. (主窗体往2个子窗体传值,子窗体获取值.3种方法,) 1.form1 1 //方法3 (在form1类外声明) 2 public event EventHandler<MyEventArgs> MyEvent; 3 //在form1里面放一个button,一个textbox,单击传值. 4
分类: 其他 发布时间: 05-26 21:41 阅读次数: 0

Python-列表操作

插入 names = ["zhangyang", "gunyun", "xiangpeng", "xuliangchen"] #将chenyunfei插入到gunyun前面 names.insert(1, "chenyunfei")#"1"是想插入的位置 print(names) 删除 names = ["zhangyang", "gunyun", "xiangpeng", "xuliangchen"] #第一种方法 names.remove("gunyun") #第二种方法 del name
分类: 其他 发布时间: 05-26 21:41 阅读次数: 1

Cobbler自动安装过程

1. 2. 3. 4. 6. 7. 8. 9. 10.
分类: 其他 发布时间: 05-26 21:41 阅读次数: 2

SQL:检索数据-基本检索

检索数据 1.select语句 增删改查四大操作之“查”,即检索; 一般包括:what,where:查什么,从哪里选择 2.检索单个列 例:想从products表中检索名为prod_name的列, SELECT prod_name FROM products; 从中看出,SQL不区分大小写,许多SQL开发人员倾向于对SQL关键字使用大写,对列和表名使用小写,使代码更易阅读和调试。最佳方式是按照大小写惯例,且使用时保持一致。 3.检索多个列 4.检索所有列 例:检索products表中所有列 S
分类: 其他 发布时间: 05-26 21:41 阅读次数: 0

python 踩坑小计 virtualenv-site-packages

在自己的ubuntu下面创建了virtualenv。 这里,创建时候如果用了 --no-site-packages,那么在虚拟环境目录 /lib/python**/下面会有一个no-global-site-package.txt文件。 这里删除了这个文件之后,在这个虚拟环境下面的python的系统路径sys.path就会有原来安装的python的lib/site-packages的文件,因为创建sys.path是通过Virtualenv的自定义的site.py来控制的,她会查找是不是有no-g
分类: 其他 发布时间: 05-26 21:41 阅读次数: 1

1.4 EXERCISES

1.4.1 1.4.2 1.4.3 1.4.4 1.4.5 1.4.6 1.4.7 1.4.8 1.4.9 1.4.10 1.4.11 1.4.12 1.4.13
分类: 其他 发布时间: 05-26 21:41 阅读次数: 2

pandas 级联 concat append

连接的一个有用的快捷方式是在Series和DataFrame实例的append方法。这些方法实际上早于concat()方法。 它们沿axis=0连接 #encoding:utf8 import pandas as pd one = pd.DataFrame({ 'Name': ['Alex', 'Amy', 'Allen', 'Alice', 'Ayoung'], 'subject_id':['sub1','sub2','sub4','sub6','sub5
分类: 其他 发布时间: 05-26 21:36 阅读次数: 1

Django - 常用配置

一、logging配置 Django项目常用的logging配置 LOGGING = { 'version': 1, 'disable_existing_loggers': False, 'formatters': { 'standard': { 'format': '[%(asctime)s][%(threadName)s:%(thread)d][task_id:%(name)s][%(filename)s:%(lin
分类: 其他 发布时间: 05-26 21:36 阅读次数: 0

Beta阶段敏捷冲刺四

一、举行站立式会议 1、当天站立式会议照片一张 2、团队成员报告 林楚虹 董美凤 (1) 昨天已完成的工作:完成数据库PK表的建立,从数据库中取出匹配用户头像昵称 (2) 今天计划完成的工作:完成用户的匹配功能 (3) 工作中遇到的困难:对于自己的用户信息获取,并且加入到PK表中,从PK表中获得对手的用户信息 (4) 每个人的具体贡献:参照已完成的工作 林艺如 (1) 昨天已完成的工作:尝试导入数据测试,完整数据导入还没完成 (2) 今天计划完成的工作:继续修改单词词义并完成数据导入数据库 (
分类: 其他 发布时间: 05-26 21:36 阅读次数: 1

Beta冲刺阶段3.0

1. 提供当天站立式会议照片一张 2. 每个人的工作 (有work item 的ID) 成员 昨天已完成的工作 今天计划完成的工作 工作中遇到的困难 具体贡献 郑晓丽 "我的活动详情”界面的初步美化 完成“我的活动“和“活动详情”界面美化 页面排版纠结了好久 参考左栏 廖怡洁 “我的奖励”的框架设计 继续完成“我的奖励”界面设计 被换行的问题困扰了很久 参考左栏 包梦榕 新增图片上传功能 首页的美化设计 最新活动列表显示存在问题 参考左栏 柯智青 初步完成获取所有活动 完成用户加入活动时往数据
分类: 其他 发布时间: 05-26 21:36 阅读次数: 0

SPOJ - 3267. D-query 主席树求区间个数

SPOJ - 3267 主席树的又一种写法。 从后端点开始添加主席树, 然后如果遇到出现过的元素先把那个点删除, 再更新树, 最后查询区间就好了。 1 #include<bits/stdc++.h> 2 using namespace std; 3 #define Fopen freopen("_in.txt","r",stdin); freopen("_out.txt","w",stdout); 4 #define LL long long 5 #define ULL unsign
分类: 其他 发布时间: 05-26 21:36 阅读次数: 0

【C语言】KMP算法

KMP算法 KMP算法是D.E.Knuth、J.H.Morris和V.R.Pratt共同提出的,简称KMP算法。 常用于在一个文本串S内查找一个模式串P 的出现位置,这个算法由Donald Knuth、Vaughan Pratt、James H. Morris三人于1977年联合发表,故取这3人的姓氏命名此算法。 下面先直接给出KMP的算法流程: 假设现在文本串S匹配到 i 位置,模式串P匹配到 j 位置 • 如果j = -1,或者当前字符匹配成功(即S[i] == P[j]),都令i++,j
分类: 其他 发布时间: 05-26 21:36 阅读次数: 0

js随笔--关于this

——————2018-5-24 更新—————— ES6中的箭头函数是函数的另一种更简洁的表达形式;在箭头函数被创建时,this对象就已经被绑定给其创建时所在的对象而不是运行时再确定。可以认为箭头函数本就没有自己的this。如果它在另一个函数中被创建,那么它的this就指向包含函数的this, 这个对象在包含函数运行时确定;如果它被封装在一个对象中,那么它的this就指向这个对象。 ——————原文—————— 虽然这个问题大家都说不好写,但我还是尝试写出自己的理解,也是多一次整理思路的过程。
分类: 其他 发布时间: 05-26 21:36 阅读次数: 0

ALGORITHM1.5(continued) Union-find inplementation (weighted quick-union)

import edu.princeton.cs.algs4.*; public class WeightedQuickUnionUF { private int[] id; private int[] sz; private int count; public WeightedQuickUnionUF(int N) { count = N; id = new int[N]; for(int i
分类: 其他 发布时间: 05-26 21:36 阅读次数: 0

Python3学习笔记(四):序列

一、序列概览 Python 包含6 种内建的序列:列表,元组,字符串,Unicode字符串,buffer对象和xrange对象。这里重点讨论最常用的两种类型:列表和元组。   列表与元组的主要区别在于: 列表可以修改,元组则不能。也就是说如果要根据要求来添加元素,那么列表可以会更好用; 而出于某些原因,序列不能修改的时候,使用元组则更为合适。 在操作一组数值的时候,序列很好用。可以用序列表示数据库中一个人的信息---第1个元素是姓名,第2个元素是年龄。根据上述内容编写一个列表。 >>> edw
分类: 其他 发布时间: 05-26 21:36 阅读次数: 5

kafka对消费者分配分区规则(Java源码)

  在上一篇 kafka topic消息分配partition规则(Java源码) 我们对生产者产生的消息分配partition规则进行了分析,那么本章我们来看看消费者是怎么样分配partition的。   kafka 为了保证同一类型的消息顺序性(FIFO),一个partition只能被同一组的一个consumer绑定消费,不同组的consumer可以绑定同一个partition进行重复消费。但是一个consumer可以绑定多个partition(哈哈不知道这里用绑定是否合适)。用个例子解释
分类: 其他 发布时间: 05-26 21:36 阅读次数: 0

组合数的尊严

全排列有康托展开映射到自然数,那组合数有没有类似的映射... 比如组合数C(5,2),用二进制表示选和不选的话,就是 00011->0 00101->1 00110->2 01001->3 01010->4 01100->5 10001->6 10010->7 10100->8 11000->9 当然有了,能排序就能映射到自然数,而有限多个元素没有不能排序的。考虑题主给出的要求的顺序,它实际上是用01表示时候的字典序,要求它对应的自然数,其实也就是求出所有排列中比它小的排列的数量。 这个问题可
分类: 其他 发布时间: 05-26 21:36 阅读次数: 0

个性化你的博客园【持续更新中!!!】

1、背景更换 打开博客园右上角-设置-博客设置: 任意选择一款主题之后,找到博客设置中的页面定制CSS代码。 body { color: #000; background: #eee; font-family: Verdana,Arial,Helvetica,sans-serif; font-size: 9pt; min-height: 101%; background-position: 0% 0%; background-repea
分类: 其他 发布时间: 05-26 21:31 阅读次数: 1

NOI2002银河英雄传说-带权并查集

[NOI2002]银河英雄传说-带权并查集 luogu P1196 题目描述 Description: 公元五八○一年,地球居民迁至金牛座α第二行星,在那里发表银河联邦创立宣言,同年改元为宇宙历元年,并开始向银河系深处拓展。 宇宙历七九九年,银河系的两大军事集团在巴米利恩星域爆发战争。泰山压顶集团派宇宙舰队司令莱因哈特率领十万余艘战舰出征,气吞山河集团点名将杨威利组织麾下三万艘战舰迎敌。 杨威利擅长排兵布阵,巧妙运用各种战术屡次以少胜多,难免恣生骄气。在这次决战中,他将巴米利恩星域战场划分成3
分类: 其他 发布时间: 05-26 21:31 阅读次数: 5