K近邻算法(KNN)原理解析及python实现代码

KNN算法是一个有监督的算法,也就是样本是有标签的。KNN可以用于分类,也可以用于回归。这里主要讲knn在分类上的原理。KNN的原理很简单: 放入一个待分类的样本,用户指定k的大小,然后计算所有训练样本与该样本的距离,选择距离该样本最近的k个训练样本。这k个样本少数服从多数的结果就是该样本的类别。 计算样本之间的距离一般选择欧式距离,k值的选取可以使用交叉验证。个人觉得KNN有趣的地方在于它并没有显性的训练,不像其他有监督的算法会用训练集train一个模型,然后验证机或测试集用该模型来进行分类
分类: 其他 发布时间: 11-09 23:53 阅读次数: 0

六级英语单词列表30版(1861-1890)

1861、bump[bʌmp] n. 肿块,隆起物;撞击 vi. 碰撞,撞击;颠簸而行 vt. 碰,撞;颠簸 adv. 突然地,猛烈地 n. (Bump)人名;(英、西)邦普 拆分:bu(不能)+mp(冒泡) 联想:这个肿块不能让它冒泡了 1862、peacock['piːkɒk] n. 孔雀;雄孔雀;爱虚荣的人 n. (Peacock)人名;(英)皮科克 vi. 炫耀;神气活现地走 拆分:pe(胖鹅)+a(and和)+cock(公鸡) 联想:胖鹅和公鸡生出了孔雀 1863、unemploym
分类: 其他 发布时间: 11-09 23:52 阅读次数: 0

六级英语单词列表30版(1891-1920)

1891、arc[ɑːk] n. 弧(度);弧光(全称electric arc);弧形物;天穹 adj. 圆弧的;反三角函数的 vt. 形成电弧;走弧线 n. (Arc)人名;(法)阿尔克 拆分:ar(爱人)+c(吃) 联想:这个弧度被爱人吃掉了 1892、smuggle['smʌg(ə)l] vt. 走私;偷运 vi. 走私,私运;偷带 拆分:sum(私募)+gg(高估)+le(了) 联想:私募被高估了,其实就是走私 1893、provoke[prə'vəʊk] vt. 驱使;激怒;煽动;惹
分类: 其他 发布时间: 11-09 23:52 阅读次数: 0

六级英语单词列表30版(1921-1950)

1921、shorthand['ʃɔːthænd] n. 速记;速记法 adj. 速记法的 拆分:short(短)+hand(上手) 联想:短时间上手,也就是速记 1922、latitude['lætɪtjuːd] n. 纬度;界限;活动范围 拆分:暂无 联想:暂无 1923、legislation[ledʒɪs'leɪʃ(ə)n] n. 立法;法律 拆分:暂无 联想:暂无 1924、obligation[ɒblɪ'geɪʃ(ə)n] n. 义务;职责;债务 拆分:暂无 联想:暂无 1925、
分类: 其他 发布时间: 11-09 23:51 阅读次数: 0

六级英语单词列表30版(1951-1980)

1951、intervene[ɪntə'viːn] vi. 干涉;调停;插入 拆分:inter(埋)+ven(wen过问)+e 联想:都埋到土里了还要干涉和过问 1952、endurance[ɪn'djʊər(ə)ns; en-] n. 忍耐力;忍耐;持久;耐久 拆分:end(最后)+u()+ran(然后)+ce(厕所) 联想:忍耐到最后然后还是得上厕所 1953、craft[krɑːft] n. 工艺;手艺;太空船 vt. 精巧地制作 n. (Craft)人名;(英、德、罗)克拉夫特 拆分:
分类: 其他 发布时间: 11-09 23:51 阅读次数: 0

六级英语单词列表30版(1981-2010)

1981、stall[stɔːl] n. 货摊;畜栏;托辞 vt. 拖延;使停转;使陷于泥中 vi. 停止,停转;拖延 n. (Stall)人名;(瑞典)斯塔尔 拆分:st(石头)+all(所有) 联想:所有的摊位都是石头做成的 1982、situation[sɪtjʊ'eɪʃ(ə)n] n. 情况;形势;处境;位置 拆分:situat(e)(定位)+ion(名词后缀) 联想:定位 1983、inherent[ɪn'hɪər(ə)nt; -'her(ə)nt] adj. 固有的;内在的;与生俱
分类: 其他 发布时间: 11-09 23:51 阅读次数: 0

静态文件处理

1.什么是静态文件   在Flask中不能再服务器动态交互的文件都是静态文件 2.静态文件的处理   1.所有的静态文件必须放在名为static的目录中,除非修改了配置   2.所有的静态文件必须通过/static/路径访问 3.如何修改配置  构建Flask 应用时允许指定的配置信息   app=Flask(__name__, template_folder='muban', static_url_path='/s', static_folder='/sta')     template_f
分类: 其他 发布时间: 11-09 23:51 阅读次数: 0

对于今天自己装zookeeper和dubbo的一些心得

最近的再练的一个项目需要用到zookeeper和dubbo于是试着自己在虚拟机上装着试试 1.因为dubbo的服务安装注册中心官方推荐使用zookeeper,所以要装zookeeper,但是前提必须要有java环境所以jdk的安装时必不可少的啦 安装环境: Linux:centos6.4 Jdk:1.7以上版本 安装步骤: 第一步:安装jdk 第二步:把zookeeper的压缩包上传到linux系统。 第三步:解压缩压缩包 tar -zxvf zookeeper-3.4.6.tar.gz 第四
分类: 其他 发布时间: 11-09 23:51 阅读次数: 0

数据分析之期权

一、白话期权   本文来自知乎,对于一个NJU软工学生来说,先来补补脑:https://zhuanlan.zhihu.com/optionmarketmaking   随着2015年上证50ETF 期权的开放,豆粕和白糖期权的即将开市,最近几年期权在国内逐渐火了起来。虽然关注了一些国内相关的期权平台,公众账号,发现很多内容要不太学术,穿插大量复杂的公式,要不就是各种不切合实际的套利。含有大量数学公式的文章对于非金融从业者,或没有太多高数背景的人来说就如天书一般,写的再好也起不到效果,相反能看得
分类: 其他 发布时间: 11-09 23:51 阅读次数: 0

POJ 1451 - T9 - [字典树]

题目链接:http://bailian.openjudge.cn/practice/1451/ 总时间限制: 1000ms  内存限制: 65536kB 描述 Background A while ago it was quite cumbersome to create a message for the Short Message Service (SMS) on a mobile phone. This was because you only have nine keys and th
分类: 其他 发布时间: 11-09 23:51 阅读次数: 0

各种推导式玩法

推导式套路 之前我们已经学习了最简单的列表推导式和生成器表达式。但是除此之外,其实还有字典推导式、集合推导式等等。 下面是一个以列表推导式为例的推导式详细格式,同样适用于其他推导式。 variable = [out_exp_res for out_exp in input_list if out_exp == 2] out_exp_res:  列表生成元素表达式,可以是有返回值的函数。 for out_exp in input_list:  迭代input_list将out_exp
分类: 其他 发布时间: 11-09 23:51 阅读次数: 0

10月面试记录

从上月19号提出离职开始,工作一直没有停止,期间抽出两个周四调休去面试,目前也基本确定了下家,这里做一下记录 10.22:10.19在oa上提出离职,周一跟经理说了我要走的意图,表现的态度很坚决,经理也知道这个公司的天花板就是这样了,同意了,问我要在哪工作,听说还是在济南,很惋惜,劝我去北京,如果是在半年前,我职业规划里的下个工作地点就是北京,但是,现在,我深深体会到了身不由己的感受。 10.25:周一就和领导说了,由于裸辞,每周四我都要调一天休面试,面了四家,上午两家,下午两家。第一家10:
分类: 其他 发布时间: 11-09 23:51 阅读次数: 0

P2520 [HAOI2011]向量

挺喜欢这个大佬的解题:https://www.cnblogs.com/five20/p/8427795.html 这篇文章也是借鉴大佬的博客。不过还是希望有别的补充。 题意:给你坐标(x, y)然后产生(x,y)(-x,y)(x,-y)(-x,-y)(y,x) (-y,x) (y,-x) (-y,-x)让这八个坐标任意组合,问是否能配成(a, b)坐标。 然后,其实(x, y)和(-x,-y)提公因式化为同一项 其他同理 我们先证明一个东西为后面的证明打下基础! 还可以说明 h1,h3具有同奇
分类: 其他 发布时间: 11-09 23:51 阅读次数: 0

二分法查找算法

二分法查找具有惊人的查找速度,尤其是对于海量数据的时候,作用更加明显,时间复杂度用大O表示法,即是(logn),这种(logn)时间复杂度是非常神奇的,比如 n 等于 2 的 32 次方,这个数很大了吧?大约是42亿,也就是说,如果我们在 42 亿个数据中用二分查找一个数据,最多需要比较 32 次。 但是,二分查找是有局限性的: (1)二分查找依赖的是顺序表结构,简单点说就是数组。 解释:主要原因是二分查找算法需要按照下标随机访问元素。 (2)二分查找针对的是有序数据。 (3)数据量太小不适合
分类: 其他 发布时间: 11-09 23:51 阅读次数: 0

转载--【pip install error 】之ReadTimeoutError: HTTPSConnectionPool

常用pip来更新Python的package,经常出现揪心的红色错误信息 ReadTimeoutError: HTTPSConnectionPool(host='pypi.python.org', port=443): Read timed out. 主要问题:默认的源不稳定导致 解决方案:切换稳定可靠的源 (清华的镜像站)传送门:https://mirrors.tuna.tsinghua.edu.cn/ 以pandas库为例:pip install --index https://mirro
分类: 其他 发布时间: 11-09 23:51 阅读次数: 0

Tju_Oj_3988Password

这个题是给树的前序和中序,输出后序。 做法是根据前序找根,根据根在中序中找中序的左右子树,根据左右子树长度找前序的左右子树,依此递归。 做过之后感觉还是比较基础的,废话不多说,上题上代码。 Bob will get a bag as gift from Alice, but Alice don't wanna Bob get the bag without did anything, so she put the bag into a safe box... Alice will give t
分类: 其他 发布时间: 11-09 23:51 阅读次数: 0

面试三次握手、四次挥手

建立TCP需要三次握手才能建立,而断开连接则需要四次挥手。 https://www.cnblogs.com/thrillerz/p/6464203.html ACK:是用来应答的 SYN:是用来同步的 FIN:终端连接请求 三次握手建立连接 首先Client端发送连接请求报文,Server段接受连接后回复ACK报文,并为这次连接分配资源。Client端接收到ACK报文后也向Server段发生ACK报文,并分配资源,这样TCP连接就建立了。 四次挥手断开连接 假设Client端发起中断连接请求,
分类: 其他 发布时间: 11-09 23:51 阅读次数: 0

测试与发布

Alpha版本测试报告 1、关于bug 2、我们产品是游戏《坦克大战》,面对用户为游戏玩家,特点为画面复古、操作性要求低、有竞技性。游戏内攻击敌方坦克的打击感和游戏最终获得的分数高低比较是游戏的可玩之处。 对低龄玩家:游戏的休闲与低操作性正好给他们提供了良好的娱乐环境,闯关的分数也能给他们感受到竞技带来的游戏体验。 对青年或成年玩家:游戏的趣味性或许已满足不了他们,但是在闲暇时不失为一个消磨时光的好选择,轻松且能让玩家回想起童年简单的快乐。 3、测试矩阵 测试功能项 检验点 预期结果 Java
分类: 其他 发布时间: 11-09 23:51 阅读次数: 0

counter

amazingcounters的https过期了,博客的访问统计受到影响,所以暂时以这篇博文来统计
分类: 其他 发布时间: 11-09 23:51 阅读次数: 0

团队博客--测试发布(队名:Running Duck)

代码链接:Tetris 码云地址 一、Alpha版本测试报告 1、测试计划 测试内容 1、方块生成下落 2、方块左右移动 3、方块快速下滑 4、本汉字替换 5、下一个汉字提示 6、方块颜色生成 7、汉字方块合并 8、游戏暂停和开始 9、背景音频 10、汉字合成分数变化 测试人员 陆海燕、蔡苑菲 测试时间 11.5-11.7 测试方法 android studio模拟器 安卓手机开启调试模式测试 质量目标 1-9功能正常,10功能附加 修复人员 马仪生 2、测试过程 测试截图 错误记录(提交is
分类: 其他 发布时间: 11-09 23:51 阅读次数: 0