数据挖掘核心数学之数论(一)数论与数据分析

更多R语言信息欢迎关注我的新浪微博:Jenny爱学习

微信公众号:R语言数据分析与实践


一.数论研究对象

数论研究正整数集合,正整数也常被称为自然数:

                                    1,2,3,4,5,……

数学上,常把非负数(包括0)称为自然数,考虑到数据挖掘中的实际意义,本系列中所有自然数均假定为正整数。

1.数论研究不同类型数之间的关系,例如:

奇数:1,3,5,7,9,……

偶数:2,4,6,8,10,……

平方数:1,4,9,16,25,……(可排列成正方形的数,高斯公式的几何证明方法即来源于此)

立方数:1,8,27,64,125,……(推广“费马大的定律”)

素数:2,3,5,7,11,13,……(因子只有1与自身的数,常用于密码学,RSA加密算法)

与1(mod4)同余的数:1,5,9,13,17,……(mod4余数为1,常用于毕达哥斯拉三元组,又称勾股数组平方数的验证)

与3(mod4)同余的数:3,7,11,15,19,……(mod4余数为3,常用于平方数的验证,若余数为3,则不构成平方数组)

孪生素数:3,5,7,11,13,17,19,……(奇数p是素数,p+2也是素数)

三角数:1,3,6,10,15,……(可排列成三角形的数)

完全数:6,28,496,……(所有因子相加等于自身)

斐波那契数:1,1,2,3,5,8,13,21,……

……


二. 数论与数据分析:

         数论既有实验性也有理论性。试验部分常常首先出现,它引出问题并揭示回答问题的方法。理论部分随之而来,在这部分人们设法进行论证,给出问题的最后答案。概括来说,研究步骤如下:

1.积累数据,通常是数值数据,但有时更抽象

2.分析数据,设法找出模式与关系

3.形成结石模式与关系的猜想(即猜测),通常借助公式来表达这些猜想

4.通过手机额外数据、检查新信息是否符合猜想来验证你的猜想

5.设计你的猜想成立的论证(即证明)

        这五个步骤在数论及数据挖掘中非常重要。有了收集的数据,一般来说找出一些解释并不太难,科学理论的正确验证是它能够预测还没有进行的试验结果。换句话说,只有当人们进行了新数据对比试验时,数据挖掘的理论才成为可信的。

       在数据分析研究中,人们需要证明步骤,即断言的逻辑序列,它从已知事实开始,以所希望的结论结束。


如果觉得本篇文章对您有帮助,可以打赏我的微信公众号赞赏码,支持知识分享






猜你喜欢

转载自blog.csdn.net/Nicolelovesmath/article/details/78998575