北邮数据挖掘与数据仓库期末考试形式和主要内容

2019-2020学年秋季学期数据仓库与数据挖掘
本文适合北邮研究生秋季学期王晓茹老师的数据挖掘和数据仓库期末复习
其他老师的同名课程我并未参加,这篇文章可能并不适用

在复习的时候,在网上查阅数据挖掘的资料,基本都找不到什么有价值的内容,在考完期末之后,凭借印象,我想稍微留下一些痕迹,帮助后来的学弟学妹们准备期末复习。

考试形式

简答题:
  • 约40-50分的简答题(每题5分),全部来自于老师的ppt,都能够非常容易的在相应的ppt上找到
  • 大约会包含10-20分的数据仓库概念(数据仓库模型:雪花,星型…,数据仓库结构等)
计算简答题
  • 约30-40分
  • 可以携带计算器

主要考点:

  1. 决策树计算,生成和剪枝
    参考习题
    参考习题
  2. 关联规则计算(参考ppt上习题)
  3. Kmeans算法
  4. 朴素贝叶斯计算题
    参考习题

这份试题是我找到的一个参考链接,我觉得这份试题的计算题还是比较有参考价值的,可以看一下计算题和解答过程,
参考试题

开放题:

  • 约10分

最后还有一部分开放题,会结合文本分类实验一,让你描述你的实验内容,所以请认真完成文本分类实验,收获很多,也对考试很有帮助

发布了7 篇原创文章 · 获赞 6 · 访问量 855

猜你喜欢

转载自blog.csdn.net/qq_38022493/article/details/103983379