河南大学机器学习与数据挖掘——第七章 贝叶斯分类器
(考大题)
·
第七章 贝叶斯分类器(考大题)
-
生成式模型:贝叶斯分类器
-
判别式模型:决策树、BP神经网络、支持向量机
去年考了写出贝叶斯公式并且解释贝叶斯定理,如下:
-
贝叶斯定理
-
:是先验概率,或称
的先验概率,是独立
的
-
:样本数据被观察的概率
-
:代表在假设
成立的情况下,观察到
的概率
-
:是后验概率,或称条件
下的
后验概率
【分类问题:贝叶斯算法详解+考试例题讲解】
测试题
- 朴素贝叶斯分类器采用了_属性条件独立性______________________假设。
- 给定贝叶斯公式 P(cj|x) =(P(x|cj)P(cj))/P(x),公式中P( cj|x)为 ( A )
A、先验概率 B后验概率 C全概率 D联合概率
- 贝叶斯分类器属于__生成式模型____________,支持向量机属于判别式模型。
- 半朴素贝叶斯分类器的基本想法是适当考虑___属性之间的依赖关系________________________,从而既不需要进行完全联合概率计算,又不至于彻底忽略了比较强的属性依赖关系。
- EM算法提供一种近似计算______含有隐变量概率模型________________的极大似然估计的方法。
- EM算法时常用的估计参数隐变量的方法,是一种迭代式的方法,能收敛到____局部最优解__________。
- 在朴素贝叶斯分类器的训练过程中,为了避免其他属性携带的信息被训练集中未出现的属性值抹“抹去”,在估计概率值时通常要进行“平滑”,常用___拉普拉斯修正(Laplace平滑)_______________。
- 在朴素贝叶斯分类器的训练过程中,拉普拉斯修正避免了__零概率以及属性值未出现的数量过于小_____________的问题。
- 简述EM(Expectation-Maximization)算法的用途及其基本思想。
答:EM算法的用途是用于参数估计,基本思想是通过两个步骤:E步和M步来进行计算,E步计算隐变量的期望,M步极大化似然函数来估计模型参数,直至收敛或达到预设迭代次数。
- 请用表4.1西瓜数据集2.0训练一个朴素贝叶斯分类器,试估计先验概率和前两个属性的条件概率;如果给定测试样本x(浅白,蜷缩,清脆,清晰,平坦,硬滑),写出后验概率公式。
答:根据表4.1中的数据,浅白和蜷缩属性的先验概率分别为5/17和8/17
对于色泽和根蒂属性,可以计算出每个属性下各个取值的条件概率,
色泽: 青绿 3/5 乌黑 2/5 浅白 0/5
根蒂: 蜷缩 6/8 稍蜷 2/8 硬挺 0/8
P(cj|x) = P(浅白|cj)P(蜷缩|cj)P(清脆|cj)P(清晰|cj)P(平坦|cj)P(硬滑|cj)P(cj) / P(x)
其中cj为类别,P(cj)为先验概率,P(属性|cj)为条件概率。
更多推荐


所有评论(0)