河南大学机器学习与数据挖掘——第七章贝叶斯分类器

（考大题）

F112514yu

1053人浏览 · 2025-06-22 16:43:19

F112514yu · 2025-06-22 16:43:19 发布

第七章贝叶斯分类器（考大题）

生成式模型：贝叶斯分类器
判别式模型：决策树、BP神经网络、支持向量机

去年考了写出贝叶斯公式并且解释贝叶斯定理，如下：

贝叶斯定理

$P(H|X)=\frac{P(X|H)P(H)}{P(X)}$

$P(H)$ ：是先验概率，或称 $H$ 的先验概率，是独立 $X$ 的
$P(X)$ ：样本数据被观察的概率
$P(X|H)$ ：代表在假设 $H$ 成立的情况下，观察到 $X$ 的概率
$P(H|X)$ ：是后验概率，或称条件 $X$ 下的 $H$ 后验概率

【分类问题：贝叶斯算法详解+考试例题讲解】

去年大题考了拉普拉斯修正
分类问题：贝叶斯算法详解+考试例题讲解_哔哩哔哩_bilibili本节为预测性数据分析：分类问题部分的贝叶斯算法详解，以及代表性考试例题讲解。, 视频播放量 9887、弹幕量 31、点赞数 269、投硬币枚数 215、收藏人数 248、转发人数 88, 视频作者冠宇老师UPUPUP, 作者简介环游世界的教书先生，相关视频：分类问题：决策树+ID3算法+C4.5算法+考试例题讲解，分类问题：分类算法+KNN算法详解+考试例题讲解，MIS - 管理信息系统 - 第6章（商务智能系统：数据库与数据挖掘 - 下半部分），数据库第6章关系数据理论（第二部分：范式理论多值依赖和4NF)，聚类问题：DBSCAN算法详解+考试例题讲解，数据库第3章 SQL（第二部分：数据查询PART2-连接嵌套集合查询），数据库第2章关系数据库（上），数据库第6章关系数据理论（第一部分：问题的提出为什么二维表会有问题），描述性统计分析与数据可视化，数据库课程前导内容二：信息系统中的数据存储https://www.bilibili.com/video/BV18e411c7nK?vd_source=0fc465b08fbccae7fe0d0aa20b5604a9

EM算法：【什么是EM最大期望算法】什么是EM最大期望算法_哔哩哔哩_bilibili什么是EM最大期望算法, 视频播放量 17039、弹幕量 3、点赞数 676、投硬币枚数 345、收藏人数 688、转发人数 138, 视频作者小黑黑讲AI, 作者简介我的唯一官网：www.dhcode.cn课程报名和咨询请找：xheiai，相关视频：什么是 EM 算法（最大期望算法）？【知多少】，[5分钟学算法] #06 EM算法你到底是哪个班级的，【EM算法】第十二讲：高斯混合模型简介，通俗易懂讲算法-EM(期望最大化)，机器学习-白板推导系列(十)-EM算法（Expectation Maximization），EM算法期望最大化算法，最大化期望算法 Expectation-Maximization algorithm（30/100），《统计学习方法》EM算法+GMM+代码，EM算法实例讲解，【EM算法】第十三讲：高斯混合模型的E步https://www.bilibili.com/video/BV1pQ4y1s7oG?vd_source=0fc465b08fbccae7fe0d0aa20b5604a9

测试题

朴素贝叶斯分类器采用了_属性条件独立性______________________假设。
给定贝叶斯公式 P(cj|x) =（P(x|cj)P(cj)）/P(x)，公式中P( cj|x)为（ A ）

A、先验概率 B后验概率 C全概率 D联合概率

贝叶斯分类器属于__生成式模型____________，支持向量机属于判别式模型。
半朴素贝叶斯分类器的基本想法是适当考虑___属性之间的依赖关系________________________，从而既不需要进行完全联合概率计算，又不至于彻底忽略了比较强的属性依赖关系。
EM算法提供一种近似计算______含有隐变量概率模型________________的极大似然估计的方法。
EM算法时常用的估计参数隐变量的方法，是一种迭代式的方法，能收敛到____局部最优解__________。
在朴素贝叶斯分类器的训练过程中，为了避免其他属性携带的信息被训练集中未出现的属性值抹“抹去”，在估计概率值时通常要进行“平滑”，常用___拉普拉斯修正（Laplace平滑）_______________。
在朴素贝叶斯分类器的训练过程中，拉普拉斯修正避免了__零概率以及属性值未出现的数量过于小_____________的问题。
简述EM（Expectation-Maximization）算法的用途及其基本思想。

答：EM算法的用途是用于参数估计，基本思想是通过两个步骤：E步和M步来进行计算，E步计算隐变量的期望，M步极大化似然函数来估计模型参数，直至收敛或达到预设迭代次数。

请用表4.1西瓜数据集2.0训练一个朴素贝叶斯分类器，试估计先验概率和前两个属性的条件概率；如果给定测试样本x（浅白，蜷缩，清脆，清晰，平坦，硬滑），写出后验概率公式。

答：根据表4.1中的数据，浅白和蜷缩属性的先验概率分别为5/17和8/17

对于色泽和根蒂属性，可以计算出每个属性下各个取值的条件概率，

色泽：青绿 3/5 乌黑 2/5 浅白 0/5

根蒂：蜷缩 6/8 稍蜷 2/8 硬挺 0/8

P(cj|x) = P(浅白|cj)P(蜷缩|cj)P(清脆|cj)P(清晰|cj)P(平坦|cj)P(硬滑|cj)P(cj) / P(x)

其中cj为类别，P(cj)为先验概率，P(属性|cj)为条件概率。

脑启社区是一个专注类脑智能领域的开发者社区。欢迎加入社区，共建类脑智能生态。社区为开发者提供了丰富的开源类脑工具软件、类脑算法模型及数据集、类脑知识库、类脑技术培训课程以及类脑应用案例等资源。

更多推荐

cover

快讯｜复旦发布全球首篇WAM系统性综述366篇论文绘制技术版图，飞捷科思自研可微分物理引擎Fysics指标超8B模型，维泛智能类脑芯片BiGPU融合ANN与SNN，Sim2Real实证：空间特征泛化远

cover

突破 Transformer 极限：一文看懂类脑架构 MT-LNN 最新的“超神”评测结果！

人工智能导论：模型与算法（未来发展与趋势）

人工智能作为引领新一轮科技革命和产业变革的战略性技术，正在深刻改变人类社会。本章从类脑计算、自动化机器学习、神经网络压缩、人工智能芯片、量子机器学习、人工智能伦理与治理、人工智能算法开发框架等方面，简要总结人工智能的未来发展方向和趋势。

所有评论(0)

查看更多评论

F112514yu

已为社区贡献2条内容