机器学习期末考试基础复习

混淆矩阵(Confusion Matrix)是机器学习中用于评估分类模型性能的重要工具，它以一种清晰直观的方式展示了模型预测结果与实际结果的对比情况。TP（真正例）：模型预测为正，实际也为正（模型预测正确）FP（假正例）：模型预测为正，但实际为负（模型预测错误，误报）FN（假负例）：模型预测为负，但实际为正（模型预测错误，漏报）TN（真负例）：模型预测为负，实际也为

脑子不好真君

1472人浏览 · 2025-06-01 20:55:32

脑子不好真君 · 2025-06-01 20:55:32 发布

③提示词工程（Prompt Design）

一、混淆矩阵

(1)、基本概念

混淆矩阵(Confusion Matrix)是机器学习中用于评估分类模型性能的重要工具，它以一种清晰直观的方式展示了模型预测结果与实际结果的对比情况。

(2)、矩阵结构

实际 \ 预测	预测为正	预测为负
实际为正	TP	FN
实际为负	FP	TN

TP（真正例）：模型预测为正，实际也为正（模型预测正确）
FP（假正例）：模型预测为正，但实际为负（模型预测错误，误报）
FN（假负例）：模型预测为负，但实际为正（模型预测错误，漏报）
TN（真负例）：模型预测为负，实际也为负（模型预测正确）

(3)、关键衍生指标

(4)、关于精确率和召回率的应用场景

1.精确率（Precision）

核心目标：最小化误报（FP），即“宁可漏掉一千，绝不错杀一个”。
记忆方法：比如垃圾邮件检测，模型预测为正例(是垃圾邮件)，但实际上不是垃圾邮件，即预测错误，为了不让用户错过重要邮件，即使模型预测为垃圾邮件，也要给用户看。

2.召回率（Recall）

核心目标：最小化漏报（FN），即“宁可错杀一千，绝不漏掉一个”。
记忆方法：比如疾病检测，模型预测为负例(患者没病)，但实际上患者有病，即预测错误，为了保证患者的健康，即使模型预测为无病，也要去看医生。

(5)、例1

问题描述

解题步骤

①构建混淆矩阵

②计算关键指标

二、朴素贝叶斯

(1)、基本概念

朴素贝叶斯是一种基于贝叶斯定理的分类算法。之所以叫“朴素”，是因为它假设特征之间相互独立（即：特征条件独立性假设）。

(2)、核心公式

(3)、朴素独立性假设

(4)、例1

题目描述

解题步骤

①先验概率计算 P(Y)

②计算条件概率

③代入公式计算后验概率

④比较大小判断结果

三、基尼指数

(1)、基本概念

基尼指数（Gini Index）：是用来衡量一个集合中数据的“纯度”或“不确定性”的指标。
简单理解：
基尼指数越小，集合越纯净（越倾向于属于同一个类别）
基尼指数越大，集合越混乱（不同类别样本混杂在一起）

(2)、公式

(3)、作用

(4)、例1

题目描述

请对属性“年龄=青年”进行划分的基尼指数计算

样本ID	年龄	有工作	有房子	信用	类别
0	青年	否	否	一般	否
1	青年	否	否	好	否
2	青年	是	否	好	否
3	青年	是	是	一般	是
4	青年	否	否	一般	否
5	中年	否	否	一般	否
6	中年	否	否	好	否
7	中年	是	是	好	是
8	中年	否	是	非常好	是
9	中年	否	是	非常好	是
10	老年	否	是	非常好	是
11	老年	否	是	好	是
12	老年	是	否	好	是
13	老年	是	否	非常好	是
14	老年	否	否	一般	否

解题步骤

①取出年龄=青年的样本

②取出年龄 ≠ 青年（即中年+老年）的样本

③整体加权基尼指数

(5)、例2

题目描述

(1)以年龄A1作为划分特征
(2)以信誉贷款A2作为划分特征

ID	年龄	有工作	有自己的房子	信贷情况	类别
1	青年	否	否	一般	否
2	青年	否	否	好	否
3	青年	是	否	好	是
4	青年	是	是	一般	是
5	青年	否	否	一般	否
6	中年	否	否	一般	否
7	中年	否	否	好	否
8	中年	是	是	好	是
9	中年	否	是	非常好	是
10	中年	否	是	非常好	是
11	老年	否	是	非常好	是
12	老年	否	是	好	是
13	老年	是	否	好	是
14	老年	是	否	非常好	是
15	老年	否	否	一般	否

解题步骤

(1)

(2)

四、论述题

题目描述

在这个项目：https://github.com/abi/screenshot-to-code中，请论述机器学习的相关知识，结合你学习的机器学习知识谈一谈。

论述内容

这个"screenshot-to-code"项目是一个将设计截图转换为前端代码的工具，它巧妙地运用了多种机器学习技术。下面我将结合机器学习知识分析这个项目的工作原理和相关技术。

①计算机视觉与图像理解

核心任务：将像素级输入转换为结构化UI元素描述
关键技术：
(1)目标检测与分割
使用CNN或Vision Transformer识别截图中的UI组件（按钮、输入框、导航栏等）
示例：通过YOLO或Mask R-CNN标注元素边界框和类别

# 伪代码：基于OpenCV的组件检测
contours = cv2.findContours(image, mode=cv2.RETR_TREE)
for contour in contours:
    if is_button(contour): 
        add_to_json(type="button", position=contour.boundingRect())

        (2)布局分析
        通过Graph Neural Networks (GNN) 构建UI元素的层级关系树
        输出结构示例：

{
  "type": "container",
  "children": [
    {"type": "text", "content": "Login", "font-size": "16px"},
    {"type": "input", "placeholder": "Username"}
  ]
}

(3)视觉到结构的映射
使用对比学习（如CLIP）对齐视觉特征与代码标签（如Tailwind的bg-blue-500）

②大语言模型的应用

模型选择：GPT-4o/Claude 3（多模态LLM）
处理流程：
        (1)多模态输入编码
        图像通过ViT编码为patch embeddings
        文本指令通过tokenizer编码，与图像embeddings拼接

(2)跨模态理解

 (3)代码生成机制
        基于自回归生成（Autoregressive Decoding）逐步输出代码
        关键技巧：
                约束解码：强制生成闭合标签（如</div>）
                温度采样：temperature=0.3平衡创造性与准确性