Click Start!

发表于2025-04-20

也许仅仅是这样的一个开始，就改变了人生 🎉初次见面创建网站之初，就是为了记录自己的学习过程以及记录我自己的学习历程和一些心得也许其中的某一篇文章能够切切实实帮到你，我会感到开心 ✅目前已经完成的学习计划学习C++语言 (2024.11.17-2024.11.25) 学习git的基本用法与扩展 (2024.11.26-2024.11.27) 学习Cmake的基本知识和用法 (2024.11.27-2024.11.28) 学习OpenCV 学习ing (2024.12.1-2024.12.31) 学习Python (2025.3.14-2025.3.31) 学习算法数据与结构 🪄个人正在准备的赛事 Robomaster 腾讯开悟人工智能大赛大学生创新创业大赛 ✨目前的学习重心视觉算法开源深度学习入门 🪄个人的长期学习计划学习...

第1章：绪论 — 西瓜书学习笔记

发表于2026-05-28|机器学习

本文是周志华《机器学习》（西瓜书）第1章绪论（Introduction）的学习笔记，涵盖本章所有核心知识点，配有通俗类比与公式推导。 1引言与基本术语机器学习致力于研究如何通过计算手段，利用经验来改善系统自身的性能。核心术语速查西瓜书用语英文含义（用西瓜举例）数据集 data set 一筐西瓜的记录集合样本 / 示例 sample / instance 一个具体的西瓜属性 / 特征 attribute / feature 色泽、根蒂、敲声…… 属性值 attribute value 青绿、蜷缩、浊响…… 属性空间 / 样本空间 attribute space 所有色泽×根蒂×敲声组合张成的 3 维空间标记 / 标签 label “好瓜”/“坏瓜” 样例 example 样本 + 标记（一个有标签的西瓜记录）三类学习任务监督学习有标记（分类/回归）给出标准答案无监督学习无标记（聚类/降维）没有标准答案半监督学习少量有标记有部分提...

第3章：线性模型 — 西瓜书学习笔记

发表于2026-05-28|机器学习

本文是周志华《机器学习》（西瓜书）第3章线性模型（Linear Models）的学习笔记，涵盖本章所有核心知识点，配有通俗类比与公式推导。 1基本形式线性模型试图学得一个通过属性的线性组合来进行预测的函数： 📐 公式 f(x)=w1x1+w2x2+⋯+wdxd+b=w⊤x+b f(\boldsymbol{x}) = w_1 x_1 + w_2 x_2 + \cdots + w_d x_d + b = \boldsymbol{w}^\top \boldsymbol{x} + b f(x)=w1x1+w2x2+⋯+wdxd+b=w⊤x+b 其中 w=(w1,…,wd)\boldsymbol{w} = (w_1,\dots,w_d)w=(w1,…,wd) 是权重向量，bbb 是偏置（bias），x\boldsymbol{x}x 是 ddd 维样本向量。 📌 核心定义核心思想：用一条直线（二维）、一个平面（三维）、一个超平面（高维）去拟合数据。简单、可解释性强 —— 每个 wiw_iwi 直接反映了对应属性 xix_ixi 对预测结果的影响大小和...

第4章：决策树 — 西瓜书学习笔记

发表于2026-05-28|机器学习

本文是周志华《机器学习》（西瓜书）第4章决策树（Decision Trees）的学习笔记，涵盖本章所有核心知识点，配有通俗类比与公式推导。 1基本流程决策树是一棵用于分类的树形结构：内部节点对应属性测试，分支对应该属性的可能取值，叶子节点给出分类结果。算法：TreeGenerate(D) 生成节点 node if D 中样本全属于同一类别 C：将 node 标记为 C 类叶节点；return if A = ∅ OR D 中样本在 A 上取值相同：将 node 标记为 D 中样本数最多的类；return 从 A 中选最优划分属性 a* for a* 的每个取值 a_v：为 node 生成一个分支；令 D_v 为在 a* 上取值为 a_v 的样本子集 if D_v = ∅：将分支节点标记为 D 中样本数最多的类 else：以 TreeGenerate(D_v, A \ {a*}) 为分支节点 🍉 通俗类比决策树就像你玩**”是谁杀了小明”**的推理游戏。每个问题（节点）都是一个关于嫌疑人的属性测试：ta是男是女？有没有不在场证明？案发时在不...

第2章：模型评估与选择 — 西瓜书学习笔记

发表于2026-05-28|机器学习

本文是周志华《机器学习》（西瓜书）第2章模型评估与选择（Evaluation & Selection）的学习笔记，涵盖本章所有核心知识点，配有通俗类比与公式推导。 1经验误差与过拟合基础概念术语定义备注错误率 E=a/mE = a/mE=a/m（错分样本数/总样本数）精度 1−E1 - E1−E 正确率训练误差（经验误差）学习器在训练集上的误差不是泛化能力的真实反映泛化误差学习器在新样本上的误差我们真正关心但无法直接计算的过拟合 vs 欠拟合欠拟合模型太简单训练误差大 + 泛化误差大刚刚好训练误差小泛化误差小过拟合模型太复杂训练误差小 + 泛化误差大 🍉 通俗类比欠拟合 = 小学生用”所有人均分”来预测考试成绩；过拟合 = 把”张三那天吃了韭菜饺子所以考砸了”也当成规律。机器学习最难的挑战就是找到那个”刚刚好”的中间地带。 📌 核心定义过拟合是机器学习面临的关键障碍——无法彻底避免，只能缓解。NP 难问题（如 P ≠ NP），过拟合不可能完全消...

第5章：神经网络 — 西瓜书学习笔记

发表于2026-05-28|机器学习

本文是周志华《机器学习》（西瓜书）第5章神经网络（Neural Networks）的学习笔记，涵盖本章所有核心知识点，配有通俗类比与公式推导。 1神经元模型M-P 神经元神经网络的基本单元模拟了生物神经元：接收多个输入信号，加权求和，经激活函数后输出。 📐 公式 y=f(∑i=1nwixi−θ) y = f\left(\sum_{i=1}^n w_i x_i - \theta\right) y=f(i=1∑nwixi−θ) 其中 f(⋅)f(\cdot)f(⋅) 为激活函数，θ\thetaθ 为偏置阈值。常用激活函数函数表达式特点 Sigmoid σ(x)=11+e−x\sigma(x)=\frac{1}{1+e^{-x} }σ(x)=1+e−x1 输出 (0,1)，梯度饱和问题 Tanh tanh⁡(x)\tanh(x)tanh(x) 输出 (-1,1)，零中心，仍有饱和 ReLU max⁡(0,x)\max(0,x)max(0,x) 缓解梯度消失，计算简单，但”死神经元”问题 LeakyReLU max⁡(αx,x)\ma...

第7章：贝叶斯分类器 — 西瓜书学习笔记

发表于2026-05-28|机器学习

本文是周志华《机器学习》（西瓜书）第7章贝叶斯分类器（Bayesian）的学习笔记，涵盖本章所有核心知识点，配有通俗类比与公式推导。 1贝叶斯决策论贝叶斯决策论是概率框架下实施决策的基本方法。对于分类任务，在所有相关概率已知的理想情况下，最优分类器由贝叶斯公式给出： 📐 公式 P(c∣x)=P(x∣c)P(c)P(x) P(c \mid \boldsymbol{x}) = \frac{P(\boldsymbol{x} \mid c) P(c)}{P(\boldsymbol{x})} P(c∣x)=P(x)P(x∣c)P(c) P(c)P(c)P(c)：**先验概率**（在不知道样本长相的时候，猜它是 ccc 类的概率） P(x∣c)P(\boldsymbol{x}|c)P(x∣c)：**类条件概率**（也叫"似然"，已知是 ccc 类，样本长 x\boldsymbol{x}x 样的概率） P(c∣x)P(c|\boldsymbol{x})P(c∣x)：**后验概率**（看到样本 x\boldsymbol{x}x 后，它是 ccc 类的更新后的概率）贝叶斯最优...

第8章：集成学习 — 西瓜书学习笔记

发表于2026-05-28|机器学习

本文是周志华《机器学习》（西瓜书）第8章集成学习（Ensemble Learning）的学习笔记，涵盖本章所有核心知识点，配有通俗类比与公式推导。 1个体与集成集成学习通过投票法（分类）或平均法（回归）将多个”基学习器”组合起来。集成有效的必要条件个体学习器要有一定的**”准确性”**（至少比随机猜测好）个体学习器之间要**”多样性”**（犯不同的错误）误差-分歧分解（直观版本）： 📐 公式 E=Eˉ−Aˉ E = \bar{E} - \bar{A} E=Eˉ−Aˉ 其中 EEE 是集成泛化误差，Eˉ\bar{E}Eˉ 是个体泛化误差的加权平均，Aˉ\bar{A}Aˉ 是分歧（个体之间有多不一致）。分歧越大，集成效果越好。学习器1准确率 75% 学习器2准确率 75% 学习器3准确率 75% → 集成后准确率 90%+ 只要错误不重叠，多数投票就能纠错！ 🍉 通俗类比三个独立考官各自有 75% 准确率，但他们犯错的时候不一样。当一个人判断错误，另外两个很可能判断正确，多数投票后错误就被纠正了。这就是”好而不同”的力量。两大范式...

第6章：支持向量机 — 西瓜书学习笔记

发表于2026-05-28|机器学习

本文是周志华《机器学习》（西瓜书）第6章支持向量机（SVM）的学习笔记，涵盖本章所有核心知识点，配有通俗类比与公式推导。 1间隔与支持向量SVM 的目标是找到一个超平面 w⊤x+b=0w^\top x + b = 0w⊤x+b=0，使两类样本到它的最小距离最大化： 📐 公式 max⁡w,b2∥w∥s.t.yi(w⊤xi+b)≥1, i=1,…,m \max_{\boldsymbol{w},b} \frac{2}{\|\boldsymbol{w}\|} \quad \text{s.t.} \quad y_i(\boldsymbol{w}^\top \boldsymbol{x}_i + b) \ge 1,\; i=1,\dots,m w,bmax∥w∥2s.t.yi(w⊤xi+b)≥1,i=1,…,m 等价于最小化 12∥w∥2\frac{1}{2}\|\boldsymbol{w}\|^221∥w∥2。距离超平面最近的几个样本称为支持向量（Support Vectors），它们决定了超平面的位置。 wTx+b=0（决策边界） wTx+b=1 w...

第9章：聚类 — 西瓜书学习笔记

发表于2026-05-28|机器学习

本文是周志华《机器学习》（西瓜书）第9章聚类（Clustering）的学习笔记，涵盖本章所有核心知识点，配有通俗类比与公式推导。 01. 聚类任务概述什么是聚类？它能解决什么问题？ 📌 核心定义聚类（Clustering）是将数据集中的样本划分为若干个不相交的子集，每个子集称为一个簇（Cluster）。聚类的目标是：簇内相似性最大：同一簇内的样本应尽可能彼此相似簇间差异性最大：不同簇的样本应尽可能不同形式化表示：给定样本集 D={x1,x2,…,xm}D = \{x_1, x_2, \ldots, x_m\}D={x1,x2,…,xm}，聚类算法将 DDD 划分为 kkk 个不相交的簇 {Cl∣l=1,2,…,k}\{C_l \mid l = 1, 2, \ldots, k\}{Cl∣l=1,2,…,k}，满足 Ci∩Cj=∅C_i \cap C_j = \emptysetCi∩Cj=∅（i≠ji \neq ji=j）且 ⋃l=1kCl=D\bigcup_{l=1}^k C_l = D⋃l...