Click Start!

发表于2026-05-28|机器学习

本文是周志华《机器学习》（西瓜书）第13章半监督学习（Semi-Supervised）的学习笔记，涵盖本章所有核心知识点，配有通俗类比与公式推导。 ①. 问题概述与基本假设为什么半监督学习有效？三大核心假设 🎓 生活类比：考前临时抱佛脚期末复习只有 10 道有答案的例题（标注数据），但你手里有 1000 份历年试卷但没有答案（无标签数据）。半监督学习就是：虽然不知道 1000 份的答案，但通过观察这些题目的规律和分布——“这类题总是一起出现”、”这两道题很像”——来辅助你学习那 10 道有答案的题，效果远好于只看 10 道题。 📌 问题设定设有有标记样本集 Dl={(x1,y1),…,(xl,yl)}D_l = \{(\boldsymbol{x}_1, y_1), \ldots, (\boldsymbol{x}_l, y_l)\}Dl={(x1,y1),…,(xl,yl)}，以及无标记样本集 Du={xl+1,…,xl+u}D_u = \{\boldsymbol{x}_{l+1}, \ldots, \boldsymbol{x}_{l+u}\}Du={...

第14章：概率图模型 — 西瓜书学习笔记

发表于2026-05-28|机器学习

本文是周志华《机器学习》（西瓜书）第14章概率图模型（Probabilistic Graphical）的学习笔记，涵盖本章所有核心知识点，配有通俗类比与公式推导。 ①. 基本概念与模型分类有向图 vs. 无向图，概率图的两种范式 🗺️ 生活类比：家族族谱 vs. 朋友圈 **有向图（贝叶斯网络）**像家族族谱——你从父母到子女有明确的方向。”基因”沿有向边传递，父子关系带来因果依赖。**无向图（马尔可夫随机场）**像朋友圈——朋友之间没有方向，你们相互影响。”状态”通过无向连接相互约束。 📐 概率图模型 = 图结构 + 概率分布一个概率图模型就是用图 G=(V,E)\mathcal{G}=(\mathcal{V},\mathcal{E})G=(V,E) 描述随机变量集合 X={X1,…,Xn}\boldsymbol{X}=\{X_1,\ldots,X_n\}X={X1,…,Xn} 之间的依赖关系，用一套参数 Θ\boldsymbol{\Theta}Θ 来量化这些关系。有向图（贝叶斯网络） A B C D 父→子局部条件概率表（CPT）...

第15章：规则学习 — 西瓜书学习笔记

发表于2026-05-28|机器学习

本文是周志华《机器学习》（西瓜书）第15章规则学习（Rule Learning）的学习笔记，涵盖本章所有核心知识点，配有通俗类比与公式推导。 ①. 基本概念与”规则”的形式命题规则 vs. 一阶规则，规则集与规则列表 📋 生活类比：医学诊断手册医生看病的经验，最自然的表达就是”规则”——“如果发烧+咳嗽+白细胞升高，则很可能是细菌感染”。一条规则覆盖一类病例，不需要算概率，不需要调参数，看一眼就懂。规则学习的目标就是从数据中自动挖掘这样的诊断规则。 📜 规则的基本形式规则的一般形式为： 📐 命题规则（Propositional Rule） IF (f1∈V1)∧(f2∈V2)∧⋯∧(fk∈Vk) THEN c \textbf{IF}\;(f_1 \in V_1) \land (f_2 \in V_2) \land \cdots \land (f_k \in V_k)\;\textbf{THEN}\; c IF(f1∈V1)∧(f2∈V2)∧⋯∧(fk∈Vk)THENc 规则体（body）是属性-值检验的合取，头部（head）是一个类别标...

第16章：强化学习 — 西瓜书学习笔记

发表于2026-05-28|机器学习

本文是周志华《机器学习》（西瓜书）第16章强化学习（Reinforcement Learning）的学习笔记，涵盖本章所有核心知识点，配有通俗类比与公式推导。 ①. 任务与框架：MDP马尔可夫决策过程：状态、动作、奖励、转移 🐕 生活类比：训狗学把戏你不直接告诉狗狗”坐下”的精确肌肉指令，你只在它做对时给一根骨头（奖励），做错时不给。狗狗试了无数次后才隐约明白”哪种行为更容易拿到骨头”。它不知道全局最优策略是什么，只能在试错中逐渐逼近。 🎮 MDP 四要素智能体 (Agent) 策略 π 环境 (Environment) 动态 P,R 动作 a_t 新状态 s_{t+1} + 奖励 r_t 要素符号含义状态空间 S\mathcal{S}S 所有可能的环境状态动作空间 A\mathcal{A}A 智能体可执行的动作状态转移概率 P(s′∣s,a)P(s'|s,a)P(s′∣s,a) 在状态 sss 执行 aaa 后转移到 s′s's′ 的概率奖励函数 R(s,a)R(s,a)R(s...

第10章：降维与度量学习 — 西瓜书学习笔记

发表于2026-05-27|机器学习

本文是周志华《机器学习》（西瓜书）第10章降维与度量学习（Dimensionality Reduction）的学习笔记，涵盖本章所有核心知识点，配有通俗类比与公式推导。 01. k 近邻学习（kNN）最简单的”懒惰学习”算法 🔢 核心思想 **k近邻学习（k-Nearest Neighbor，kNN）是一种懒惰学习（lazy learning）**算法——它不构建显式的模型，而是在预测时直接找到训练集中最近的 kkk 个样本，用它们的标记来决策。 🍎 通俗理解你搬到一个新城市，不知道周围的餐厅好不好吃。怎么判断？看最近的几家邻居餐厅的口碑——大家都说好，这家大概也不错。这就是 kNN 的逻辑：我不认识你，但我知道你的邻居，通过邻居来判断你。 📐 kNN 分类规则给定测试样本 xxx，找其最近的 kkk 个训练样本构成集合 Nk(x)N_k(x)Nk(x)，通过投票决定类别： y^=arg⁡max⁡c∈Y∑xi∈Nk(x)1(yi=c) \hat{y} = \underset{c \in \mathcal{Y} }{\arg\max} \sum_{x_i ...

第11章：特征选择与稀疏学习 — 西瓜书学习笔记

发表于2026-05-27|机器学习

本文是周志华《机器学习》（西瓜书）第11章特征选择与稀疏学习（Feature Selection）的学习笔记，涵盖本章所有核心知识点，配有通俗类比与公式推导。 01. 特征选择概述为什么需要选特征？ 🎯 特征选择的目的现实数据集中往往包含成百上千个特征，但并非所有特征都对学习有用。特征可分为三类： ✅ 相关特征对当前学习任务有用的特征，应当保留。 ❌ 无关特征与学习任务无关（不相关特征），应当删除。 ⚠️ 冗余特征包含的信息可由其他特征推出（多余），可以删除但有时有辅助作用。 🍎 通俗理解你要根据一个人的信息预测他的收入：✅ 相关特征：学历、工作年限、所在城市——明显有用❌ 无关特征：鞋码、头发颜色——基本没用⚠️ 冗余特征：月薪和年薪——一个可以由另一个算出来特征选择就是保留相关特征，删除无关和冗余特征，让模型更高效准确。 🔑 特征选择 vs 降维特征选择：从原始特征中挑选出一个子集，特征的含义不变降维（如PCA）：将原始特征变换为新的低维特征（如主成分），失去原始含义两者都能减少特征维度，但特征选择保留了可解释性 🎯 三...

第12章：计算学习理论 — 西瓜书学习笔记

发表于2026-05-27|机器学习

本文是周志华《机器学习》（西瓜书）第12章计算学习理论（Learning Theory）的学习笔记，涵盖本章所有核心知识点，配有通俗类比与公式推导。 01. 基础知识与符号学习理论的基本概念和数学工具 🧮 核心概念 📐 基本设置 X\mathcal{X}X：样本空间，Y\mathcal{Y}Y：标记空间（如 {−1,+1}\{-1,+1\}{−1,+1}） D\mathcal{D}D：X×Y\mathcal{X} \times \mathcal{Y}X×Y 上的未知分布 D={(x1,y1),…,(xm,ym)}D = \{(x_1,y_1),\ldots,(x_m,y_m)\}D={(x1,y1),…,(xm,ym)}：从 D\mathcal{D}D 独立同分布采样的训练集 h:X→Yh: \mathcal{X} \to \mathcal{Y}h:X→Y：假设（即学到的分类器） H\mathcal{H}H：假设空间（所有候选假设的集合） 📐 误差的定义泛化误差（真实误差）： E(h;D)=P(x,y)∼D[h(x)≠y]E(h;\mathca...

电控组考核

发表于2025-09-19|RMer

题目一选择题1.若用数组名作为函数调用的实参，传递给形参的是( )A.数组的首地址B.数组第一个元素的值C.数组中全部元素的值D.数组元素的个数 2.使用值传递方式将实参传给形参，下列说法正确的是( )A.形参是实参的备份B.实参是形参的备份C.形参和实参是同一对象D.形参和实参无联系 3.以下说法正确的是( )A.下列函数调用语句中含有2个实参:fun((a1,a2),(a3,a4,a5));B.在函数中未指定存储类别的变量，其隐含的存储类别是void类型C.若调用一个函数，且此函数中没有return语句，则该函数没有返回值D.全局变量的作用域一定比局部变量的作用域范围大 4.以下说法错误的是( )A.continue语句只能用于循环语句中B.在分支结构switch中，case后面跟的一定是常量C.在不同函数中可以使用相同名字的变量D.int num[3]={1,2,3},使用num++来让数组下标后移 5.char ch[]="abcd"在内存中所占的字节数是()A.4B.5C.8D.10 6.该程序段输出结果为() 12int matrix...

生产者与消费者模型

发表于2025-06-16|RMer算法必备知识

多线程编程的一个经典模型一、生产者与消费者模型生产者与消费者模型（Producer - Consumer Model）是一种经典的多线程同步问题模型，用于描述生产者和消费者之间对共享资源（如缓冲区）的交互过程。它在计算机科学中被广泛应用于解决多线程编程中的线程同步、资源竞争和数据共享等问题。（一）模型的基本组成生产者（Producer）生产者的作用是生成数据并将其放入共享缓冲区。生产者不断地生产数据，例如在实际应用场景中，它可以是一个数据采集线程，从传感器采集数据后放入缓冲区。消费者（Consumer）消费者从共享缓冲区中取出数据并进行处理。消费者不断地消费数据，比如一个数据分析线程从缓冲区取出数据进行分析处理。共享缓冲区（Shared Buffer）这是生产者和消费者之间共享的资源。它可以是一个队列、数组或其他数据结构。缓冲区的大小是有限的，它存储着生产者生产的、尚未被消费者消费的数据。（二）模型的核心问题同步问题生产者和消费者需要协调工作。如果缓冲区满了，生产者不能继续生产，否则会导致数据丢失或覆盖；如果缓冲区空了，消费者不能继续消...

感知机

发表于2025-06-06|人工智能

简单介绍一下感知机 1.1 感知机的概念1.1.1 什么是感知机？**感知机（Perceptron）**是Frank Rosenblatt在1957年提出的一种人工神经网络模型，是最简单的前馈神经网络，也是二元线性分类器的基础。它被视为单层神经网络的雏形，为后续更复杂的模型（如多层感知机、支持向量机等）奠定了基础。 1.1.2 特点优点: 它能够接受多个信号，输出一个信号。简单、计算高效。可处理线性可分问题（如与门、非与门、或门）。局限性：无法解决非线性可分问题（如异或门），这一缺陷导致了神经网络的第一次低谷，直到多层感知机（MLP）和非线性激活函数的引入。对噪声和异常值敏感。 1.1.3 基本原理感知机模拟生物神经元的工作方式：输入：接收多个特征信号（(x_1, x_2, …, x_n)）。加权求和：对输入信号赋予权重（(w_1, w_2, …, w_n)），计算加权和 (z = \sum_{i=1}^n w_i x_i + b)（(b)为偏置项）。节点计算传送过来的信号的总和，只有当这个总和超过某个阈值时才会输出1。权重越大，对应该权重的...