Sorry, your browser cannot access this site
This page requires browser support (enable) JavaScript
Learn more >

统计学习方法决策树简介决策树由结点和有向边组成,最末端的叶结点表示一个类 非末端的结点就是一个决策点,类似于switch case语句,经过该决策点后数据就做了一次划分。整棵树,就是一些case语句的合体 我们要通过一些数据,学出一颗棵很聪明的树,能对新来的数据进行分类,企图让树拥有决策的智慧 十年树木,百年树人目标:我们需要的是一个与训练数据矛盾较小的树,而不是一个完美划分的树,如果目标是...

统计学习方法MCMCMonte Carlo就是“用随机抽样进行模拟数值计算”,均匀撒点求面积、用样本均值计算总体均值,都算Monte Carlo方法,毕竟,Monte Carlo是赌城的名字而非科学家的名字 注意:此处需要概率分布是已知的!你的目标就是求某一概率密度分布$p(x)$下的某个统计量,当然需要事先知道该概率分布$p(x)$ 一个潜在的问题是,你想用“样本”去近似算统计值(依靠大数...

Complex Analysis基本概念Holomorphic如果$f(z)$在开集$U$中固定每一个点都可微,则称$f$在$U$上是全纯的(holomorphic) 保角性质(conformal): 如果$f’(z_0)\neq 0$,那么曲线$\gamma,\eta$在$z_0$点的夹角和$f \circ \gamma$与$f\circ \eta$在$f(z_0)$的夹角是一样的 积分...

统计学习方法PCA声明:以下默认“主成分”均指总体主成分,而不是样本主成分 你是什么成分?统计学中,处理的都是一堆随机变量,要从这些随机的东西中看出点什么,就是要把杂乱的关系“解耦”清楚。就像物理中的复杂的多粒子体系,如何处理比较好呢?方法是把它们解耦为好几个模态,每一个模态都是一个简谐振动,这样就分析出了这个体系的几根骨架。 提取主成分的思想也是一样:对原本互相相关的几个随机变量进行(正交...

8051单片机

数字电路基础

统计学习方法熵信息熵定义对于一个随机变量$X$而言,其可能取值为$x_1,x_2,x_n\dots$,其取到的概率分别为$p_1,p_2,\dots p_n$那么定义其熵为(此处的$\log$底数是2):$$H(X):=-\sum_{i=1}^n p_i\log p_i$$其含义是什么呢?把这个随机变量想成一个“数据”序列,例如$x_4 x_8 x_3 x_9 x_5 x...

信号分析连续信号 离散信号 滤波器

本篇开始为物理学服务。以下,“幺正变换”=“等距同构”,“厄密”=“自伴” 有限群(线性)表示基本定义群$G$的矩阵表示,指从$G$到一般线性群$GL_n$的同态。即:把群中每个元素都同态地对应到一个方阵:$g\mapsto D(g)$,这些方阵的集合对矩阵乘法作成一个群$D(G)$,称为$G$的群表示。这些方阵代表一个$n$维线性空间到自己的映射,该$n$维线性空间称为...

注:本篇中的“轨道”名词均指代数中的概念,而非物理概念 Shankar_ch.10P249 direct product的定义就是笛卡尔积(笛卡尔积的对象是两个集合)加一个代数运算 至于为何有(10.1.10),得先在新的直积空间中定义元素的加法运算以及标量乘运算(书中没讲,但如何定义是显然的),然后再推出线性…… 把原来Hilbert空间中的算符提升(promote)到一个更“大”的直积...