小昇的博客

学习 生活 分享

儿童节的背后

利迪策惨案

转载自《这两部电影,会告诉你儿童节的血腥背景》,作者:白羊先生 今天是六一国际儿童节,从早上开始,朋友圈里的各路宝宝都在刷着屏。如今的儿童节已经不单单是“儿童”们的节日,而是演变成所有年轻人狂欢的日子。 在平淡的日子里为自己找点乐子,是当今年轻人缓解压力的好方法。但其实,六一国际儿童节的背后,隐藏的是一起血腥恐怖的历史事件。而今天我要为大家介绍的两部电影《类人猿行动》和《利迪策》...

灾后北川残酷一面

汶川大地震最好的记录和纪念

我必须向两位作者致敬,十年后读他们的文字,震撼感仍不减当年。我同时有些伤感,他们所在的那个群星璀璨的新闻团队已经星流云散,他们所在的那个激情燃烧的行业已经面目全非 ——编者 李海鹏 陈江 文 声音在消失 死亡的气味是在5月15日下午开始在北川县城里弥漫开来的。那是一种甜、臭和焦糊的味道。地震在北川为害最烈,由于缺少尸袋,仍有大量遗体被摆放在街道上废墟的空隙间等待处理。废墟...

奶奶走后,家就散了

大家庭的瓦解

转载自网易人间《奶奶走后,家就散了》,作者:陶安明 两年前的 9 月,我刚上大学,那时候爷爷还能勉强扶着墙走路。 我最后一遍检查完行李,爷爷唤我过去,颤颤巍巍地从枕头下拿出一块再眼熟不过的红色小手帕,打开后是一沓钞票——这是他半年来省下的退休费。 “明子,带着,去交学费,路上小心着,别让坏人随了。” 我鼻子泛酸,转过头去,和爷爷告别。关门时始终不敢再回头看一眼,我害怕看见这空...

重点班的女孩,撬开了教务处的大门

中国教育制度

大家暗暗互相较劲,你做一道题,那我一定要比你多做一道才行,几乎每个人都买了课外习题,别人问起时,还会藏着掖着不想告诉对方。 1 我的家乡清城有 3 所高中,二中是重点高中,本科率最高。 二中的 4 个火箭班的学生都是千挑万选:先在进入学校的学生里,以中考成绩前 300 名为基础,划为 6 个重点班,其他 10 个普通班学生再划片招收;每学期期末考试后,滑出前 300 名的重点班...

决策树

信息增益、增益率和基尼指数

1 基本流程 决策树 (decision tree) 是一类常见的机器学习方法,它基于树结构来进行决策。例如,我们要对“这是好瓜吗?”这样的问题进行决策时,通常会进行一系列的判断或“子决策”,如下图所示: 一般的,一棵决策树包含一个根结点、若干个内部结点和若干个叶结点;叶结点对应于决策结果,其他每个结点则对应于一个属性测试;每个结点包含的样本集合根据属性测试的结果被划分到子结点中;根...

无约束优化

梯度下降、牛顿法和拟牛顿法

许多机器学习模型的训练过程就是在求解无约束最优化问题,梯度下降法 (gradient descent)、牛顿法 (Newton method) 和拟牛顿法 (quasi Newton method) 都是求解这类问题的常用方法。其中梯度下降法实现简单,而牛顿法和拟牛顿法收敛速度快。 1. 梯度下降法 假设 $f(\boldsymbol{x})$ 是 $\mathbb{R}^{n}$ 上具...

朴素贝叶斯分类器

假设所有属性相互独立

1. 贝叶斯决策论 1.1 贝叶斯判定准则 假设有 $N$ 种可能的类别标记,即 $\mathcal{Y} = {c_1,c_2,…,c_N}$,$\lambda_{ij}$ 是将一个真实标记为 $c_j$ 的样本误分类为 $c_i$ 所产生的损失。基于后验概率 $P(c_i\mid\boldsymbol{x})$ 可获得将样本 $\boldsymbol{x}$ 分类为 $c_i$ 所产...

深度学习中的优化方法

梯度下降和约束优化

大多数深度学习算法都涉及某种形式的优化。优化指的是改变 $\boldsymbol{x}$ 以最小化或最大化某个函数 $f(\boldsymbol{x})$ 的任务。我们通常以最小化 $f(\boldsymbol{x})$ 指代大多数最优化问题,最大化可经由最小化算法最小化 $−f(\boldsymbol{x})$ 来实现。 我们把要最小化或最大化的函数称为目标函数 (objective f...

概率与信息论基础(下):常用概率分布和信息熵

Bernoulli分布、高斯分布与交叉熵

1. 常用概率分布 许多简单的概率分布在机器学习的众多领域中都是有用的。 1.1 Bernoulli 分布 Bernoulli 分布 (Bernoulli distribution) 是单个二值随机变量的分布。它由单个参数 $\phi ∈ [0, 1]$ 控制,$\phi$ 给出了随机变量等于 $1$ 的概率。它具有如下的一些性质: 1.2 高斯分布 实数上最常用的分布就是正态...

概率与信息论基础(上):基础概念

概率分布、期望与方差

概率论中最基本的概念是随机变量,随机变量 (random variable) 就是可以随机地取不同值的变量。 一个随机变量只是对可能的状态的描述,它必须伴随着一个概率分布来指定每个状态的可能性。随机变量可以是离散的或者连续的。离散随机变量拥有有限或者可数无限多的状态(这些状态不一定是整数,也可能只是一些被命名的没有数值的状态)。连续随机变量伴随着实数值。 我们通常用无格式字体来表示随...