小昇的博客

学习 生活 分享

深度学习中的优化方法

梯度下降和约束优化

大多数深度学习算法都涉及某种形式的优化。优化指的是改变 $\boldsymbol{x}$ 以最小化或最大化某个函数 $f(\boldsymbol{x})$ 的任务。我们通常以最小化 $f(\boldsymbol{x})$ 指代大多数最优化问题,最大化可经由最小化算法最小化 $−f(\boldsymbol{x})$ 来实现。 我们把要最小化或最大化的函数称为目标函数 (objective f...

概率与信息论基础(下):常用概率分布和信息熵

Bernoulli分布、高斯分布与交叉熵

1. 常用概率分布 许多简单的概率分布在机器学习的众多领域中都是有用的。 1.1 Bernoulli 分布 Bernoulli 分布 (Bernoulli distribution) 是单个二值随机变量的分布。它由单个参数 $\phi ∈ [0, 1]$ 控制,$\phi$ 给出了随机变量等于 $1$ 的概率。它具有如下的一些性质: 1.2 高斯分布 实数上最常用的分布就是正态...

概率与信息论基础(上):基础概念

概率分布、期望与方差

概率论中最基本的概念是随机变量,随机变量 (random variable) 就是可以随机地取不同值的变量。 一个随机变量只是对可能的状态的描述,它必须伴随着一个概率分布来指定每个状态的可能性。随机变量可以是离散的或者连续的。离散随机变量拥有有限或者可数无限多的状态(这些状态不一定是整数,也可能只是一些被命名的没有数值的状态)。连续随机变量伴随着实数值。 我们通常用无格式字体来表示随...

矩阵Capsule与EM路由

使用 GMM 来完成聚类

转载自《三味Capsule:矩阵Capsule与EM路由》,作者:苏剑林 事实上,在论文《Dynamic Routing Between Capsules》发布不久后,一篇新的 Capsule 论文《Matrix Capsules with EM Routing》就已经匿名公开了(在 ICLR 2018 的匿名评审中),而如今作者已经公开,他们是 Geoffrey Hinton, ...

Jupyter Notebook 快速入门

创建漂亮的交互式文档

原文《Getting started with the Jupyter notebook 》,作者:Marin Gilles,译者:Python 翻译组 EarlGrey。 Jupyter Notebook(此前被称为 IPython notebook)是一个交互式笔记本,支持运行 40 多种编程语言。在本文中,我们将介绍 Jupyter notebook 的主要特性,以及为什么...

机器学习基础(五)

监督学习算法和随机梯度下降

本文内容摘取自 《Deep Learning》,部分内容有修改。 1. 监督学习算法 粗略地说,监督学习算法是给定一组输入 $\boldsymbol{x}$ 和输出 $\boldsymbol{y}$ 的训练集,学习如何关联输入和输出。 1.1 概率监督学习 大部分监督学习算法都是基于估计概率分布 $p(y \mid \boldsymbol{x})$ 的,我们可以使用最大似然估...

机器学习基础(四)

最大似然估计和贝叶斯统计

本文内容摘取自 《Deep Learning》,部分内容有修改。 在《机器学习基础(三)》估计一节中我们已经看过常用估计的定义,并分析了它们的性质,但是这些估计是从哪里来的呢?我们希望有些准则可以让我们从不同模型中得到特定函数作为好的估计,而不是猜测某些函数可能是好的估计,然后分析其偏差和方差。 最常用的准则是最大似然估计。 1. 最大似然估计 考虑一组含有 $m$ 个样本的...

从K-Means到Capsule

深入解读动态路由

转载自《再来一顿贺岁宴:从K-Means到Capsule》,作者:苏剑林 在本文中,我们再次对Capsule进行一次分析。 整体上来看,Capsule 算法的细节不是很复杂,对照着它的流程把 Capsule 用框架实现它基本是没问题的。所以,困难的问题是理解 Capsule 究竟做了什么,以及为什么要这样做,尤其是 Dynamic Routing 那几步。 为什么我要反复对 C...

三点钟无眠区块链

人有病,天知否?

转载自《人有病,天知否?》,作者:伯通 最近很多人凌晨三点钟也无法入睡,无论是老VC、新币神、媒体、掮客,甚至是民谣歌手和网文作者们,都在夜以继日地争辩和论证——从宗教、生物、经济、哲学、历史、国学等多个维度分析,区块链技术及其应用品是否会成为未来的创业机遇?怎样才能不错过这一拨? 如果不是其中一分子,目睹这种满面红光的群体式亢奋后,做出某种简明扼要的负面评价是非常容易的。但...

Capsule 胶囊网络入门

用聚类的思想来理解动态路由

转载自《揭开迷雾,来一顿美味的Capsule盛宴》,作者:苏剑林。 由深度学习先驱 Hinton 开源的 Capsule 论文《Dynamic Routing Between Capsules》,无疑是去年深度学习界最热点的消息之一。得益于各种媒体的各种吹捧,Capsule 被冠以了各种神秘的色彩,诸如“抛弃了梯度下降”、“推倒深度学习重来”等字眼层出不穷,但也有人觉得 Capsu...