小昇的博客

学习 生活 分享

使用 Keras 搭建模型识别验证码

通过 Web API 提供识别服务

最近因为项目上的需求,需要开发一个识别 4 位数字字母验证码的接口。想到自己虽然在科研上使用 Keras 已经有很长时间,但从来没有真正地将这些模型运用起来,或者说以 Web API 的形式对外提供过服务。因此借着这次机会,我正好完整地进行了一次从训练模型到最终包装成网络服务的开发。 准备工作 获取标注数据 无论什么类型的任务,只要希望通过机器学习方法来解决,那么必不可少的就是数据,可...

Keras 使用技巧

一个极其友好、极其灵活的高层深度学习 API 封装

本文汇总了苏剑林的《让Keras更酷一些》系列的部分文章,部分内容有删改。 Keras 伴我走来 回想起进入机器学习领域的这两三年来,Keras 是一直陪伴在笔者的身边。要不是当初刚掉进这个坑时碰到了 Keras 这个这么易用的框架,能快速实现我的想法,我也不确定我是否能有毅力坚持下来,毕竟当初是 theano、pylearn、caffe、torch 等的天下,哪怕在今天它们对我...

Seq2Seq 模型入门

NLP 与深度学习结合的经典之作

转载自《玩转Keras之seq2seq自动生成标题》和《seq2seq之双向解码》,作者:苏剑林,部分内容有修改。 所谓 seq2seq,就是指一般的序列到序列的转换任务,比如机器翻译、自动文摘等等,这种任务的特点是输入序列和输出序列是不对齐的,如果对齐的话,那么我们称之为序列标注,这就比 seq2seq 简单很多了。所以尽管序列标注任务也可以理解为序列到序列的转换,但我们在谈到 ...

基于 DGCNN 和概率图的轻量级信息抽取模型

膨胀门卷积神经网络

转载自《基于DGCNN和概率图的轻量级信息抽取模型》,作者:苏剑林,部分内容有删改。 背景:前几个月,百度举办了“2019 语言与智能技术竞赛”,其中有三个赛道,而我对其中的“信息抽取”赛道颇感兴趣,于是报名参加。经过两个多月的煎熬,比赛终于结束,并且最终结果已经公布。笔者从最初的对信息抽取的一无所知,经过这次比赛的学习和研究,最终探索出在监督学习下做信息抽取的一些经验,遂在此与大...

基于CNN的阅读理解式问答模型:DGCNN

膨胀门卷积神经网络

DGCNN 是苏剑林提出的一个基于 CNN 和简单的 Attention 的模型,由于没有用到 RNN 结构,因此速度相当快,而且是专门为 WebQA 式的任务定制的,因此也相当轻量级。 DGCNN (Dilate Gated Convolutional Neural Network) 即“膨胀门卷积神经网络”,它融合了两个比较新的卷积用法:膨胀卷积、门卷积,并增加了一些人工特征和...

Windows 10 系统上的 Python 开发环境配置

使用自带 Linux 子系统进行 Python 开发

前言 在 Linux 环境上进行 Python 开发是很多用户的选择,但在很多情况下我们还是离不开 Windows 系统。因此过去只能通过安装双系统或者虚拟机的方式来完成,但无论哪一种方式都不是很方便。 幸运的是从 Win10 开始,系统已经自带了一个 Linux 子系统 (WSL),并且可以与 Windows 环境无缝连接,这大大简化了在 Windows 上搭建 Linux 开发环境的...

BERT 浅析

快速上手使用 BERT

2018 年 10 月 11 日,Google AI Language 发布了论文《BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding》,其中提出的 BERT 模型在 11 个 NLP 任务上的表现刷新了记录,在自然语言处理学界以及工业界都引起了不小的热议。BERT 的出现,彻底改变...

香港到底赢了什么?

制度维护者问反修例

林郑月娥7月9日在行政会议前会见记者,神色凝重地指出,修例的工作已经“彻底、全面地停止下来”。(路透社) “我们要赢,就一起继续赢下去。要输,我们就要输十年,我们整个公民社会十年永不翻身。”7月1日当晚,占领立法会的示威者摘下口罩的慷慨陈词,令不少市民动容,纷纷呼吁“不笃灰、不割席、不指摘”。然而,这一幕幕在制度维护者看来,却是忧心忡忡,不禁要问:“我们香港到底赢了什么?” 有人会说...

好一个孙宇晨,连巴菲特也不放过

巴菲特首个90后饭友

距离热心企业家10万元奖励见义勇为好市民的戏码上演不过3个月,孙宇晨又上热搜了。 折合成人民币,总价约 3154.03万元,孙宇晨用这些钱买了顿和股神巴菲特的西式午餐。这引起了币圈的集体高潮,并将其称为“old money与new money”的交锋。赞美者称“孙哥牛叉666”,明嘲者觉得其蹭热点的对象只剩特朗普。 除去消息宣布前“干了件大事,三天后宣布”“让子弹飞一会”的两条预热微...

八九春夏,其实发生的是“两场运动”

边缘化的六四论述

对于六四运动的深入理解,需要我们同时跳出这两种叙事:既告别“知识分子中心论”、重视工人和市民的参与,同时承认“民主”的确是工人和市民参与运动的核心诉求。最关键的是,工人与市民所理解的“民主”,和学生、知识分子所拥抱的民主观念有很大不同。 1989年5月18日,工人在北京街道以电单车游行声援天安门广场绝食的学生。摄:Catherine Henriette/AFP/Getty Im...