在前两篇文章中,我们学习了如何从密集层(dense)的堆栈中构建完全连接的网络。首次创建时,网络的所有权重都是随机设置的——网络尚不“知道”任何事情。在本节中,我们将了解如何训练神经网络;我们将看到神经网络是如何学习的。 与所有机器学习任务一样,我们从一组训练数据开始。训练数据中的每个示例都包含一些特征(输入)和一个预期目标(输出)。训练网络意味着以一种可以将特征转换为目标的方式调整其权重。例如,在 80 Cereals 数据集中,我们想要一个网络,它可以获取每种谷物的“糖”、“纤维”和“蛋白质”含量,并预测该谷物的“卡路里”。如果我们能成功地训练一个网络来做到这一点,它的权重必须以某种方式表
分类标签归档:python
深度学习入门二----深度神经网络
在本节中,我们将了解如何构建能够学习复杂关系的神经网络。 这里的关键思想是模块化(modularity),从简单的功能单元构建一个复杂的网络。我们已经看到了线性单元如何计算线性函数——现在我们将看到如何组合和修改这些单个的单元来模拟更复杂的关系。
Layers
神经网络通常将它们的神经元组织成层。当我们将具有一组公共输入的线性单元收集在一起时,我们会得到一个密集层(dense layer)。
你可以将神经网络中的每一层视为执行某种相对简单的变换。通过一层很深的堆栈,神经网络可以以越来越复杂的方式转换其输入。在训练有素的神经网络中,每一层都是一个转换,使我们更接近目标结果。
The Activ
深度学习入门一----一个神经元
What is Deep Learning?
近年来,人工智能领域一些最令人印象深刻的进步是在深度学习领域。自然语言翻译、图像识别等任务,应用深度学习模型已经接近甚至超过人类的水平了。 那么什么是深度学习?深度学习是一种以深度计算为特征的机器学习方法。这种计算深度使深度学习模型能够理清在复杂数据集中发现的各种复杂模式。 通过其强大的功能和可扩展性,神经网络(neural networks)已成为深度学习的基础模型。神经网络由神经元组成,其中每个神经元单独执行一个简单的计算。事实上,神经网络的力量正是来自于这些神经元之间形成的复杂链接。
The Linear Unit
我们从神经网络的基本组成
Python基础
数据类型
字符串(str)
字符串是以单引号'或双引号"括起来的任意文本,比如'abc',"xyz"等等。请注意,''或""本身只是一种表示方式,不是字符串的一部分,因此,字符串'abc'只有a,b,c这3个字符。如果'本身也是一个字符,那就可以用""括起来,比如"I'm OK"包含的字符是I,',m,空格,O,K这6个字符。
如果字符串内部既包含'又包含"怎么办?可以用转义字符\来标识,比如:
'I\'m \"OK\"!'
表示的字符串内容是:
I'm "OK"!
转义字符\可以转义很多字符,比如\n表示换行,\t表示制表符,字符\本身也要转义,所以\表示的字符就是\,可以在Python的交
Python环境安装
引言
因为Python是跨平台的,它可以运行在Windows、Mac和各种Linux/Unix系统上。在Windows上写Python程序,放到Linux上也是能够运行的。
要开始学习Python编程,首先就得把Python安装到你的电脑里。安装后,你会得到Python解释器(就是负责运行Python程序的),一个命令行交互环境,还有一个简单的集成开发环境。
目前,Python有两个版本,一个是2.x版,一个是3.x版,这两个版本是不兼容的。由于3.x版越来越普及,建议使用3.x版
安装
方法一:从Python官网下载Python安装包。
方法二:安装Anaconda (强烈建议该方案) 下载
机器学习笔记——正则化(Regularization)
七、正则化(Regularization)
7.1 过拟合的问题
参考视频: 7 - 1 - The Problem of Overfitting (10 min).mkv
到现在为止,我们已经学习了几种不同的学习算法,包括线性回归和逻辑回归,它们能够有效地解决许多问题,但是当将它们应用到某些特定的机器学习应用时,会遇到过拟合(over-fitting)的问题,可能会导致它们效果很差。
在这段视频中,我将为你解释什么是过度拟合问题,并且在此之后接下来的几个视频中,我们将谈论一种称为正则化(regularization)的技术,它可以改善或者减少过度拟合问题。
如果我们有非常多的特征,我们通过学
机器学习笔记——逻辑回归(Logistic Regression)
六、逻辑回归(Logistic Regression)
6.1 分类问题
参考文档: 6 - 1 - Classification (8 min).mkv
在这个以及接下来的几个视频中,开始介绍分类问题。
在分类问题中,你要预测的变量 $y$ 是离散的值,我们将学习一种叫做逻辑回归 (Logistic Regression) 的算法,这是目前最流行使用最广泛的一种学习算法。
在分类问题中,我们尝试预测的是结果是否属于某一个类(例如正确或错误)。分类问题的例子有:判断一封电子邮件是否是垃圾邮件;判断一次金融交易是否是欺诈;之前我们也谈到了肿瘤分类问题的例子,区别一个肿瘤是恶性的还是良性的。
我
机器学习笔记——多变量线性回归(Linear Regression with Multiple Variables)
四、多变量线性回归(Linear Regression with Multiple Variables)
4.1 多维特征
参考视频: 4 - 1 - Multiple Features (8 min).mkv
目前为止,我们探讨了单变量/特征的回归模型,现在我们对房价模型增加更多的特征,例如房间数楼层等,构成一个含有多个变量的模型,模型中的特征为$\left( {x{1}},{x{2}},...,{x_{n}} \right)$。
增添更多特征后,我们引入一系列新的注释:
$n$ 代表特征的数量
${x^{\left( i \right)}}$代表第 $i$ 个训练实例,是特征矩阵中的第$