-
简述RNN循环神经网络
循环神经网络是一种常用于自然语言处理领域的特别神经网络模型。得益于其环形“记忆”结构,该模型特别适用于处理具有序列特点的信息。本文将讲述循环神经网络的原理、结构、训练方法和伴随而来的梯度消失问题,力求从概念上理解RNN。
-
基于朴素贝叶斯的垃圾邮件判别系统
本文我们使用朴素贝叶斯方法用Python实现一个相对简单的英文垃圾邮件分类判别系统,借助文中提供的小型带标签邮件数据集完成对模型的训练与测试。
-
数据可视化与Z-Test假设检验方法
本文使用Python数学绘图库matplotlib针对“2011年英格兰各地区的人口普查结果”数据集进行可视化探索。依据绘制出的图表设定合理的假设,并采用Z检验方法对假设进行检验论证。
-
Python基础:英文拼写检查器
本文使用Python实现一个简单的英文拼写检查器。 程序主要功能描述如下 从用户输入或指定文件读取文本内容 文本预处理:忽略非英文内容 逐一检查单词拼写(检测单词是否存在于单词库EnglishWords.txt中) 针对…
-
Python解数独
本文分别使用迭代和回溯(递归)两种方式求解任意大小的标准数独问题。 1.迭代:分别考虑行方向、列方向和区块内的限制条件,通过循环迭代的方式缩减每一单元格的可能取值,并积极判断根据现有可能取值是否已经可以确定该单元格的解。…
-
使用Python+OpenCV实现图像的基本运算处理
本文使用使用Python+OpenCV 实现数字图像的基本运算方法和基础的图像处理操作 ,包括:图像的读取、显示、存储;图像的基本运算(图像代数运算、几何运算以及直方图均衡化);补充概念介绍(CCD、CMOS、白平衡)。
-
K-Means K均值聚类算法
k均值聚类将样本集合划分为k个类,每个样本到其所属类的中心的距离最小。 其大致算法流程如下: 随机选择k个样本点作为k个类的初始聚类中心; 将每个样本分配到距离最近的中心的类中; 按照每个类内样本点的均值计算新的中心; …
-
层次聚类算法之聚合聚类
层次聚类是一种无监督学习中的聚类方法,它将样本聚合到层次化的类中。层次聚类又可以分为聚合聚类(自下而上)和分裂聚类(自上而下)两种,本文主要讨论聚合聚类。 聚合聚类开始时将每个样本分到一个类,之后将相距最近的两类合并,重…
-
决策树的CART算法
CART名为分类与回归树,顾名思义生成的决策树既可以用于分类,也可以用于回归,这里主要讨论分类树。 决策树的CART算法大体上的框架与ID3/C4.5相似,最大的区别在于CART生成的是一棵二叉树,而ID3/C4.5的子…
-
决策树的ID3/C4.5算法
决策树是一种树形结构,在分类问题中,表示基于特征对实例进行分类的过程。 经典的决策树生成方法有ID3和C4.5算法,二者的生成过程大致相同,区别仅在于使用的对特征分类能力的评价标准不同。 ID3算法使用信息增益评估特征。…