区块链技术博客
www.b2bchain.cn

【概率图模型】S08E04 隐马尔科夫模型:明暗两条线求职学习资料

本文介绍了【概率图模型】S08E04 隐马尔科夫模型:明暗两条线求职学习资料,有助于帮助完成毕业设计以及求职,是一篇很好的资料。

对技术面试,学习经验等有一些体会,在此分享。

1.从马尔科夫链到隐马尔科夫模型

在前面几节的内容里,我们详细介绍了马尔科夫链,下面我们接着来说说隐马尔科夫模型,他的英文全称是Hidden Markov Model,也就是我们经常看到的HMM模型。隐马尔科夫模型是一种统计模型,他广泛的应用在语音识别、词性自动标注、概率文法等自然语言处理的各个应用领域。

经过前面的学习,我们对马尔科夫链已经相当熟悉了,这里谈到的隐马尔科夫模型与他在名称上可以说是非常接近。其关键差异就在于一个“隐”字,在这个模型中,他首先由一个隐藏的马尔科夫链随机生成一个状态随机序列,再由状态随机序列中的每一个状态对应生成各自的观测,由这些观测组成一个观测随机序列。因此,隐马尔科夫模型中其实伴随着两条“线”,一个是观测随机序列这条“明线”,另一个是隐藏着的状态随机序列这条“暗线”

2.典型实例:盒子摸球实验

当然,为了更清晰的说明问题,我们举几个生活中实际的例子,作为我们介绍隐马尔科夫模型的引子,让大家更为直观的了解隐马尔科夫模型的组成和要点。

第一个例子是一个耳熟能详的例子:盒子摸球实验。

我们有$3$个盒子,编号分别为$1$号盒子,$2$号盒子,$3$号盒子,每个盒子里都装着个数不等的黑球和白球,具体情况如下面描述所示:

$1$号盒子:黑球$2$个,白球$8$个
$2$号盒子:黑球$6$个,白球$4$个
$3$号盒子:黑球$4$个,白球$6$个

在这个例子中,整个实验的过程是这样的:

每次先随机出现一个盒子,然后我们从随机出现的盒子中随机摸出一个球,并且记录下球的颜色,最后把球放回盒子。下一次再随机出现一个盒子,我们同样的去摸球并记录球的颜色,我们一边梳理这个过程,一边来系统介绍隐马尔科夫模型中的专业术语。

在试验过程中,我们只能在每次摸出球之后看到被摸出的球的颜色,但无法知道每次随机出现的盒子的编号,这是我们要明确的一个大的前提背景。

因此,随着试验的进行,会依次出现不同编号的盒子,这个盒子的序列就是我们的状态序列,由于我们始终无法观测到盒子的编号,因此也就是一条隐藏的暗线,也称隐含状态序列。而由于我们最终能够观察到的是球的颜色,因此球的颜色序列就是我们的观测序列,也就是我们的明线。例如,试验重复进行$7$次,其中一种可能的观测序列为:$O={黑,黑,白,白,白,黑,黑}$。

而在整个过程中,我们假定每次盒子随机出现的过程是一个马尔科夫过程,状态集合为$Q={盒子1,盒子2,盒子3 },N=3$。同时,第一次各个盒子出现所满足的概率分布如下:

$1$号盒子出现的概率:$0.3$
$2$号盒子出现的概率:$0.5$
$3$号盒子出现的概率:$0.2$

我们用$pi$表示初始状态的概率向量:$pi=(0.3,0.5,0.2)^T$,这样我们就拿到了状态的初始概率分布。

同时各个盒子之间相互转换的概率转移图如下图所示:
【概率图模型】S08E04 隐马尔科夫模型:明暗两条线

图1.盒子摸球实验概率转移图

从上面这幅图中,我们可以提炼出三个盒子随机出现的马尔科夫过程状态转移概率矩阵,将其记作是:$A=begin{bmatrix}0.4&0.4&0.2\0.3&0.2&0.5\0.2&0.6&0.2end{bmatrix}$。

结合我们之前介绍过的马尔科夫链的基本知识,对上述矩阵进行解释是一件非常简单的事:如果某一次随机出现的盒子是$2$号盒子,那么下一次随机出现的盒子是$1$号盒子的概率是$0.3$,是$2$号盒子的概率是$0.2$,是$3$号盒子的概率是$0.5$。

那么实验中隐藏的状态序列,也就是三个盒子随机出现的过程我们就讲清楚了,紧接着是从盒子中摸球的过程,比如在$1$号盒子当中:黑球$2$个,白球$8$个,采用的是放回式的摸球试验,这就是最简单的古典概型,因此从$1$号盒子中摸出黑球的概率:$0.2$,摸出白球的概率是$0.8$,也就是所谓的观测概率,也叫输出概率,他是从特定的隐含状态当中生成指定观测的概率。

同样的,我们还可以一起把$2$号盒子和$3$号盒子的观测概率都集中在一起,放在同一个矩阵当中,就得到了另一个重要的矩阵:观测概率矩阵$B=begin{bmatrix}0.2&0.8\0.6&0.4\0.4&0.6end{bmatrix}$。在这其中,观测集合$V={黑球,白球 } ,M=2$。

继续通过这个例子来看,我们重复$7$次上述过程,得到两个序列:

一个是长度为$7$的隐藏状态序列:

$I={2号盒,2号盒,1号盒,3号盒,1号盒,2号盒,3号盒}$,再次强调这个序列是实际存在的,但我们无法直接观测到他。

另一个就是对应的长度为$7$的观测序列:

$O={黑球,黑球,白球,黑球,白球,白球,黑球}$,这个是我们可以直接通过观测得到的。

在这个盒子摸球的实验中,一明一暗两条线的关系如下图所示:
【概率图模型】S08E04 隐马尔科夫模型:明暗两条线

图2.盒子摸球实验中的状态序列和观测序列

这幅图能够很好的说明隐马尔科夫模型当中的两个核心关键词:一个关键词是,指的就是状态序列,也就是盒子序列,他是我们无法观测得知的,是隐含的;另一个关键词是马尔科夫,指的是整个隐含状态序列,隐含状态之间的转换是一个马尔科夫过程,隐含状态之间是有特定的转换概率的。

1.从马尔科夫链到隐马尔科夫模型

在前面几节的内容里,我们详细介绍了马尔科夫链,下面我们接着来说说隐马尔科夫模型,他的英文全称是Hidden Markov Model,也就是我们经常看到的HMM模型。隐马尔科夫模型是一种统计模型,他广泛的应用在语音识别、词性自动标注、概率文法等自然语言处理的各个应用领域。

经过前面的学习,我们对马尔科夫链已经相当熟悉了,这里谈到的隐马尔科夫模型与他在名称上可以说是非常接近。其关键差异就在于一个“隐”字,在这个模型中,他首先由一个隐藏的马尔科夫链随机生成一个状态随机序列,再由状态随机序列中的每一个状态对应生成各自的观测,由这些观测组成一个观测随机序列。因此,隐马尔科夫模型中其实伴随着两条“线”,一个是观测随机序列这条“明线”,另一个是隐藏着的状态随机序列这条“暗线”

2.典型实例:盒子摸球实验

当然,为了更清晰的说明问题,我们举几个生活中实际的例子,作为我们介绍隐马尔科夫模型的引子,让大家更为直观的了解隐马尔科夫模型的组成和要点。

第一个例子是一个耳熟能详的例子:盒子摸球实验。

我们有$3$个盒子,编号分别为$1$号盒子,$2$号盒子,$3$号盒子,每个盒子里都装着个数不等的黑球和白球,具体情况如下面描述所示:

$1$号盒子:黑球$2$个,白球$8$个
$2$号盒子:黑球$6$个,白球$4$个
$3$号盒子:黑球$4$个,白球$6$个

在这个例子中,整个实验的过程是这样的:

每次先随机出现一个盒子,然后我们从随机出现的盒子中随机摸出一个球,并且记录下球的颜色,最后把球放回盒子。下一次再随机出现一个盒子,我们同样的去摸球并记录球的颜色,我们一边梳理这个过程,一边来系统介绍隐马尔科夫模型中的专业术语。

在试验过程中,我们只能在每次摸出球之后看到被摸出的球的颜色,但无法知道每次随机出现的盒子的编号,这是我们要明确的一个大的前提背景。

因此,随着试验的进行,会依次出现不同编号的盒子,这个盒子的序列就是我们的状态序列,由于我们始终无法观测到盒子的编号,因此也就是一条隐藏的暗线,也称隐含状态序列。而由于我们最终能够观察到的是球的颜色,因此球的颜色序列就是我们的观测序列,也就是我们的明线。例如,试验重复进行$7$次,其中一种可能的观测序列为:$O={黑,黑,白,白,白,黑,黑}$。

而在整个过程中,我们假定每次盒子随机出现的过程是一个马尔科夫过程,状态集合为$Q={盒子1,盒子2,盒子3 },N=3$。同时,第一次各个盒子出现所满足的概率分布如下:

$1$号盒子出现的概率:$0.3$
$2$号盒子出现的概率:$0.5$
$3$号盒子出现的概率:$0.2$

我们用$pi$表示初始状态的概率向量:$pi=(0.3,0.5,0.2)^T$,这样我们就拿到了状态的初始概率分布。

同时各个盒子之间相互转换的概率转移图如下图所示:
【概率图模型】S08E04 隐马尔科夫模型:明暗两条线

图1.盒子摸球实验概率转移图

从上面这幅图中,我们可以提炼出三个盒子随机出现的马尔科夫过程状态转移概率矩阵,将其记作是:$A=begin{bmatrix}0.4&0.4&0.2\0.3&0.2&0.5\0.2&0.6&0.2end{bmatrix}$。

结合我们之前介绍过的马尔科夫链的基本知识,对上述矩阵进行解释是一件非常简单的事:如果某一次随机出现的盒子是$2$号盒子,那么下一次随机出现的盒子是$1$号盒子的概率是$0.3$,是$2$号盒子的概率是$0.2$,是$3$号盒子的概率是$0.5$。

那么实验中隐藏的状态序列,也就是三个盒子随机出现的过程我们就讲清楚了,紧接着是从盒子中摸球的过程,比如在$1$号盒子当中:黑球$2$个,白球$8$个,采用的是放回式的摸球试验,这就是最简单的古典概型,因此从$1$号盒子中摸出黑球的概率:$0.2$,摸出白球的概率是$0.8$,也就是所谓的观测概率,也叫输出概率,他是从特定的隐含状态当中生成指定观测的概率。

同样的,我们还可以一起把$2$号盒子和$3$号盒子的观测概率都集中在一起,放在同一个矩阵当中,就得到了另一个重要的矩阵:观测概率矩阵$B=begin{bmatrix}0.2&0.8\0.6&0.4\0.4&0.6end{bmatrix}$。在这其中,观测集合$V={黑球,白球 } ,M=2$。

继续通过这个例子来看,我们重复$7$次上述过程,得到两个序列:

一个是长度为$7$的隐藏状态序列:

$I={2号盒,2号盒,1号盒,3号盒,1号盒,2号盒,3号盒}$,再次强调这个序列是实际存在的,但我们无法直接观测到他。

另一个就是对应的长度为$7$的观测序列:

$O={黑球,黑球,白球,黑球,白球,白球,黑球}$,这个是我们可以直接通过观测得到的。

在这个盒子摸球的实验中,一明一暗两条线的关系如下图所示:
【概率图模型】S08E04 隐马尔科夫模型:明暗两条线

图2.盒子摸球实验中的状态序列和观测序列

这幅图能够很好的说明隐马尔科夫模型当中的两个核心关键词:一个关键词是,指的就是状态序列,也就是盒子序列,他是我们无法观测得知的,是隐含的;另一个关键词是马尔科夫,指的是整个隐含状态序列,隐含状态之间的转换是一个马尔科夫过程,隐含状态之间是有特定的转换概率的。

1.从马尔科夫链到隐马尔科夫模型

在前面几节的内容里,我们详细介绍了马尔科夫链,下面我们接着来说说隐马尔科夫模型,他的英文全称是Hidden Markov Model,也就是我们经常看到的HMM模型。隐马尔科夫模型是一种统计模型,他广泛的应用在语音识别、词性自动标注、概率文法等自然语言处理的各个应用领域。

经过前面的学习,我们对马尔科夫链已经相当熟悉了,这里谈到的隐马尔科夫模型与他在名称上可以说是非常接近。其关键差异就在于一个“隐”字,在这个模型中,他首先由一个隐藏的马尔科夫链随机生成一个状态随机序列,再由状态随机序列中的每一个状态对应生成各自的观测,由这些观测组成一个观测随机序列。因此,隐马尔科夫模型中其实伴随着两条“线”,一个是观测随机序列这条“明线”,另一个是隐藏着的状态随机序列这条“暗线”

2.典型实例:盒子摸球实验

当然,为了更清晰的说明问题,我们举几个生活中实际的例子,作为我们介绍隐马尔科夫模型的引子,让大家更为直观的了解隐马尔科夫模型的组成和要点。

第一个例子是一个耳熟能详的例子:盒子摸球实验。

我们有$3$个盒子,编号分别为$1$号盒子,$2$号盒子,$3$号盒子,每个盒子里都装着个数不等的黑球和白球,具体情况如下面描述所示:

$1$号盒子:黑球$2$个,白球$8$个
$2$号盒子:黑球$6$个,白球$4$个
$3$号盒子:黑球$4$个,白球$6$个

在这个例子中,整个实验的过程是这样的:

每次先随机出现一个盒子,然后我们从随机出现的盒子中随机摸出一个球,并且记录下球的颜色,最后把球放回盒子。下一次再随机出现一个盒子,我们同样的去摸球并记录球的颜色,我们一边梳理这个过程,一边来系统介绍隐马尔科夫模型中的专业术语。

在试验过程中,我们只能在每次摸出球之后看到被摸出的球的颜色,但无法知道每次随机出现的盒子的编号,这是我们要明确的一个大的前提背景。

因此,随着试验的进行,会依次出现不同编号的盒子,这个盒子的序列就是我们的状态序列,由于我们始终无法观测到盒子的编号,因此也就是一条隐藏的暗线,也称隐含状态序列。而由于我们最终能够观察到的是球的颜色,因此球的颜色序列就是我们的观测序列,也就是我们的明线。例如,试验重复进行$7$次,其中一种可能的观测序列为:$O={黑,黑,白,白,白,黑,黑}$。

而在整个过程中,我们假定每次盒子随机出现的过程是一个马尔科夫过程,状态集合为$Q={盒子1,盒子2,盒子3 },N=3$。同时,第一次各个盒子出现所满足的概率分布如下:

$1$号盒子出现的概率:$0.3$
$2$号盒子出现的概率:$0.5$
$3$号盒子出现的概率:$0.2$

我们用$pi$表示初始状态的概率向量:$pi=(0.3,0.5,0.2)^T$,这样我们就拿到了状态的初始概率分布。

同时各个盒子之间相互转换的概率转移图如下图所示:
【概率图模型】S08E04 隐马尔科夫模型:明暗两条线

图1.盒子摸球实验概率转移图

从上面这幅图中,我们可以提炼出三个盒子随机出现的马尔科夫过程状态转移概率矩阵,将其记作是:$A=begin{bmatrix}0.4&0.4&0.2\0.3&0.2&0.5\0.2&0.6&0.2end{bmatrix}$。

结合我们之前介绍过的马尔科夫链的基本知识,对上述矩阵进行解释是一件非常简单的事:如果某一次随机出现的盒子是$2$号盒子,那么下一次随机出现的盒子是$1$号盒子的概率是$0.3$,是$2$号盒子的概率是$0.2$,是$3$号盒子的概率是$0.5$。

那么实验中隐藏的状态序列,也就是三个盒子随机出现的过程我们就讲清楚了,紧接着是从盒子中摸球的过程,比如在$1$号盒子当中:黑球$2$个,白球$8$个,采用的是放回式的摸球试验,这就是最简单的古典概型,因此从$1$号盒子中摸出黑球的概率:$0.2$,摸出白球的概率是$0.8$,也就是所谓的观测概率,也叫输出概率,他是从特定的隐含状态当中生成指定观测的概率。

同样的,我们还可以一起把$2$号盒子和$3$号盒子的观测概率都集中在一起,放在同一个矩阵当中,就得到了另一个重要的矩阵:观测概率矩阵$B=begin{bmatrix}0.2&0.8\0.6&0.4\0.4&0.6end{bmatrix}$。在这其中,观测集合$V={黑球,白球 } ,M=2$。

继续通过这个例子来看,我们重复$7$次上述过程,得到两个序列:

一个是长度为$7$的隐藏状态序列:

$I={2号盒,2号盒,1号盒,3号盒,1号盒,2号盒,3号盒}$,再次强调这个序列是实际存在的,但我们无法直接观测到他。

另一个就是对应的长度为$7$的观测序列:

$O={黑球,黑球,白球,黑球,白球,白球,黑球}$,这个是我们可以直接通过观测得到的。

在这个盒子摸球的实验中,一明一暗两条线的关系如下图所示:
【概率图模型】S08E04 隐马尔科夫模型:明暗两条线

图2.盒子摸球实验中的状态序列和观测序列

这幅图能够很好的说明隐马尔科夫模型当中的两个核心关键词:一个关键词是,指的就是状态序列,也就是盒子序列,他是我们无法观测得知的,是隐含的;另一个关键词是马尔科夫,指的是整个隐含状态序列,隐含状态之间的转换是一个马尔科夫过程,隐含状态之间是有特定的转换概率的。

部分转自互联网,侵权删除联系

赞(0) 打赏
部分文章转自网络,侵权联系删除b2bchain区块链学习技术社区 » 【概率图模型】S08E04 隐马尔科夫模型:明暗两条线求职学习资料
分享到: 更多 (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

b2b链

联系我们联系我们