向前向后算法forwardbackward algorithmWord文档下载推荐.docx

资源描述

向前向后算法forwardbackward algorithmWord文档下载推荐.docx

《向前向后算法forwardbackward algorithmWord文档下载推荐.docx》由会员分享，可在线阅读，更多相关《向前向后算法forwardbackward algorithmWord文档下载推荐.docx（19页珍藏版）》请在冰豆网上搜索。

向前向后算法forwardbackward algorithmWord文档下载推荐.docx

随机初始化一组参数θ（0），根据后验概率Pr（Y|X;

θ）来更新Y的期望E（Y），然后用E（Y）代替Y求出新的模型参数θ

（1）。

如此迭代直到θ趋于稳定。

在HMM问题中，隐含变量自然就是状态变量，要求状态变量的期望值，其实就是求时刻ti观察到xi时处于状态si的概率，为了求此概率，需要用到向前变量和向后变量。

向前变量

是假定的参数

它表示t时刻满足状态

，且t时刻之前（包括t时刻）满足给定的观测序列

的概率。

1.令初始值

2.归纳法计算

3.最后计算

复杂度

向后变量

它表示在时刻t出现状态

，且t时刻以后的观察序列满足

1.初始值

2.归纳计算

E-Step

定义变量

为t时刻处于状态i，t+1时刻处于状态j的概率。

表示t时刻呈现状态i的概率。

实际上

是从其他所有状态转移到状态i的次数的期望值。

是从状态i转移出去的次数的期望值。

是从状态i转移到状态j的次数的期望值。

M-Step

是在初始时刻出现状态i的频率的期望值，

是从状态i转移到状态j的次数的期望值

除以

从状态i转移出去的次数的期望值，

是在状态j下观察到活动为k的次数的期望值

从其他所有状态转移到状态j的次数的期望值,

然后用新的参数

再来计算向前变量、向后变量、

和

。

如此循环迭代，直到前后两次参数的变化量小于某个值为止。

下面给出我的java代码：

1importjava.io.BufferedReader;

2importjava.io.File;

3importjava.io.FileReader;

4importjava.io.IOException;

5importjava.util.Arrays;

6importjava.util.HashMap;

7importjava.util.LinkedList;

8importjava.util.List;

9importjava.util.Map;

10importjava.util.Map.Entry;

12/**

13*隐马尔可夫模型参数学习。

14*

15*@Author:

zhangchaoyang

16*@Since:

2015年4月4日

17*@Version:

1.0

18*/

19publicclassHmmLearn{

21privateintstateCount;

//状态的个数

22privateMap<

String,Integer>

observeIndexMap=newHashMap<

（）;

//观察值及其索引编号

23/**

24*通过学习得到的模型参数

25*/

26privatedouble[]stateProb;

//初始状态概率矩阵

27privatedouble[][]stateTrans;

//状态转移矩阵

28privatedouble[][]emission;

//混淆矩阵

30privateList<

String>

observeSeqs=newLinkedList<

//训练集中所有的观察序列

32/**

33*迭代终止条件

34*/

35privatefinalintITERATION_MAX=100;

36privatefinaldoubleDELTA_PI=1E-3;

37privatefinaldoubleDELTA_A=1E-2;

38privatefinaldoubleDELTA_B=1E-2;

40/**

41*

42*@paramstateCount

43*指定状态取值有多少种

44*@paramobserveFile

45*存储观察序列的文件，各个观察序列用空白符或换行符隔开即可

46*@throwsIOException

47*/

48publicvoidinitParam（intstateCount,StringobserveFile）

49throwsIOException{

50this.stateCount=stateCount;

51intobserveCount=0;

52BufferedReaderbr=newBufferedReader（newFileReader（newFile（

53observeFile）））;

54Stringline=null;

55while（（line=br.readLine（））!

=null）{

56String[]arr=line.split（"

\\s+"

）;

57for（Stringseq:

arr）{

58if（seq.length（）>

1）{//长度为1的观察序列必须过滤掉，不然在更新stateTrans时会出现NaN的情况

59observeSeqs.add（seq）;

60for（inti=0;

seq.length（）;

i++）{

61Stringobserve=seq.substring（i,i+1）;

62if（!

observeIndexMap.containsKey（observe））{

63observeIndexMap.put（observe,observeCount++）;

64}

65}

66}

67}

68}

69br.close（）;

71stateProb=newdouble[stateCount];

72initWeightRandomly（stateProb,1E5）;

73//initWeightEqually（stateProb）;

74stateTrans=newdouble[stateCount][];

75for（inti=0;

stateCount;

76stateTrans[i]=newdouble[stateCount];

77initWeightRandomly（stateTrans[i],1E5）;

78//initWeightEqually（stateTrans[i]）;

79}

80emission=newdouble[stateCount][];

81for（inti=0;

82emission[i]=newdouble[observeCount];

83initWeightRandomly（emission[i],1E9）;

84//initWeightEqually（emission[i]）;

85}

86}

88/**

89*随机地初始化权重，使得各权重非负，且和为1.

90*

91*@paramarr

92*@paramprecision

93*/

94publicvoidinitWeightRandomly（double[]arr,doubleprecision）{

95intlen=arr.length-1;

96int[]position=newint[len];

97for（inti=0;

len;

98position[i]=（int）（Math.random（）*precision）;

99}

100Arrays.sort（position）;

101intpre=0;

102for（inti=0;

103arr[i]=1.0*（position[i]-pre）/precision;

104pre=position[i];

105}

106arr[len]=1.0*（precision-pre）/precision;

107}

108

109/**

110*均等地初始化权重，使得各权重非负，且和为1.

111*

112*@paramarr

113*/

114publicvoidinitWeightEqually（double[]arr）{

115intlen=arr.length;

116for（inti=0;

117arr[i]=1.0/len;

118}

119}

120

121/**

122*BaumWelch算法学习HMM的模型参数

123*/

124publicvoidbaumWelch（）{

125longbegin=System.currentTimeMillis（）;

126intiter=0;

127while（iter++<

ITERATION_MAX）{

128double[]stateProb_new=newdouble[stateCount];

129double[][]stateTrans_new=newdouble[stateCount][];

130double[][]emission_new=newdouble[stateCount][];

131for（inti=0;

132

展开阅读全文