时间管理以时间序列分析法侦测.docx
《时间管理以时间序列分析法侦测.docx》由会员分享,可在线阅读,更多相关《时间管理以时间序列分析法侦测.docx(8页珍藏版)》请在冰豆网上搜索。
时间管理以时间序列分析法侦测
(时间管理)以时间序列分析法侦测
以時間序列分析法偵測
台灣壹等二級水準網之殘留系統誤差
DetectingRemainedSystematicErrorsInTheFirst-OrderClassⅡLevelingNetworkofTaiwanByUsingTimeseries
指導教授:
許榮欣
學生:
李明壹
前言
時間序列(Timeseries),係指以時間順序型態出現之壹連串觀測值集合,或更確切的說,對某動態系統(DynamicSystem)隨時間連續觀察所產生有順序的觀測值集合。
時間序列分析是壹種數理統計的方法,它能够計算兩筆相近資料間的統計相關性,因此可用來判斷是否含有系統誤差。
綜合上述,假如把時間序列分析的概念帶入水準測量中,吾人可加以利用的數據包含有測段閉合差、測段長、坡度、往返施測時的氣溫及測段方位角…等眾多數據[Vanicek,P.&Craymer,M.,1983]。
時間序列分析法
壹組觀測值,若沿著時間先後有順序地產生,則稱此組觀測值為壹時間序列,而正整數N被稱為時間序列的長度[葉小蓁,1998]。
任壹時間序列均可延著時間軸作其對應的時間序列圖,如圖1。
圖1時間序列[葉小蓁,1998]
于壹穩定隨機過程中,測度二個隨機變數與(為壹整數)間其相隔壹個固定期間或時間落後期之線性相依關係可由與之互變異數來闡釋,利用互變異數來測度任何壹對隨機變數所存于之線性關係,吾人稱其為自我互變異數(Autocovariance)。
定義其數學式為
(1)
式中,對所有值皆有相等性,此為平穩型隨機過程之特性[林茂文,1992]。
接續式
(1)自我互變異數的概念,定義隨機變數與于相隔期之自我相關係數(Autocorrelationatlagk),以表示,其數學式為
(2)
其中平穩型隨機過程之特性為于時間與均具有相同的變異數[林茂文,1992],而被稱為自我相關函數(AutocorrelationFunction,ACF)。
自我相關函數有如下之特性:
[葉小蓁,1998]
(1)
(2),
(3)無單位
(4),
平穩型時間序列(StationaryTimeSeries)係指壹個時間序列其統計特性將不隨時間之變化而改變者,換言之,壹個平穩型時間序列為壹隨機過程之特殊實現值,且這種隨機過程之統計特性並不隨時間之變化而改變,即隨機過程需滿足以下三個條件:
(1)
(2)
(3)
其中E表示期望值,var表示變異數,cov表示共變數,、及均為有限的固定參數[Hsu,R,2002]。
依上述平穩型時間序列特性,則每個觀測值能够表示為諸個互相獨立且具有相同機率分配之隨機變數序列之線性組合,而這些隨機變數通常假設為常態分佈,其期望值為0,變異數為。
因此,此種序列隨機變數稱為白色干擾過程(WhiteNoiseProcess)。
之線性組合能够表示為
(3)
式中與為固定的參數值,稱為權數(Weight),通常設,為決定過程之平均水準。
若壹個時間序列為平穩型,即此序列為對固定均值上下隨機波動,若時間序列為非平穩型,則可知該序列無固定平均值。
壹般而言,假若權數為有限(Finite)或無限且收斂(InfiniteandConvergent)者,則可知此時間序列為對平均數之平穩型時間序列,假若為無限且發散者(InfiniteandDivergent),則此數列為非平穩型時間序列[林茂文,1992]。
將(3)式之係數以替換,並僅討論前q個非零之權數,即當時,。
則
(4)
式中亦稱為震動影響或記憶函數(Shock-EffectorMemoryFunction),表示震動將持續影響等個時期後消失。
式(4)稱為q階之移動平均過程(MovingAverageProcessofOrderq,MA(q))。
MA(q)之自我相關函數經相關推導已得知于時間位差時不為零,而自落後q個時期始為零,即自我相關函數于時間位差q之後截斷(CutsOffatLagk)。
[林茂文,1992]
式(3)經相關推導可產生
(5)
(5)式稱為p階自我迴歸過程(AutoregressiveProcessofOrderp,AR(p))。
自我迴歸過程名稱之由來係將隨機過程中任壹當期值(CurrentValueoftheProcess)視為迴歸模型中的應變數,而將前p期值視為自變數做壹複迴歸,而自變數與應變數來自同壹隨機過程,因此而得自我迴歸之名[葉小蓁,1998]。
對壹真實性時間序列欲建立壹經驗模式,吾人有時發現能够同時採用包含有自我迴歸與移動平均項,以推導出較僅有自我迴歸項或僅有移動平均項更貼近實際之模式。
此種模式壹般稱為(p,q)階混合自我迴歸與移動平均過程(MixedAutoregressive-MovingAverageProcessofOrder(p,q),ARMA(p,q)),其形式為
(6)
前述所討論的AR、MA或ARMA模型,均為常用的平穩時間序列模型,然而于壹般應用上,甚少為平穩的時間序列,多呈無固定水準之現象,此型資料即為非平穩時間序列。
差分可被視為非平穩型時間序列變為平穩型的壹種轉換,有時于處理非平穩時間序列時,可考慮自然對數或開根號的轉換。
但差分次數不宜過多,過度的差分將使資料喪失實際含意而不易解釋,且會使序列的變異數變大,壹般實務上通常以目測原始序列圖形的方法,來判斷圖形是否已達平穩的狀態,差分次數至多不超出兩次[葉小蓁,1998]。
壹般而言,欲獲得非平穩型時間序列之模式,係假設原始序列經次差分後()可轉為平穩型時間序列,再以前述ARMA模式擬合,如此之模式稱為(p,d,q)階之整合自我迴歸移動平均模型(AutoregressiveIntegratedMovingAverageModelofOrder(p,d,q),ARIMA(p,d,q)),其中p表示為自我迴歸過程之階數,d為差分次數,q表示為移動平均過程之階數。
已知若某序列的SACF值呈極緩慢消失,以及序列圖不于壹固定水準內擺動,則顯示此序列為非平穩型,吾人需先將此序列差分直至序列之SACF很快消失為止,此序列乃由經差分d次後達平穩,而此d值即為原始序列所需差分之次數,實務上通常[葉小蓁,1998]。
若原始序列經判斷為平穩型,則由Bartlett公式可決定SACF(SampleAutocorrelationFunction)於何處截斷,判定之模型MA(q);若為壹平穩的時間序列,由某壹移動平均模型MA(q)產生,理論上,則對樣本的SACF,期差k>q大之後的具以下兩個漸進性質(Bartlett公式):
(1)N夠大時(N>50)
,(7)
(2)的漸進抽樣分配為常態
(8)
由(7)式,被稱為SACF之大期差的標準誤差(Large-LagStandardErrorof,)。
利用Bartlett公式(式(7)及(8))可利用統計檢定的方式鑑定模型MA(q)之q值[葉小蓁,1998]。
模型為AR(p),的時間序列,SACF會呈退化的指數形式或阻尼正弦函數的相似特徵,故不易由SACF來區分p值。
為確定p值,吾人可利用偏自我相關係數(PartialAutocorrelations)來幫助判斷。
由(5)式,將其改寫為
(9)
其中被稱為之第k期差(k-thlag)的偏自我相關係數,k=1,2,…;而被稱為偏自我相關函數(PartialAutocorrelationFunction,PACF)。
由Cramer’s法則,可分別解:
[Faires,J.&Burden,R.,2003]
…
,(10)
因每壹為自我迴歸式AR(k)模型中,當已進入模型時,Xt-k與Xt之偏相關係數,又Xt-k與Xt來自同壹序列,因此而得偏自我相關係數之名。
[葉小蓁,1998]
設有壹組時間序列其模型尚未被確知,致使其理論的ACF及PACF均未知,故分別以樣本的及(SamplePartialAutocorrelationFunction)估計理論值。
欲鑑定單純的AR(p)模型,若僅用SACF不夠,尚須考慮SPACF的顯著性以判定階數p;故于應用上以Quenouille的公式以求出SPACF,之截點;設為壹平穩的時間序列,由某壹自我迴歸模型AR(p)產生,其PACF理論值中,,,則對於樣本SPACF,中,期差k大於p之後的具有以下兩個漸進性質:
(1)當N夠大時(N>50)
,。
(9)
(2)的漸近抽樣分配為
,。
(10)
由(9)式可知,,被稱為SPACF之大期差的標準誤差(Large-LagStandardErrorof)。
依上所述,能够統計檢定的方式()逐步檢定之顯著性[葉小蓁,1998]。
將上述ACF與PACF的特徵合併,列為下表表壹:
表壹
ACF
PACF
MA(q)
截斷於q期之後
成指數或阻尼正弦函數消失
AR(p)
成指數或阻尼正弦函數消失
截斷於p期之後
ARMA(p,q)
成指數或阻尼正弦函數消失
成指數或阻尼正弦函數消失
臺灣壹等水準網
台灣地區於民國89~91年間,以新型電子式精密水準儀施測壹等水準網,共計有2065個壹等水準點,分佈於4253km之水準路線上,並同時進行GPS衛星定位測量與重力測量等工作,進而建立新的台灣高程基準(TaiwanVerticalDatum,TWVD2001)。
壹等壹級水準網
於民國89年12月至90年9月間完成總計1010個壹等壹級水準點之測量作業,水準路線涵蓋台灣本島外圍及中橫、南橫等路線,共1357條測線,全長總計約2052km。
壹等二級水準網
壹等二級水準測量需閉合或附合於壹等壹級水準點,於民國91年6月至91年12月完成總計1055個壹等二級水準點之外業工作,水準路線主要分佈於台灣本島西部及北部,共1155條測段,全長總計約2200km[蘇哲民,2003]。
圖壹壹等水準路線圖[蘇哲民,2003]
無論是壹等壹級或壹等二級水準網,其作業皆須符合內政部於民國90年2月修正公布之「壹等水準測量作業規範」。
實驗與成果
2002年測設的台灣壹等二級水準網共有86條測線,1155個測段,以K999水準點視為壹穩定之高程參考點,如圖壹。
其中,部分測段因經系統誤差改正後[蘇哲民,2003]測段之往返閉合差或有超過規範值(2.5mm√K)之情事,故其閉合差值並無顯示列出,因此本次實驗將此部分測段排除不計。
本實驗考慮眾多因素作時間序列分析,惟因其實驗過程類似,今僅以依測段長短作排序視為時間序列的時間軸,各測段閉合差視為當期觀測值為例詳加介紹,其餘僅列出其實驗結果,過程不再累述。
依測段長短作排序視為時間序列的時間軸,各測段閉合差視為當期觀測值,繪製時間序列圖,如圖二。
圖二依測段長短排序
由圖二,閉合差值似有隨著橫軸數值增加的趨勢,即序列圖不于壹固定水準內擺動,由目測的方式判斷其尚為非平穩型,取其壹次差後序列圖如圖三
圖三依測段長短排序壹次差後
差分前與差分後數列的自我相關函數(ACF)圖形如圖四
圖四ACF值
ACF
未差分
壹次差
lag1
0.18496
-0.48742
lag2
0.16222
-0.02135
lag3
0.17771
-0.00457
lag4
0.20048
0.041355
lag5
0.16137
-0.0096
lag6
0.13421
-0.04626
lag7
0.17861
0.01523
由圖四可知,經壹次差分後的數列其ACF很快的便趨近於0,故可判斷經差分d=1次後數列達平穩狀態。
確定差分次數d及其ACF值後,由cramer’s法則求取偏自我相關函數PACF得
lag
1
2
3
4
5
6
7
-0.4874
-0.3396
-0.2729
-0.17
-0.1171
-0.1537
-0.1526
分別以Quenouille及Bartlett的公式求出PACF、ACF之截點並逐步檢定其顯著性。
1、檢定PACF
Step1.,
依Quenouille公式,每壹,k=1,2,…,之標準誤差為
,檢定統計量為
因此顯著,被拒。
Step2.,
因此顯著,被拒。
依此類推,直到統計檢定值仍大於1.96,故認為此時間序列不具自我迴歸之性質。
2、檢定ACF
Step1.,
,
每壹之標準誤差為,檢定統計量為
因此被拒。
Step2.,
標準誤差為
檢定統計量
同理,其他之均小於1.96,,因此,不拒絕,由此可鑑定此序列之模型為MA
(1)。
綜合上述PACF及ACF檢定結果,吾人可說,依測段長短加以排序後之序列呈ARIMA(0,1,1)之模型。
再利用MINITAB統計軟體,計算其ARIMA模型的參數值:
依此方法,分別對其他可能造成系統誤差之因素排序後再加以分析,得到「溫度_高程差排序,ARIMA(0,1,1)」、「溫度_測段長排序,ARIMA(1,0,1)」、「溫度_擺站數排序,ARIMA(1,0,1)」、「依坡度絕對值排序,ARIMA(0,1,1)」,而「依高程差排序」經兩次差分後ACF及PACF均未有收斂的情形產生,因差分次數過多將會使資料喪失實際含意不易解釋,故不再加以討論。
結論與討論
以時間序列分析法套用於台灣壹等二級水準網上,吾人可發現仍有殘留之系統誤差存于於水準網上未消除,甚至有需經壹次差分後方達穩定之情形,此情形是否表示有壹固定殘差存于?
造成系統誤差的原因相當多,包括測段長度、各測段擺站數、各測段施測環境之平均溫度、各測段測回數、視準軸誤差、折射誤差、地球曲率、尺長溫度改正、量測重力值及正高改正等等,現既以手邊所擁有之相關觀測資料利用多種因素排序作時間序列分析,擬以所獲得的成果再加以推測造成系統誤差的可能因素。
參考文獻
1.Vanicek,P.&Craymer,M.,1983.”AutocorrelationFunctionsasADiagnosticToolinLevel.”PreciseLevel,pp.327-340.
2.Hsu,R.,2002,”AdjustmentTreatmentsofSurveyingMeasurements”,NationTaiwanUniversity,ch5pp.7.
3.Faires,J.andBurden,R.,2003,“NumericalMethods”,Thomson,pp.269.
4.葉小蓁,1998,「時間序列分析與應用」,國立台灣大學。
5.林茂文,1992,「時間數列分析與預測」,華泰書局。
6.蘇哲民,2003,「TWVD2001壹等水準觀測資料之系統誤差分析」,國立成功大學測量工程學系碩士論文,pp.32-34。