ARMR模型簡單實踐(1)

来源:https://www.cnblogs.com/cheflone/archive/2020/05/24/12952134.html
-Advertisement-
Play Games

1.概念簡述 (1)AR模型 AR 模型(auto regressive model)自回歸模型,模型參量法高解析度譜分析方法之一,也是現代譜估計中常用的模型。 用AR模型法求信具體作法是: ①選擇AR模型,在輸入是衝激函數或白雜訊的情況下,使其輸出等於所研究的信號,至少,應是對該信號的一個好的近似 ...


1.概念簡述

(1)AR模型

AR 模型(auto regressive model)自回歸模型,模型參量法高解析度譜分析方法之一,也是現代譜估計中常用的模型。 用AR模型法求信具體作法是: ①選擇AR模型,在輸入是衝激函數或白雜訊的情況下,使其輸出等於所研究的信號,至少,應是對該信號的一個好的近似。 ②利用已知的自相關函數或數據求模型的參 數。 ③利用求出的模型參數估計該信號的功率譜。  (2)MA模型 MA模型(moving average model)滑動平均模型,模型參量法譜分析方法之一,也是現代譜估中常用的模型。 用MA模型法求信號譜估計的具體作法是:①選擇MA模型,在輸入是衝激函數或白雜訊情況下,使其輸出等於所研究的信號,至少應是對該信號一個好的近似。②利用已知的自相關函數或數據求MA模型的參數。③利用求出的模型參數估計該信號的功率譜。 在ARMA參數譜估計中,大多數估計ARMA參數的兩步方法都首先估計AR參數,然後在這些AR參數基礎上,再估計MA參數,然後可求出ARMA參數的譜估計。所以MA模型參數估計常作為ARMA參數譜估計的過程來計算。   2.使用pythonADF檢驗

在ARMA/ARIMA這樣的自回歸模型中,模型對時間序列數據的平穩是有要求的,因此,需要對數據或者數據的n階差分進行平穩檢驗,而一種常見的方法就是ADF檢驗,即單位根檢驗。

平穩隨機過程

在數學中,平穩隨機過程(Stationary random process)或者嚴平穩隨機過程(Strictly-sense stationary random process),又稱狹義平穩過程,是在固定時間和位置的概率分佈與所有時間和位置的概率分佈相同的隨機過程:即隨機過程的統計特性不隨時間的推移而變化。這樣,數學期望和方差這些參數也不隨時間和位置變化。

平穩在理論上有嚴平穩和寬平穩兩種,在實際應用上寬平穩使用較多。寬平穩的數學定義為:

對於時間序列 ytyt,若對任意的t,k,mt,k,m,滿足:

$$E(y_t) = E(y_{t+m})\\

cov(y_t, y_{t+k}) = cov(y_{t+k}, y_{t+k+m})$$

則稱時間序列 ytyt 是寬平穩的。

平穩是自回歸模型ARMA的必要條件,因此對於時間序列,首先要保證應用自回歸的n階差分序列是平穩的。

(1)肉眼檢驗
def draw_rend(timerise, size):
    # print(timerise)
    f = plt.figure(facecolor='white')  # 畫圖板
    rol_mean = timerise.rolling(window=size).mean()  # 對數據時間移動平均計算
    rol_std = timerise.rolling(window=size).std()
    # rol_ = timerise.rolling(window=size).std()
    timerise.plot(color='c', label='原數據')
    rol_std.plot(color='red', label="移動方差")
    rol_mean.plot(color='blue', label="移動平均值")
    plt.title("願數據,均值,方差")
    plt.legend(loc='best')
    plt.show()

  

  該數據顯然是不平穩的,我們來看看一階差分:
def teststationayity(ts):
    dftest = adfuller(ts)  # 實例化檢驗得到數值源
    # print(dftest)
    dfoutput = pd.Series(dftest[0:4], index=['Test Statistic', 'p_value', '#Lags Used',
                                             'Number of Observation Uesd'])
    # print(dfoutput)
    #n階差分
    # _data=pd.Series(ts)
    # data=_data.diff(1)[1:]
    # # print(data)
    # data.plot()
    # plt.show()
    # plt.savefig('./diff_1.svg')

    for key, value in dftest[4].items():
        dfoutput['Critical Value({})'.format(key)] = value
    return dfoutput

  

一階差分後很明顯是不平穩的波動

(差分:差分的目的主要是消除一些波動 使數據趨於平穩
你說的沒錯 一階差分後的確就是增量 這還比較好解釋  而有時候一階差分都未必能達到平穩,此時還要做二階差分 這個就很難解釋意義了
所以對於多變數的時序 一般如果不平穩 我們會選擇檢驗他們是否同階單整然後在同階單整的情況下做協整分析  只要有協整關係 就可以用原始數據來建模  我的理解就是放寬了平穩的要求 畢竟經濟數據要平穩很多時候是難以達到的)

 

 

 

 

3.光看圖沒底兒,故而再瞅瞅單位根檢驗(adf):

(1)概念簡述:

ADF檢驗
在使用很多時間序列模型的時候,如 ARMA、ARIMA,都會要求時間序列是平穩的,所以一般在研究一段時間序列的時候,第一步都需要進行平穩性檢驗,除了用肉眼檢測的方法,另外比較常用的嚴格的統計檢驗方法就是ADF檢驗,也叫做單位根檢驗。

ADF檢驗全稱是 Augmented Dickey-Fuller test,顧名思義,ADF是 Dickey-Fuller檢驗的增廣形式。DF檢驗只能應用於一階情況,當序列存在高階的滯後相關時,可以使用ADF檢驗,所以說ADF是對DF檢驗的擴展。

單位根(unit root)
在做ADF檢驗,也就是單位根檢驗時,需要先明白一個概念,也就是要檢驗的對象——單位根。

當一個自回歸過程中: ,如果滯後項繫數b為1,就稱為單位根。當單位根存在時,自變數和因變數之間的關係具有欺騙性,因為殘差序列的任何誤差都不會隨著樣本量(即時期數)增大而衰減,也就是說模型中的殘差的影響是永久的。這種回歸又稱作偽回歸。如果單位根存在,這個過程就是一個隨機漫步(random walk)。

ADF檢驗的原理
ADF檢驗就是判斷序列是否存在單位根:如果序列平穩,就不存在單位根;否則,就會存在單位根。

所以,ADF檢驗的 H0 假設就是存在單位根,如果得到的顯著性檢驗統計量小於三個置信度(10%,5%,1%),則對應有(90%,95,99%)的把握來拒絕原假設。

ADF檢驗的python實現
ADF檢驗可以通過python中的 statsmodels 模塊,這個模塊提供了很多統計模型。

使用方法如下:

導入adfuller函數

from statsmodels.tsa.stattools import adfuller
adfuller函數的參數意義分別是:

x:一維的數據序列。
maxlag:最大滯後數目。
regression:回歸中的包含項(c:只有常數項,預設;ct:常數項和趨勢項;ctt:常數項,線性二次項;nc:沒有常數項和趨勢項)
autolag:自動選擇滯後數目(AIC:赤池信息準則,預設;BIC:貝葉斯信息準則;t-stat:基於maxlag,從maxlag開始並刪除一個滯後直到最後一個滯後長度基於 t-statistic 顯著性小於5%為止;None:使用maxlag指定的滯後)
store:True  False,預設。
regresults:True 完整的回歸結果將返回。False,預設。
返回值意義為:

adf:Test statistic,T檢驗,假設檢驗值。
pvalue:假設檢驗結果。
usedlag:使用的滯後階數。
nobs:用於ADF回歸和計算臨界值用到的觀測值數目。
icbest:如果autolag不是None的話,返回最大的信息準則值。
resstore:將結果合併為一個dummy。

 adf概念    refer    原文鏈接:https://blog.csdn.net/FrankieHello/java/article/details/86766625

 

 

 

 

(2)判斷

adfuller(dta)後我得到的return;

Test Statistic 0.815369
p_value 0.991880
#Lags Used 13.000000
Number of Observation Uesd 130.000000
Critical Value(1%) -3.481682
Critical Value(5%) -2.884042
Critical Value(10%) -2.578770
dtype: float64

如何確定該序列能否平穩呢?主要看:

1%、%5、%10不同程度拒絕原假設的統計值和ADF Test result的比較,ADF Test result同時小於1%、5%、10%即說明非常好地拒絕該假設,本數據中,adf結果(Test Statistic)為0.8, 大於三個level的統計值。

看P-value是否非常接近0.  本數據中,P-value 為 0.99,不夠接近0.

ADF檢驗的原假設是存在單位根,只要這個統計值是小於1%水平下的數字就可以極顯著的拒絕原假設,認為數據平穩。註意,ADF值一般是負的,也有正的,但是它只有小於1%水平下的才能認為是及其顯著的拒絕原假設。

對於ADF結果在1% 以上 5%以下的結果,也不能說不平穩,關鍵看檢驗要求是什麼樣子的。

但是對於本例,,數據是顯然不平穩的了。

 

 

2020-05-24 

 

 

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 若該文為原創文章,未經允許不得轉載原博主博客地址:https://blog.csdn.net/qq21497936原博主博客導航:https://blog.csdn.net/qq21497936/article/details/102478062本文章博客地址:https://blog.csdn.n ...
  • 整理出一篇Java進階架構師之路的核心知識,同時也是面試時面試官必問的知識點,篇章也是包括了很多知識點,其中包括了有基礎知識、Java集合、JVM、多線程併發、spring原理、微服務、Netty 與RPC 、Kafka、日記、設計模式、Java演算法、資料庫、Zookeeper、分散式緩存、數據結構 ...
  • 安裝配置jdk8 1. 官網下載,安裝jdk8安裝包(我這裡的版本是jdk 8u231 windows x64.exe),選擇安裝位置,我的安裝位置是 C:\environment\java\jdk1.8.0_231 .安裝完jdk後會跳出彈窗要jre,直接關閉,不用選下一步,因為我們前面的jdk安 ...
  • 本篇博客新開一個數據分析後的數據可視化的例子講解,每一篇博客是一個例子。 這節課學習如何繪製一個折線圖。題目如下: 代碼如下: 效果如下: ...
  • IDEA一些不錯的插件分享 目錄 IDEA一些不錯的插件分享 插件集合 CamelCase Translation LiveEdit MarkDown Navigator Jrebel CheckStyle IDEA Alibaba Java Coding Guidelines Ideavim Ma ...
  • hashCode() 和equals() 方法的重要性體現在什麼地方? Java中的HashMap使用hashCode()和equals()方法設置值,根據鍵獲取值的時候也會用到這兩個方法。 怎樣 設置 的值? hashCode()獲得 hash值。而hash值用來確定hashmap中內部 Node ...
  • 老孟導讀:今天分享一個類似“孔雀開屏”的動畫效果,打開新的頁面時,新的頁面從屏幕右上角以圓形逐漸打開到全屏。 先來看下具體的效果 不知道這種效果大家叫什麼名字?如果有更合適的名字可以在評論處告訴我,下麵來說下如何實現此效果。 在使用Navigator進入一個新的頁面時,通常用法如下: 就包含了切換頁 ...
  • 4.元組 元組的主要特性為: 1.元組在創建之後,具有不可以更改的特性,因此不能直接給元組的元素賦值 2.元組的元素類型可以為任意類型,如字典、字元串、列表等 3.元組常用於在程式的整個生命周期中都不變的場景中 4.1 常用方法 元組大小和內容在定義賦值之後,就不可更改,常用的方法如下所示: cou ...
一周排行
    -Advertisement-
    Play Games
  • 1. 說明 /* Performs operations on System.String instances that contain file or directory path information. These operations are performed in a cross-pla ...
  • 視頻地址:【WebApi+Vue3從0到1搭建《許可權管理系統》系列視頻:搭建JWT系統鑒權-嗶哩嗶哩】 https://b23.tv/R6cOcDO qq群:801913255 一、在appsettings.json中設置鑒權屬性 /*jwt鑒權*/ "JwtSetting": { "Issuer" ...
  • 引言 集成測試可在包含應用支持基礎結構(如資料庫、文件系統和網路)的級別上確保應用組件功能正常。 ASP.NET Core 通過將單元測試框架與測試 Web 主機和記憶體中測試伺服器結合使用來支持集成測試。 簡介 集成測試與單元測試相比,能夠在更廣泛的級別上評估應用的組件,確認多個組件一起工作以生成預 ...
  • 在.NET Emit編程中,我們探討了運算操作指令的重要性和應用。這些指令包括各種數學運算、位操作和比較操作,能夠在動態生成的代碼中實現對數據的處理和操作。通過這些指令,開發人員可以靈活地進行算術運算、邏輯運算和比較操作,從而實現各種複雜的演算法和邏輯......本篇之後,將進入第七部分:實戰項目 ...
  • 前言 多表頭表格是一個常見的業務需求,然而WPF中卻沒有預設實現這個功能,得益於WPF強大的控制項模板設計,我們可以通過修改控制項模板的方式自己實現它。 一、需求分析 下圖為一個典型的統計表格,統計1-12月的數據。 此時我們有一個需求,需要將月份按季度劃分,以便能夠直觀地看到季度統計數據,以下為該需求 ...
  • 如何將 ASP.NET Core MVC 項目的視圖分離到另一個項目 在當下這個年代 SPA 已是主流,人們早已忘記了 MVC 以及 Razor 的故事。但是在某些場景下 SSR 還是有意想不到效果。比如某些靜態頁面,比如追求首屏載入速度的時候。最近在項目中回歸傳統效果還是不錯。 有的時候我們希望將 ...
  • System.AggregateException: 發生一個或多個錯誤。 > Microsoft.WebTools.Shared.Exceptions.WebToolsException: 生成失敗。檢查輸出視窗瞭解更多詳細信息。 內部異常堆棧跟蹤的結尾 > (內部異常 #0) Microsoft ...
  • 引言 在上一章節我們實戰了在Asp.Net Core中的項目實戰,這一章節講解一下如何測試Asp.Net Core的中間件。 TestServer 還記得我們在集成測試中提供的TestServer嗎? TestServer 是由 Microsoft.AspNetCore.TestHost 包提供的。 ...
  • 在發現結果為真的WHEN子句時,CASE表達式的真假值判斷會終止,剩餘的WHEN子句會被忽略: CASE WHEN col_1 IN ('a', 'b') THEN '第一' WHEN col_1 IN ('a') THEN '第二' ELSE '其他' END 註意: 統一各分支返回的數據類型. ...
  • 在C#編程世界中,語法的精妙之處往往體現在那些看似微小卻極具影響力的符號與結構之中。其中,“_ =” 這一組合突然出現還真不知道什麼意思。本文將深入剖析“_ =” 的含義、工作原理及其在實際編程中的廣泛應用,揭示其作為C#語法奇兵的重要角色。 一、下劃線 _:神秘的棄元符號 下劃線 _ 在C#中並非 ...