CRAN Task View: Extreme Value Analysisについて、機械翻訳を交えて日本語化し掲載しております。

Maintainer: Christophe Dutang
Contact: dutangc at gmail.com
Version: 2023-11-04
URL: https://CRAN.R-project.org/view=ExtremeValue
Source: https://github.com/cran-task-views/ExtremeValue/
Contributions: このタスクビューに対する提案や改良は、GitHubのissueやpull request、またはメンテナのアドレスに電子メールで送ってください。詳しくはContributing guideをご覧ください。
Installation: このタスク・ビューのパッケージは、ctvパッケージを使用して自動的にインストールすることができます。例えば、ctv::install.views(“ExtremeValue”, coreOnly = TRUE)はすべてのコアパッケージをインストールし、ctv::update.views(“ExtremeValue”)はまだインストールしていないすべてのパッケージと最新のものをインストールします。詳しくはCRAN Task View Initiativeを参照してください。

極値のモデリングと推定は、環境、水文学、金融、数理科学など、様々な応用領域で重要な課題となっています。標本の極端な部分は非常に重要であるため、極値の分析に制限を設けることは正当化されるかもしれません。つまり、大気汚染物質の高濃度排出、洪水、極端なクレームサイズ、価格ショックなど、より大きなリスクの可能性を示している可能性があります。極端な統計解析は、適用するトピックによって、多くのパッケージに分かれている可能性があります。このタスクビューでは、方法論的な側面からパッケージを紹介します。

極値理論の応用は他のタスクビューで見ることができます。金融・保険数理解析はFinanceタスクビューで、環境解析はEnvironmetricsタスクビューで見ることができます。確率分布の一般的な実装は、Distributionsタスクビューで研究されています。

メンテナは、極値解析パッケージのレビューをしてくれたE. Gilleland、M. Ribatet、A. Stephensonに感謝します (2013) Kevin Jaunatreの有益なアドバイス、Achim Zeileisの有益なコメントに感謝します。もし情報が正確でないと思われる場合、あるいはここで言及すべきパッケージや重要な情報が漏れている場合は、メールでご連絡いただくか、上記リンク先の GitHub リポジトリで issue や pull request をご提出ください。

単変量極値理論:

一般化パレート分布および一般化極値分布の確率関数(分位、密度、分布、ランダム生成)をエクスポートするパッケージもあり、多くの場合、古典的な接頭辞ルール(接頭辞は “q”, “d”, “p”, “r” )にこだわり、log や lower tail などの形式を使用することが可能です(詳細はDistributionsタスクビューを参照)。小さな形状(指数に近い)の場合、これらの関数の数値評価にはいくつかの方法があります。
また、いくつかの実装ではパラメータをベクトル化した形で使用でき、 パラメータに対する導関数を提供できるものもあります。それでも、nieveは対数尤度を計算するために、2つのEVT確率分布(GPDとGEV)に対するシンボリック微分を提供します。指数関数に近いケースを扱うために、細心の注意が払われています。

  • ベイズ的アプローチ:
    • extRemesは、ベイジアン推定も提供します。
    • MCMC4Extremesは、極値分布に重点を置いて、ある分布の事後推定を行うための関数を提案しています。
    • revdbayesは、一変量極値モデルのベイズ解析を、事後分布からの直接ランダムサンプリング、つまり、MCMC法を用いずに行うものです。
    • texmexは、最尤法(オプションでペナルティ付き)またはベイズ推定を使用してGPDモデルを適合させ、モデルの両方のクラスは、任意の/すべてのモデルパラメータに共変量を使用して適合させることができます。
package function models[^1] covariates sampling[^2] prior choice generic functions
extRemes fevd 1–4,* all RWMH custom plot, summary
MCMC4Extremes ggev,gpdp 1–2,* no RWMH fixed plot, summary
revdbayes rpost 1–4 no RU custom plot, summary
texmex evm 1–2,* all IMH gaussian plot, summary, density,correlogram

[^1] モデル族: 一般化極値分布 (1)、一般化パレート分布 (2)、非一様ポアソン過程 (3)、順序統計量/r-largest (4)、カスタム/その他 (*)。

[^2] サンプリング: ランダムウォーク・メトロポリス・ヘイスティング(RWMH)、 厳密サンプリング比一様(RU)、独立メトロポリス・ヘイスティング(IMH)

  • ブロックマキシマアプローチ:
    • climextRemesは、気候データの極値に対してポイントプロセスフィッティングによるGEVフィッティングを行うための関数で、定常および非定常モデルに対する回帰値、回帰確率、回帰期間を提供するものです。
    • evdは、広範囲の単変量分布関数を提供します。モデル化関数は、標準単変量極値法のパラメータの推定を可能にします。
    • revdbayesは、事後分布からの直接ランダムサンプリングを使用する、すなわちMCMC法を使用しない単変量極値モデルのベイズ解析を提供します。
    • evirは、最尤フィッティングによって単変量GEV分布のモデリングを実行します。
    • extRemesは、MLEによるブロック最大モデル接近のEVDs単変量推定を提供します。また、EVDのパラメータによる非定常性と、GEV分布に対する固定の場合のLモーメント推定とを組み込んでいます。
      • 独立したパッケージin2extRemesは、extRemes へのいくつかのGUIインターフェースを提供します。
    • extremeStatは、リムモーメントを使用してlmomcoパッケージで利用可能な複数のGEV分布タイプに合わせてパラメータを推定する関数が含まれています。
    • fExtremesは、単変量のデータ処理とモデリングを提供します。これには、クラスタリング、ブロック最大値同定、探索的分析が含まれます。GEVの定常モデルの推定は、最尤モデルと確率重み付きモーメントによって行われます。
    • lmomは、GEV分布からの確率分布を低次のLモーメントを使ってデータに合わせる関数を持っています。
    • lmomRFAは、lmom を拡張し、Lモーメントを使用した地域的な周波数分析のためのすべての主要コンポーネントを実装します。
    • ismevは、GEV(診断プロット、MLE、尤度プロファイル)に適合する3つの関数のコレクションを提供し、Coles(2001)の本に続きます。
    • mevは、ブロックマキシマアプローチのためにSmith(1987)の最後から2番目の近似を使用する関数を持っています。
    • QRMは、GPDの適合をグラフィカルに評価する機能を提供します。
    • Renextは、集約マークされたPOTプロセスを使用してGEV分布に適合する様々な機能を提供します。

GEV密度関数とGEVフィッティング関数の概要

package density function location scale shape fit function argdata outputS4 outputS3 outputS3par
climextRemes NA location scale shape fit_gev y NA mle NA
evd dgev loc scale shape fgev x NA estimate NA
evir dgev mu sigma xi gev data NA par.ests NA
extraDistr dgev mu sigma xi NA NA NA NA NA
extRemes devd loc scale shape fevd x NA results par
fExtremes dgev mu beta xi gevFit x fit par.ests NA
ismev NA NA NA NA gev.fit xdat NA mle NA
lmomco pdfgev xi alpha kappa NA NA NA NA NA
QRM dGEV mu sigma xi fit.GEV maxima NA par.ests NA
revdbayes dgev loc scale shape NA NA NA NA NA
SpatialExtremes dgev loc scale shape NA NA NA NA NA
texmex dgev mu sigma xi evm y NA coefficients NA
TLMoments dgev loc scale shape NA NA NA NA NA
  • 極限インデックス推定アプローチ:
    • evdは、極値インデックス推定アプローチの単変量推定を実装します。
    • evirは、極値指数の推定が含まれています。
    • extRemesは、MLEによるブロック最大値およびポアソンポイントプロセス近似のEVDs単変量推定を提供します。また、パラメータを介して非定常性も組み込まれています。
    • extremefitは、パレート型テールにおける閾値超過のモデリゼーションを提供します。このパッケージは、閾値の適応的な選択を計算します。
    • ExtremeRisksは、一変量独立観測と時間依存観測に対して、Expectile、Value-at-Riskなどのリスク指標を提供します。統計的推論は、パラメトリックおよびノンパラメトリックの推定量によって行われます。信頼区間、信頼領域、仮説検定などの推論手続きは、漸近理論を利用することにより得られます。
    • fExtremesは、単変量のデータ処理とモデリングを提供します。これには、極値インデックスの推定が含まれます。
    • mevは、間接時間(MLEおよびSuveges(2007)の最小自乗平方根推定値)を基にした極値インデックス推定値を提供します。これは、Suveges and Davison(2010)が提案した情報行列検定統計量と極値指数のためのMLEを提供します。
    • ReInsは、再保険の観点から極値インデックスとスプライシングアプローチの機能を提供します。
    • evgamは、Ferro and Segers (2003)に基づくモーメントベースの極値指数推定器を実装しています。
    • GJRMは、位置、スケール、形状について一般化平滑/加法モデル(GAMのような回帰)をフィットすることができます。GJRMパッケージは、極値分析に関連するいくつかの分布をマージンとして組み込み、これらの分布の位置とスケールをパラメトリック化することができます:
      • マージン一般化パレート
      • 一般化パレートII
      • 直交パラメトリゼーションを持つ一般化パレート
      • 離散一般化パレート
      • 離散一般化パレートII
      • 離散一般化パレート
  • 混合分布または複合分布のアプローチ:
    • evmixは、カーネル密度推定と極値モデリングを提供します。また、混合極値モデルを実装し、MLEを用いたモデル内の閾値の選択に関するヘルプも含まれています:パラメトリック/GPD、セミパラメトリック/GPD、ノンパラメトリック/GPDのいずれか。
  • GPDアプローチによるPeak-Over-Threshold:
    • ercvは、一般化されたパレート分布に適合させるための方法論を、自動的な閾値選択アルゴリズムとともに提供します。
    • evaは、r-largest order 統計における r の選択と閾値の選択に関する適合度検定を提供します。
    • evdは、MLEによるGPDアプローチの単変量推定が含まれています。
    • evirは、最尤フィッティングによって単変量GPDのモデリングを実行します。
    • extRemesは、MLEによるGPDアプローチのEVDs単変量推定を提供します。EVDのパラメータを通した非定常性およびGPD分布の定置の場合のLモーメント推定も含まれます。
    • extremeStatは、lmomcoで利用可能な複数のGPDディストリビューションタイプにフィットする関数があり、リニアモーメントを使用してパラメータを推定します。
    • fExtremesは、最尤と確率加重モーメントによるGPDの定常モデルの推定が含まれています。
    • ismevは、GPD(診断プロット、閾値の範囲にわたるMLE、尤度プロファイル)に適合する3つの関数のコレクションを提供し、Coles(2OO1)の本に続きます。
    • lmomは、低次のLモーメントを使用して、GPDからデータへの確率分布を適合させる関数が含まれています。
    • lmomRFAは、lmomを拡張し、Lモーメントを使用した地域的な周波数分析のためのすべての主要コンポーネントを実装します。
    • mevは、GPDからのデータをシミュレートする関数と、パラメータ(最適化、MLE、ベイジアンメソッド、ismevで使用されるメソッド)を推定する複数のメソッドをシミュレートする関数を提供します。
    • POTは、GPDパラメータ(MLE、L-Moments、中央値、最小密度出力発散)の複数の推定値を提供します。Lモーメント図および不均一なポアソン(Poisson)プロセス技術の特性から、閾値の選択が行われます。
    • QRMは、GPD の適合性をフィッティングし、グラフィカルに評価するための関数を提供します。
    • ReInsは、拡張パレート分布と同様に GPD 分布をフィットさせる機能を提供します。
    • Renextは、集約マークされたPOTプロセスを使用してGPD配布に適合し評価するためのさまざまな機能を提供します。
    • SpatialExtremesは、GPD 分布をフィットさせる関数を提供します。
    • SpatialExtremesは、一般化パレート分布における閾値の適合/選択のための様々なアプローチを提供します。それらのほとんどは,AMSE基準を最小化すること、あるいは、少なくとも仮定されたGPDモデルのバイアスを減らすことに基づいています。
    • texmexは、最尤法(オプションでペナルティ付き)またはベイズ推定を使用してGPDモデルを適合させ、モデルの両方のクラスは、任意の/すべてのモデルパラメータに共変量を使用して適合させることができます。
    • NHPoissonは、非均質なポアソン過程を閾値以上のピーク分析に適合させる関数を提供します。

GPD密度関数とGPDフィッティング関数の概要

package density function location scale shape fit function argdata argthres outputS4 outputS3 outputS3par
ercv NA NA NA NA fitpot data threshold NA coeff NA
eva dgpd loc scale shape gpdFit data threshold NA par.ests NA
evd dgpd loc scale shape fpot x threshold NA estimate NA
evir dgpd mu beta xi gpd data threshold NA par.ests NA
extraDistr dgpd mu sigma xi NA NA NA NA NA NA
extRemes devd loc scale shape fevd x threshold NA results par
fExtremes dgpd mu beta xi gpdFit x u fit fit par
ismev NA NA NA NA gpd.fit xdat threshold NA mle NA
lmomco pdfgpa xi alpha kappa NA NA NA NA NA NA
mev NA NA scale shape fit.gpd xdat threshold NA estimate NA
POT dgpd loc scale shape fitgpd data threshold NA fitted.values NA
QRM dGPD NA beta xi fit.GPD data threshold NA par.ests NA
ReIns dgpd mu sigma gamma GPDfit data NA NA NA NA
Renext dGPD loc scale shape fGPD x NA NA estimate NA
revdbayes dgp loc scale shape NA NA NA NA NA NA
SpatialExtremes dgpd loc scale shape gpdmle x threshold NA NA NA
tea dgpd loc scale shape gpdFit data threshold NA par.ests NA
texmex dgpd u sigma xi evm y th NA coefficients NA
TLMoments dgpd loc scale shape NA NA NA NA NA NA
  • 記録モデル:
    • RecordTestは、記録破りのイベントの分析を研究し、(極端な)記録における非定常的な振る舞いのノンパラメトリックなモデリング/テストを提供します。
    • evirは、レコードを抽出するための関数records()のみを提供します。
  • 回帰モデル:
    • VGAMは、極値解析のための追加モデリングを提供します。ベクトル一般化加法モデルの推定は、バックフィッティングアルゴリズムを使用して実行され、スムージングスプラインに対してペナルティされた尤度を用います。これは、極端な値の解析のために加法的モデリングを行う唯一のパッケージです。GEVとGPの両方の配布が含まれています。
    • ismevは、説明変数(診断プロット、MLE)でポイントプロセスに適合する関数のコレクションを提供し、Coles(2001)の本に続きます。
    • texmexは、最尤法(オプションでペナルティ付き)またはベイズ推定を使用してGPDモデルを適合させ、モデルの両方のクラスは、任意の/すべてのモデルパラメータに共変量を使用して適合させることができます。
  • 閾値の選択:
    • threshrは、ベイズ型リーブワンアウトクロスバリデーション法を用いて閾値の選択を行い、閾値のセットから得られる予測性能を比較します。
    • ercvは、一般化されたパレート分布に適合させるための方法論を、自動的な閾値選択アルゴリズムとともに提供します。
    • POTは。GPDパラメータの複数の推定量(MLE, L-Moments, method of median, minimum density power divergence)を提供します。L-moments図と非均質ポアソン過程の特性から、閾値の選択のためのテクニックが提供されています。

二変量極値理論:

  • コピュラアプローチ:
    • copulaは、よく使われる様々なコピュラを探索し、モデル化するためのユーティリティを提供します。Distributionsタスクビュー(copulaセクション)も参照してください。
    • fCopulaeは、二変量極値コピュラをフィットするユーティリティを提供します。
  • マキシマムアプローチ:
    • evdは、多変量分布に対する関数を提供します。モデリング関数は。2変量極値分布のクラスのパラメータを推定することができます。二変量極値分布のパラメトリック推定とノンパラメトリック推定の両方が可能です。
    • 擬似角度のサンプルを用いたスペクトル測定のノンパラメトリック推定は、二変量設定のextremisで利用可能です。
  • GPDアプローチによるPeak-Over-Threshold:
    • evdは、検閲された尤度法を使用して2変数のしきい値モデルを実装します。
    • evir内の単一の多変量実装は、2変量のしきい値方法です。
    • extremefitは、時間共変量に応じて、パレート型の尾部の閾値を超える超過のモデル化を提供します。それは、共変量に応じて閾値の適応的選択を提供します。
    • POTは、2変量の場合のGPDパラメータの推定値を提供します。
  • テール依存係数のアプローチ:
    • RTDEは、テール依存係数の二変量推定を実装します。

多変量極値理論:

  • ベイズ的アプローチ:
    • SpatialExtremesは、ベイズ階層モデルを用いた空間的極値の統計的モデリング(フィッティング、チェック、選択)のためのツールを提供します。
    • ExtremalDepは、ベイズ推定を用いた多変量極値フィットの機能も提供します。
  • コピュラアプローチ:
    • SpatialExtremesは、空間極値に対するコピュラベースのモデルを推定する関数と、モデルのチェックと選択を提供します。
    • copulaは、幅広く一般的に使用されるコピュラを探索しモデリングするためのユーティリティを提供します。極値コピュラのノンパラメトリック推定値が実装されています。
      • Distributionsタスク・ビュー(コピュラ・セクション)も参照してください。
    • SimCopは、いくつかの二変量極値分布と多変量ロジスティックモデル、またはGumbelコピュラのシミュレーションを行う機能を備えています。
  • 多変量解析の最大値:
    • lmomcoは、lmomに似ていますが、GEV分布の多変量解析のために、打ち切りデータのLモーメント、トリムLモーメント、Lモーメントなど、Lモーメント推定の最近の進歩も実装しています。
    • SpatialExtremesは、ペアワイズ尤度または空間GEVモデル(共変量あり)を用いて、最大安定過程をデータにフィットさせる関数を提供します。
    • ExtremalDepは、多変量極値の依存構造をパラメトリックおよびノンパラメトリックにモデル化するための手続き一式を提供しています。
    • BMAmevtは、疑似角度に基づくスペクトル測定にディリクレ混合を当てはめるために、トランス次元メトロポリスアルゴリズムを使用するベイズ型ノンパラメトリックモデルを実装しています。
  • GPDアプローチによるPeak-Over-Threshold:
    • lmomcoは、GPD分布のL-moments多変量解析も実装しています。
    • graphicalExtremesは、スパース多変量極値モデルの
      多変量極値モデルのための統計的方法論を開発する。グラフィカルな構造上の多変量パレート分布に対する厳密なシミュレーションと統計的推論のための方法が提供されています。
  • テール依存係数アプローチ:
    • SpatialExtremesは、極値係数関数をノンパラメトリックに推定する関数と、モデルのチェックと選択を行う関数を提供します。
    • ExtremeRisksは、多変量独立マージンに対する Expectile, Value-at-Risk などのリスク指標を提供します。
    • tailDepFunは、パラメトリックな末端依存性モデルに対する最小距離推定法を実装した関数を提供します。
  • 統計的検定:
    • copulaは、最大安定性仮定に関する3つのテストが含まれています。

古典的なグラフィックス:

単変量極値解析のためのグラフィックス

Graphic name Packages Function names
Dispersion index plot POT diplot
Distribution fitting plot extremeStat distLplot
Hill plot evir hill
Hill plot evmix hillplot
Hill plot extremefit hill
Hill plot QRM hillPlot
Hill plot ReIns Hill
Hill plot ExtremeRisks HTailIndex
L-moment plot POT lmomplot
Mean residual life plot POT mrlplot
Mean residual life plot evd mrlplot
Mean residual life plot evir meplot
Mean residual life plot evmix mrlplot
Mean residual life plot ismev mrl.plot
Mean residual life plot QRM MEplot
Mean residual life plot ReIns MeanExcess
Pickand’s plot evmix pickandsplot
QQ Pareto plot POT qplot
QQ Pareto plot RTDE qqparetoplot
QQ Pareto plot QRM plotFittedGPDvsEmpiricalExcesses
QQ Pareto plot ReIns ParetoQQ
QQ Exponential plot QRM QQplot
QQ Exponential plot ReIns ExpQQ
QQ Exponential plot Renext expplot
QQ Lognormal plot ReIns LognormalQQ
QQ Weibull plot ReIns WeibullQQ
QQ Weibull plot Renext weibplot
Risk measure plot QRM RMplot
Threshold choice plot evd tcplot
Threshold choice plot evmix tcplot
Threshold choice plot POT tcplot
Threshold choice plot QRM xiplot
Return level plot POT retlev
Return level plot POT Return
Return level plot Renext plot,lines

多変量極値分析用グラフィックス

Graphic Package Function
Angular densities plot ExtremalDep AngDensPlot
Bivariate threshold choice plot evd bvtcplot
Dependence measure (chi) plot POT chimeas
Dependence measure (chi) plot evd chiplot
Dependence diagnostic plot within time series POT tsdep.plot
Extremal index plot POT exiplot
Extremal index plot evd exiplot
(2D)map for a max-stable process SpatialExtremes map
madogram for a max-stable process SpatialExtremes madogram
madogram for a max-stable process ExtremalDep madogram
F-madogram for a max-stable process SpatialExtremes fmadogram
lambda-madogram for a max-stable process SpatialExtremes lmadogram
Multidimensional Hill plot ExtremeRisks MultiHTailIndex
Pickands’ dependence function plot POT pickdep
Pickands’ dependence function plot ExtremalDep bbeed
QQ-plot for the extremal coefficient SpatialExtremes qqextcoeff
Spectral density plot POT specdens
variogram for a max-stable fields CompRandFld EVariogram

参考文献

  • レビュー論文
    • E. Gilleland, M. Ribatet, A. Stephenson (2013). A Software Review for Extreme Value Analysis, Extremes, 16, 103-119, doi:10.1007/s10687-012-0155-0.
    • A.G. Stephenson, E. Gilleland (2006). Software for the analysis of extreme events: The current state and future directions. Extremes, 8, 87–109, doi:10.1007/s10687-006-7962-0.
  • 古典的な書籍
    • R.-D. Reiss, M. Thomas (2007). Statistical Analysis of Extreme Values with Applications to Insurance, Finance, Hydrology and Other Fields, Springer-Verlag, doi:10.1007/978-3-7643-7399-3.
    • L. de Haan, A. Ferreira (2006). Extreme Value Theory: An Introduction, Springer-Verlag, doi:10.1007/0-387-34471-3.
    • J. Beirlant, Y. Goegebeur, J. Teugels, J. Segers (2004). Statistics of Extremes: Theory and Applications , John Wiley & Sons, doi:10.1002/0470012382.
    • B. Finkenstaedt, H. Rootzen (2004). Extreme Values in Finance, Telecommunications, and the Environment , Chapman & Hall/CRC, doi:10.1201/9780203483350.
    • S. Coles (2001). An Introduction to Statistical Modeling of Extreme Values, Springer-Verlag, doi:10.1007/978-1-4471-3675-0.
    • P. Embrechts, C. Klueppelberg, T. Mikosch (1997). Modelling Extremal Events for Insurance and Finance, Springer-Verlag, doi:10.1007/978-3-642-33483-2.
    • S.I. Resnick (1987). Extreme Values, Regular Variation and Point Processes, Springer-Verlag.
    • R.L. Smith (1987). Approximations in extreme value theory. Technical report 205, Center for Stochastic Process, University of North Carolina, 1–34.
    • M. Suveges (2007). Likelihood estimation of the extremal index. Extremes, 10(1), 41-55, doi:10.1007/s10687-007-0034-2.
    • Suveges and Davison (2010), Model misspecification in peaks over threshold analysis. Annals of Applied Statistics, 4(1), 203-221.

 

R言語 CRAN Task View:極値解析