·

Ciências Contábeis ·

Estatística Aplicada para Finanças

Send your question to AI and receive an answer instantly

Ask Question

Preview text

Testes de Aderência e Simulação de Monte Carlo Bruno Pérez Ferreira Teste de KolmogorovSmirnov Grande parte dos problemas em estatística são tratados com a hipótese que os dados são retirados de uma população com uma distribuição de probabilidade específica O formato desta distribuição pode ser um dos objetivos da análise Por exemplo suponha que um pequeno número de observações foram retiradas de uma população com distribuição desconhecida e que procurase testar hipóteses sobre a média desta população 2 Teste de KolmogorovSmirnov O teste paramétrico tradicional baseado na distribuição tstudent é obtido sob o hipótese de que a população tem distribuição normal Nesse sentido surge a necessidade de certificar se essa suposição pode ser assumida Em alguns casos assumir a normalidade dos dados é o primeiro passo que é tomado para simplificar uma análise Para dar suporte a esta suposição podese aplicar o teste de KolmogorovSmirnov 3 Teste de KolmogorovSmirnov O teste de KolmogorovSmirnov pode ser utilizado para avaliar as hipóteses Este teste observa a máxima diferença absoluta entre a função de distribuição acumulada assumida para os dados no caso a Normal e a função de distribuição empírica dos dados Como critério comparase esta diferença com um valor crítico para um dado nível de significância 4 Teste de KolmogorovSmirnov Considere uma amostra aleatória simples de uma população com função de distribuição FX acumulada contínua desconhecida A estatística utilizada para o teste é 5 Teste de KolmogorovSmirnov Esta função corresponde a distância máxima vertical entre os gráficos de Fx e Fnx sobre a amplitude dos possíveis valores de x Em Dn temos que Fx representa a função de distribuição acumulada assumida para os dados Fnx representa a função de distribuição acumulada empírica dos dados 6 Neste caso é testada a hipótese H₀ Fₓ F contra a hipótese alternativa H₁ Fₓ F Para isto temse X₁ X₂ Xn as observações aleatórias ordenadas de forma crescente da população com função de distribuição contínua Fₓ No caso de análise da normalidade dos dados assumiuse F a função de distribuição da normal Teste de KolmogorovSmirnov A função de distribuição acumulada assumida para os dados é definida por F xi P X xi e a função de distribuição acumulada empírica é definida por uma função escada dada pela fórmula onde IA é a função indicadora A função indicadora é definida da seguinte forma 8 Teste de KolmogorovSmirnov Observe que a função da distribuição empírica Fnx corresponde à proporção de valores menores ou iguais a x Tal função também pode ser escrita da seguinte forma 9 Como a função de distribuição empírica Fₙ é descontínua e a função de distribuição hipotética é contínua devese considerar duas outras estatísticas D supₓi Fxi Fₙxi D supₓi Fxi Fₙxi1 para calcular a estatística de KolmogorovSmirnov Essas estatísticas medem as distâncias vertical entre os gráficos das duas funções teórica e empírica nos pontos xi1 e xi Com isso podese utilizar como estatística de teste Dₙ maxD D Se Dₙ é maior que o valor crítico rejeitase a hipótese de normalidade dos dados com 1α100 de confiança Caso contrário não rejeitase a hipótese de normalidade Sob H₀ a distribuição assintótica da estatística de kolmogorovSmirnov é dada por lim n P nDₙ x 1 2 1ʲ¹exp2j²x² Esta distribuição assintótica é válida quando temos conhecimento completo sobre a distribuição de H₀ entretanto na prática H₀ especifica uma família de distribuições de probabilidade Neste caso a distribuição assintótica da estatística de KolmogorovSmirnov não conhecida e foi determinada via simulação Teste de KolmogorovSmirnov Resumo das estatísticas de teste x ordenado Fnx Fx P zi xix s FxiFnxi x1 1n Fx P z1 x1x s Fx10 x2 2n Fx P z2 x2x s Fx2Fnx2 xn1 n1n Fx P zn xnx s Fxn1Fnxn1 Fxn1Fnxn2 Fxn P zn1 xn1x s FxnFnxn Teste de KolmogorovSmirnov A tabela de valores críticos para a estatística do teste de KomolgorovSmirnov Dn é dada a seguir n 02 01 005 001 5 045 051 056 067 10 032 037 041 049 15 027 030 034 040 20 023 026 029 036 25 021 024 027 032 30 019 022 024 029 35 018 020 023 027 40 017 019 021 025 45 016 018 020 024 50 015 017 107n 122n 136n 163n Teste de ChiQuadrado Segundo Johnston e Dinardo 2001 o teste chi quadrado χ2 identifica o ajuste de uma distribuição de frequência a uma tipologia predeterminada por meio da seguinte aferição Em que Ni é a observação iésima e Ei é a expectativa para a iésima observação conforme uma distribuição predeterminada k i i i i E E N 1 2 2 14 Simulação de Monte Carlo De acordo com Scatena 2004 a Simulação de Monte Carlo SMC tenta aproximar por meio de simulações o comportamento de variáveis que afetam um ativo financeiro Aplicado ao cálculo do VaR procurase encontrar a distribuição dos retornos dos ativos por meio de simulações numéricas e a referida mensuração de risco é obtida por meio dessa distribuição pela medição do quantil desejado 15 Simulação de Monte Carlo Conforme o autor uma maneira de implementar a SMC parte da construção de seqüências aleatórias de números desenvolvidas por meio de um algoritmo que forma distribuição uniforme no intervalo 0 1 Essa é transformada na distribuição com o formato desejado como por exemplo uma com média 0 e desviopadrão 1 por meio de métodos estatísticos ou pela função inversa de Moro em que é utilizada a função inversa da distribuição de probabilidade acumulada da distribuição normal de Gauss Ny que apresenta valores entre 0 e 1 16 Simulação de Monte Carlo Diante disso conforme Scatena 2004 para gerar variáveis aleatórias com distribuição normal devese calcular y tal que x Ny sendo que x apresenta distribuição uniforme ou seja Em que para a implementação da simulação podem ser utilizadas funções aproximadas para a inversa da função de probabilidade acumulada da distribuição de frequência desejada N 1 x y 17 Simulação de Monte Carlo Ainda conforme Scatena 2004 como carteiras de investimento apresentam diversos ativos e por conseqüência tais variáveis podem apresentar correlações as simulações da SMC devem considerar tal fato na implementação Um procedimento que pode ser utilizado é a transformação de Cholesky em que supondose um vetor de N variáveis aleatórias que apresenta a estrutura de variânciacovariância sendo λ uma matriz simétrica e real pode ser decomposta na fatoração de Cholesky 18 Decomposição de Cholesky Seja λ uma matriz simétrica e real pode ser decomposta na fatoração de Cholesky como AA Onde A é uma matriz triangular inferior denominada matriz de Cholesky e A a transposta da matriz A 19 Decomposição de Cholesky Seja um vetor ε de dimensão N 1 composto de variáveis normais independentes com média 0 e variância 1 ou seja I E onde I é a matriz identidade podese realizar a seguinte transformação linear A Logo calculase a matriz de variânciacovariância ˆ ˆ 2 2 AA AIA A AE A E A E 20 Decomposição de Cholesky Seja nn n n nn n n nn n n n n g g g g g g g g g g g g a a a a a a a a a 0 0 0 0 0 0 2 22 1 12 11 2 1 22 21 11 2 1 2 22 21 1 12 11 21 Decomposição de Cholesky Ao aplicar a definição dos produtos de matrizes temse que Para os elementos diagonais 2 2 2 2 1 2 22 2 21 22 2 11 11 nn n n nn g g g a g g a g a 22 Decomposição de Cholesky Assim n i g a g a g i k ik ii ii 2 3 2 1 1 1 2 11 11 23 Decomposição de Cholesky Ao aplicar a definição dos produtos de matrizes temse que Para os elementos nãodiagonais na primeira coluna 11 1 1 11 31 31 11 21 21 g g a g g a g g a n n 24 Decomposição de Cholesky Para os elementos nãodiagonais na segunda coluna 22 2 21 1 2 22 42 21 41 42 22 32 21 31 32 g g g g a g g g g a g g g g a n n n 25 Decomposição de Cholesky Para os elementos nãodiagonais na jésima coluna jj nj j n j n nj jj j j j j j j j j jj j j j j j j j j g g g g g g a g g g g g g a g g g g g g a 2 2 1 1 2 2 2 2 1 12 2 1 2 1 2 1 11 1 26 Decomposição de Cholesky Assim i j com g g a g g n i g a g j k jk ik ij jj ij i i 2 1 2 3 1 1 11 1 1 27 Decomposição de Cholesky Com isso a transformação de Cholesky deve viabilizar por meio de uma rotina de cálculo a geração de comportamentos aleatórios coerentes com as correlações entre os ativos presentes em um portfólio Essa técnica pode ser efetivada também por meio da decomposição da matriz de correlações entre as variáveis utilizadas para o desenvolvimento da simulação Sugerese a rotina calcular na seguinte ordem g11 g21 g31 gn1 g22 g32 gn2 gnn 28