·
Sistemas de Informação ·
Estatística e Probabilidade
· 2021/1
Envie sua pergunta para a IA e receba a resposta na hora

Prefere sua atividade resolvida por um tutor especialista?
- Receba resolvida até o seu prazo
- Converse com o tutor pelo chat
- Garantia de 7 dias contra erros
Recomendado para você
4
Exercícios - Gráficos - Estatística e Probabilidade 2022 1
Estatística e Probabilidade
UFOP
13
Slide - Medidas de Tendência Central - Estatística e Probabilidade 2022-2
Estatística e Probabilidade
UFOP
5
Lista 1 - Estatística e Probabilidade - 2023-1
Estatística e Probabilidade
UFOP
2
Exercícios - Probabilidade - 2023-2
Estatística e Probabilidade
UFOP
3
Exercícios - Quartis e Desvio Padrão - 2023-2
Estatística e Probabilidade
UFOP
1
Lista - Probabilidade 2021 2
Estatística e Probabilidade
UFOP
1
Lista - Bayes - 2023-1
Estatística e Probabilidade
UFOP
13
Lista 1 - Estatística e Probabilidade - 2023-2
Estatística e Probabilidade
UFOP
44
Slide - Estatística e Probabilidade 2020-2
Estatística e Probabilidade
UFOP
2
Exercícios - Estatística e Probabilidade - 2023-2
Estatística e Probabilidade
UFOP
Texto de pré-visualização
RESPOSTAS QUESTÃO 01. a) Deve ser utilizada a hipótese H 0: μ≤ μ0, pois se μ>μ0, a hipótese nula será rejeitada e a resistência média das barras será superior a μ0. b) Ele estaria cometendo um erro do tipo II, a qual ocorre quando a hipótese nula é falsa e não é rejeitada. c) Usar um valor inferior para α significa que teremos menos probabilidade de detectar uma diferença verdadeira, se existir uma realmente. Entretanto, essa redução acarreta em um aumento de xc, então há uma redução na região de rejeição e um aumento da região de aceitação. QUESTÃO 02. Como N = 2, temos a seguinte Tabela. Tabela 1. Dados usados nos cálculos. Variável 40 56 68 64 86 60 36 55 65 a) A média pode ser calculada usando a equação abaixo: x= 1 N ∑ i=1 N xi x=1 9 (40+56+68+64+86+60+36+55+65)=58,89 Agora podemos calcular a variância usando a equação apresentada abaixo: s 2= 1 ( N−1)∑ i=1 N (xi−x) 2 s 2=1 8 [(40−58,89) 2+(56−58,89) 2+(68−58,89) 2+(64−58,89) 2+(86−58,89) 2+(60−58,89) 2+(36−58,89) 2+(55−58,89) 2+(65−58,89) 2] s 2=223,361 Diante disso, o desvio padrão é: s=√223,361=14 ,95 b) Considerando que a população tem distribuição normal e como o desvio padrão populacional é desconhecido, a distribuição t de Student para todas amostras de tamanho n é representada por: tcalc= x−μ s √n O número de graus de liberdade é definido como gl=n−1, neste caso gl=8. Agora temos que encontrar o valor crítico t α 2 correspondente a um nível de confiança de 90%. Ao consultar a tabela t de Student para gl=8, considerando a distribuição bicaudal, temos: t (8;0,05)=1,86 Nesta etapa devemos calcular o tcalc para a média populacional fornecida (70). tcalc= x−μ s √n =58,89−70 14 ,95 √9 =−11,11 4,983 =−2,229 Considerando o teste bilateral e tendo α = 10%, tem-se que a região de aceitação é constituída pelo intervalo RA = [-1,86, 1,86], isso porque t α 2 =1,86. Como tcal<tα/2 (tcal está fora de RA), podemos rejeitar a hipótese nula, ou seja, a hipótese de que ao nível de 10% de significância pode-se afirmar que a média populacional pode ser aproximadamente 70. O Intervalo de confiança para estimativa de μ com σ desconhecido é: IC : x−t α 2 s √n <μ<x+t α 2 s √n IC :58,89−1,86 14 ,95 √9 <μ<58,89+1,86 14 ,95 √9 IC :49,62<μ<68,16 Diante disso, devemos rejeitar a hipótese da média populacional ser aproximadamente 70 a um nível de 10% de significância. c) Agora temos que encontrar o valor crítico t α 2 correspondente a um nível de confiança de 95%. Ao consultar a tabela t de Student para gl=8, considerando a distribuição bicaudal, temos: t (8;0,025)=2,306 Nesta etapa devemos calcular o tcalc para a média populacional fornecida na letra “c” (75). tcalc= x−μ s √n =58,89−75 14 ,95 √9 =−16,11 4,983 =−3,233 Considerando o teste bilateral e tendo α = 5%, tem-se que a região de aceitação é constituída pelo intervalo RA = [-2,306, 2,306], isso porque t α 2 =2,306. Como tcal<tα/2 (tcal está fora de RA), podemos rejeitar a hipótese nula, ou seja, a hipótese de que ao nível de 5% de significância pode-se afirmar que a média populacional pode ser aproximadamente 75. O Intervalo de confiança para estimativa de μ com σ desconhecido é: IC : x−t α 2 s √n <μ<x+t α 2 s √n IC :58,89−2,306 14 ,95 √9 <μ<58,89+2,306 14 ,95 √9 IC :47 ,40<μ<70,38 Diante disso, devemos rejeitar a hipótese da média populacional ser aproximadamente 75 a um nível de 5% de significância. QUESTÃO 03. a) Como M=22, temos que o consumidor resolveu comprar 4400 exemplares deste modelo T. Além disso, exatamente 264 apresentaram defeitos dentro de um ano de uso. Isto representa uma proporção de ^p= 12 M 200 M , ou seja, ^p= 264 4400=0,06. Inicialmente, vamos considerar que os dados relacionados à proporção apresentam distribuição aproximadamente normal. Para este tipo de problema deve ser aplicado um teste unilateral à esquerda (teste para a proporção populacional), o qual tem as seguintes hipóteses: { H 0: p=p0 H 1: p< p0 →{ H 0: p=0,05 H 1: p<0,05 Esse teste tem por finalidade verificar se as unidades fabricadas por uma determinada fabricante não só diferem de p0, mas também se é menor do que μ0. Logo, podemos usar a equação abaixo para determinar a estatística de teste: Zcal=√n ^p−p0 √ p0(1−p0) =√4400 0,06−0,05 √0,05 (1−0,05) =3,044 Como o teste é unilateral a esquerda e α=0,01, a região de não rejeição (RNR) é: P (Z ≥ Zα)=1−α=1−0,01=0,99 Diante disso, temos que Zα=−2,32635 (calculado no Excel usando a função “INV.NORMP.N”, mas pode ser observado na Tabela da Distribuição Normal Padrão), logo Zcal>Zα. Então, para o nível de significância de 0,01 (1%), Zcal>Zα, então não devemos rejeitar a hipótese nula, ou seja, a hipótese de que as unidades fabricadas por uma determinada fabricante são diferentes de p0. Conclusão: A afirmação feita pela fabricante deve ser rejeitada (o modelo T tem probabilidade menor do que 5% de apresentar defeitos no primeiro ano de uso). b) Independentemente do valor de x (que está associado ao número de matrícula “M” e será sempre positivo) a proporção de defeitos dentro de um ano de uso será sempre ^p=0,06. Se reduzirmos o valor de “x”, o Zcal reduzirá mais seguirá positivo, portanto, para o nível de significância de 0,01 (1%), Zcal>Zα, então não devemos rejeitar a hipótese nula, ou seja, afirmação feita pela fabricante deve ser rejeitada (o modelo T tem probabilidade menor do que 5% de apresentar defeitos no primeiro ano de uso). Se considerarmos que este problema deve ser aplicado um teste unilateral à direita (teste para a proporção populacional), o qual tem as seguintes hipóteses: { H 0: p=p0 H 1: p> p0 →{ H 0: p=0,05 H 1: p>0,05 Como o teste é unilateral a direita e α=0,01, a região de não rejeição (RNR) é: P (Z ≤ Zα)=1−α=1−0,01=0,99 Diante disso, temos que Zα=2,32635 (calculado no Excel usando a função “INV.NORMP.N”, mas pode ser observado na Tabela da Distribuição Normal Padrão). Podemos usar esse valor para definir o valor de “n” e consequentemente o valor de “M”. Independentemente do valor de x (que está associado ao número de matrícula “M” e será sempre positivo) a proporção de defeitos dentro de um ano de uso será sempre ^p=0,06. n= ( Zcal ^p−p0 √ p0(1−p0)) 2 = ( 2,32635 0,06−0,05 √0,05 (1−0,05)) 2 =2570,65 M= n 200=2570,65 200 =12,85 Portanto, para “x” maior ou igual a 13, devemos rejeitar a hipótese nula e aceitar que o modelo T tem probabilidade maior do que 5% de apresentar defeitos no primeiro ano de uso. Se x pudesse assumir valores negativos, a hipótese da fabricante pudesse ser aceita. QUESTÃO 04. a) Devemos calcular o coeficiente de correlação de Pearson usando a equação abaixo e para fins de simplicidade, utilizaremos a Tabela 1 (as informações em negrito representam a soma dos dados da respectiva coluna). r= n∑ i=1 n xi yi−(∑ i=1 n xi)(∑ i=1 n yi) √n∑ i=1 n xi 2−(∑ i=1 n xi) 2 √n∑ i=1 n yi 2−(∑ i=1 n yi) 2 Tabela 1. Dados usados nos cálculos. X Y XiY i xi 2 yi 2 -2,00 3,30 -6,60 4,00 10,89 -0,40 2,00 -0,80 0,16 4,00 1,00 1,20 1,20 1,00 1,44 0,00 1,00 0,00 0,00 1,00 2,00 -2,00 -4,00 4,00 4,00 5,00 -3,00 -15,00 25,00 9,00 7,50 -3,10 -23,25 56,25 9,61 8,00 -4,00 -32,00 64,00 16,00 21,10 -4,60 -80,45 154,41 55,94 r= 8∙ (−80,45)−21,10∙(−4 ,60) √8∙154 ,41−(21,10) 2√8∙55,94−(−4 ,60) 2 r=−546,54 580,391 =−0,942 Notamos que há uma correlação forte negativa entre as variáveis analisadas. Para determinar a equação da reta usando mínimos quadrados, temos que resolver o sistema de equações, denominado “equações normais” do problema, cujas incógnitas são os parâmetros a e b da equação da reta y=a+bx (detalhes sobre a dedução deste sistema pode ser visto em http://www.decom.ufop.br/prof/marcone/Disciplinas/MetodosNumericoseEstatisticos/ QuadradosMinimos.pdf). Além disso, para fins de simplicidade na realização dos cálculos, usaremos a Tabela 1. { na+(∑ i=1 n xi)b=∑ i=1 n yi (∑ i=1 n xi)a+(∑ i=1 n xi 2)b=∑ i=1 n xi∙ yi Com os dados da Tabela 1, podemos montar e resolver o sistema de equações para determinar os parâmetros da equação da reta. { 8a+21,10b=−4 ,60 21,10a+154 ,41b=−80,45(1) Multiplicando a primeira equação (1ª linha) por “-21,10” e a segunda equação (2ª linha) por 8, temos: { −168,8a−445,21b=97,06 168,8a+1235,28b=−643,6 Somando as equações anteriores, membro a membro, temos o valor de “b”. b=−546,54 790,07 =−0,692 Agora podemos substituir o valor calculado para “b” na primeira equação de (1) para determinar “a”. a=−4 ,60−21,10∙(−0,692) 8 =1,25 Então podemos escrever a equação da reta como y=1,25−0,692 x. A Figura 1 representa as variáveis analisadas (gráfico de dispersão) e a reta obtida por meio da aplicação do método de mínimos quadrados. -4.00 -2.00 0.00 2.00 4.00 6.00 8.00 10.00 -5.00 -4.00 -3.00 -2.00 -1.00 0.00 1.00 2.00 3.00 4.00 Y Y previsto x y Figura 1. Variáveis dependente e independente e a reta obtida por meio da aplicação de mínimos quadrados. b) Devemos calcular o coeficiente de correlação de Pearson usando a equação abaixo e para fins de simplicidade, utilizaremos a Tabela 2 (as informações em negrito representam a soma dos dados da respectiva coluna). r= n∑ i=1 n xi yi−(∑ i=1 n xi)(∑ i=1 n yi) √n∑ i=1 n xi 2−(∑ i=1 n xi) 2 √n∑ i=1 n yi 2−(∑ i=1 n yi) 2 Tabela 1. Dados usados nos cálculos. X Y XiY i xi 2 yi 2 0,80 3,50 2,80 0,64 12,25 1,10 -0,40 -0,44 1,21 0,16 4,69 4,50 21,11 22,00 20,25 2,40 -1,10 -2,64 5,76 1,21 6,20 9,60 59,52 38,44 92,16 3,70 0,80 2,96 13,69 0,64 6,00 8,20 49,20 36,00 67,24 24,89 25,10 132,51 117,74 193,91 r= 7∙132,51−24 ,89∙25,10 √7∙117,74−(24 ,89) 2√7∙193,91−(25,10) 2 r=302,799 385,814 =0,785 Notamos que há uma correlação positiva entre as variáveis analisadas. Para determinar a equação da reta usando mínimos quadrados, temos que resolver o sistema de equações, denominado “equações normais” do problema, cujas incógnitas são os parâmetros a e b da equação da reta y=a+bx (detalhes sobre a dedução deste sistema pode ser visto em http://www.decom.ufop.br/prof/marcone/Disciplinas/MetodosNumericoseEstatisticos/ QuadradosMinimos.pdf). Além disso, para fins de simplicidade na realização dos cálculos, usaremos a Tabela 2. { na+(∑ i=1 n xi)b=∑ i=1 n yi (∑ i=1 n xi)a+(∑ i=1 n xi 2)b=∑ i=1 n xi∙ yi Com os dados da Tabela 2, podemos montar e resolver o sistema de equações para determinar os parâmetros da equação da reta. { 7 a+24 ,89b=25,10 24 ,89a+117,74 b=132,51(1) Multiplicando a primeira equação (1ª linha) por “-24,89” e a segunda equação (2ª linha) por 7, temos: { −174 ,233a−619,533b=−624 ,7 49 174 ,233a+824 ,180b=927,548 Somando as equações anteriores, membro a membro, temos o valor de “b”. b= 302,799 204 ,6 47 =1,480 Agora podemos substituir o valor calculado para “b” na primeira equação de (1) para determinar “a”. a=25,10−24 ,89∙(1,480) 7 =−1,675 Então podemos escrever a equação da reta como y=−1,675+1,48 x. A Figura 2 representa as variáveis analisadas (gráfico de dispersão) e a reta obtida por meio da aplicação do método de mínimos quadrados. 0.00 1.00 2.00 3.00 4.00 5.00 6.00 7.00 -2.00 0.00 2.00 4.00 6.00 8.00 10.00 12.00 Y Y previsto Eixo x Eixo y Figura 2. Variáveis dependente e independente e a reta obtida por meio da aplicação de mínimos quadrados. Apesar do coeficiente de correlação e Person ter dado relativamente forte (r > 0,5), a curva de dispersão indica que o melhor ajuste é uma função polinomial. De fato, quando usamos o Excel para fazer regressão linear e regressão polinomial nestes dados, notamos que a regressão polinomial ( y=0,734 x 2−3,672 x+4,296) apresenta um melhor desempenho (os resultados estão apresentados na Figura 3. É possível notar que há um aumento no coeficiente de determinação, o qual é o quadrado do coeficiente de correção de Pearson. 0.00 1.00 2.00 3.00 4.00 5.00 6.00 7.00 -2.00 0.00 2.00 4.00 6.00 8.00 10.00 12.00 f(x) = 1.47961299238646 x − 1.67545464916221 R² = 0.61596022972108 f(x) = 0.733989618278681 x² − 3.67169975017217 x + 4.29574223869902 R² = 0.925541846224732 Eixo x Eixo y UNIVERSIDADE FEDERAL DE OURO PRETO - ICEA - DECEA Estat´ıstica e Probabilidade - CEA020 - PER´IODO LETIVO DE 2021-1 3ª Lista de CEA307 Professor: Hugo Fonseca Ara´ujo Data: 06/06/2022 Respostas sem os respectivos c´alculos ou justificativas n˜ao ser˜ao consideradas. Instru¸c˜oes: Resolva a prova a m˜ao, escaneie ou fotografe as p´aginas com as respostas das quest˜oes e submeta no local indicado pela plataforma Moodle at´e segunda-feira, dia 13 de junho de 2022 `as 23:59h. Em caso de problemas, envie para o e-mail hugo.araujo@ufop.edu.br, com o assunto “Lista 3 Estat´ıstica e Probabilidade”. Por favor, n˜ao mande no formato RAR. Use PDF, JPG, JPEG, ZIP ou PNG. Seja M o n´umero formado pelos dois ´ultimos d´ıgitos de seu n´umero de matr´ıcula e N o ´ultimo d´ıgito de sua matr´ıcula. Por exemplo, para a matr´ıcula 12.3.4507, temos M =07 e N=7. Substitua o valor de M ou N antes de fazer as contas, antes de come¸car a resolver cada quest˜ao. Lista A - Se o seu nome come¸ca com a letra J ou menor Quest˜ao 1. (15 pontos) Suponha que uma construtora necessita comprar barras de ferro para realizar uma grande obra. Para que seu projeto seja bem sucedido, ´e muito importante que a resistˆencia m´edia dessas barras seja superior a certo valor µ0. Para decidir comprar ou n˜ao as barras de ferro de determinado fabricante, a construtora realizar´a um teste de hip´otese. Neste teste ela ir´a calcular a resistˆencia m´edia x de 50 barras de ferro fornecidas como amostra pelo fabricante e, a partir deste valor, decidir´a se as barras de ferro `a venda s˜ao adequadas ou n˜ao para os seus prop´ositos. a) Considerando que µ representa a resistˆencia m´edia das barras de ferro produzidas pela empresa, qual das hip´oteses abaixo deve ser utilizada para que se decida pela compra das barras de ferro em caso de rejei¸c˜ao de H0? H0 : µ ≤ µ0 H0 : µ = µ0 H0 : µ ≥ µ0 b) Neste contexto, qual seria o tipo de erro cometido caso a construtora compre as barras de ferro, quando na verdade elas s˜ao inadequadas para o uso? c) Considere a hip´otese que vocˆe escolheu na letra a). Suponha que ela ser´a testada a um n´ıvel de significˆancia α, utilizando o valor x calculado a partir da amostra pela construtora. Considere o valor xc que divide a reta real na regi˜ao que indica rejei¸c˜ao da hip´otese ou aceita¸c˜ao da hip´otese. Se diminu´ımos o valor de α, o valor de xc aumenta ou diminui? Quest˜ao 2. (20 pontos) Seguem abaixo os dados de uma amostra retirada de uma popula¸c˜ao normalmente distribu´ıda: 40 54 + N 70 − N 60 + 2N 86 60 (N + 10)2 4 55 65. a) Calcule a m´edia e a variˆancia da amostra. b) Determine se a hip´otese da m´edia populacional ser aproximadamente 70 deve ou n˜ao ser rejeitada a um n´ıvel de 10% de significˆancia. c) Determine se a hip´otese da m´edia populacional ser maior que 75 deve ou n˜ao ser rejeitada a um n´ıvel de 5% de significˆancia. 1 Quest˜ao 3. (20 pontos) Nesta quest˜ao, x representa um n´umero inteiro. Um fabricante de televisores anunciou que o modelo T tem probabilidade menor do que 5% de apresentar defeitos no primeiro ano de uso. Um consumidor muito desconfiado resolveu comprar 200x exemplares deste modelo T. Dentre estes televisores, exatamente 12x apresentaram defeitos dentro de um ano de uso. a) Suponha que x = M. A um n´ıvel de 1% de significˆancia, a afirma¸c˜ao do fabricante deve ser rejeitada? b) Para quais valores de x a afirma¸c˜ao acima deveria ser rejeitada? Para quais valores deveria ser aceita? Quest˜ao 4. (35 pontos) a) Considere o seguinte conjunto de pares de dados (x, y): (−2.0, 3.3) (−0.4, 2.0) (1.0, 1.2) (N − 2, 3 − N) (N, 2 − 2N) (5.0, −3.0) (7.5, −3.1) (8.0, −4). 1. Calcule o coeficiente de correla¸c˜ao linear de Pearson desse conjunto de dados e esboce estes pontos em um diagrama de dispers˜ao. 2. Utilizando o m´etodo dos m´ınimos quadrados, encontre a reta que melhor aproxima este conjunto de dados. b) Considere o seguinte conjunto de pares de dados (x, y): (−0.8, 3.5) (1.1, −0.4) ( √ N + 20, 4.5) (2.4, −1.1) (0.1 · N + 6, 9.6) (3.7, 0.8) (6.0, 8.2) 1. Calcule o coeficiente de correla¸c˜ao linear de Pearson desse conjunto de dados e esboce estes pontos em um diagrama de dispers˜ao. 2. Utilizando o m´etodo dos m´ınimos quadrados, encontre a reta que melhor aproxima este conjunto de dados. 3. Considerando o valor do coeficiente de correla¸c˜ao linear e o diagrama de dispers˜ao desenhado, discuta a razoabilidade da aproxima¸c˜ao linear encontrada no item 2. Que outro tipo de correla¸c˜ao parece mais adequada no entendimento deste conjunto de dados? Quest˜ao 5. (10 pontos) Fa¸ca uma pequena reda¸c˜ao observando como os estudos de probabilidade que realizamos na primeira parte do curso s˜ao importantes nos estudos de inferˆencia estat´ıstica que realizamos na parte final deste curso. Dˆe exemplos que ilustrem o seu coment´ario. 2
Envie sua pergunta para a IA e receba a resposta na hora
Recomendado para você
4
Exercícios - Gráficos - Estatística e Probabilidade 2022 1
Estatística e Probabilidade
UFOP
13
Slide - Medidas de Tendência Central - Estatística e Probabilidade 2022-2
Estatística e Probabilidade
UFOP
5
Lista 1 - Estatística e Probabilidade - 2023-1
Estatística e Probabilidade
UFOP
2
Exercícios - Probabilidade - 2023-2
Estatística e Probabilidade
UFOP
3
Exercícios - Quartis e Desvio Padrão - 2023-2
Estatística e Probabilidade
UFOP
1
Lista - Probabilidade 2021 2
Estatística e Probabilidade
UFOP
1
Lista - Bayes - 2023-1
Estatística e Probabilidade
UFOP
13
Lista 1 - Estatística e Probabilidade - 2023-2
Estatística e Probabilidade
UFOP
44
Slide - Estatística e Probabilidade 2020-2
Estatística e Probabilidade
UFOP
2
Exercícios - Estatística e Probabilidade - 2023-2
Estatística e Probabilidade
UFOP
Texto de pré-visualização
RESPOSTAS QUESTÃO 01. a) Deve ser utilizada a hipótese H 0: μ≤ μ0, pois se μ>μ0, a hipótese nula será rejeitada e a resistência média das barras será superior a μ0. b) Ele estaria cometendo um erro do tipo II, a qual ocorre quando a hipótese nula é falsa e não é rejeitada. c) Usar um valor inferior para α significa que teremos menos probabilidade de detectar uma diferença verdadeira, se existir uma realmente. Entretanto, essa redução acarreta em um aumento de xc, então há uma redução na região de rejeição e um aumento da região de aceitação. QUESTÃO 02. Como N = 2, temos a seguinte Tabela. Tabela 1. Dados usados nos cálculos. Variável 40 56 68 64 86 60 36 55 65 a) A média pode ser calculada usando a equação abaixo: x= 1 N ∑ i=1 N xi x=1 9 (40+56+68+64+86+60+36+55+65)=58,89 Agora podemos calcular a variância usando a equação apresentada abaixo: s 2= 1 ( N−1)∑ i=1 N (xi−x) 2 s 2=1 8 [(40−58,89) 2+(56−58,89) 2+(68−58,89) 2+(64−58,89) 2+(86−58,89) 2+(60−58,89) 2+(36−58,89) 2+(55−58,89) 2+(65−58,89) 2] s 2=223,361 Diante disso, o desvio padrão é: s=√223,361=14 ,95 b) Considerando que a população tem distribuição normal e como o desvio padrão populacional é desconhecido, a distribuição t de Student para todas amostras de tamanho n é representada por: tcalc= x−μ s √n O número de graus de liberdade é definido como gl=n−1, neste caso gl=8. Agora temos que encontrar o valor crítico t α 2 correspondente a um nível de confiança de 90%. Ao consultar a tabela t de Student para gl=8, considerando a distribuição bicaudal, temos: t (8;0,05)=1,86 Nesta etapa devemos calcular o tcalc para a média populacional fornecida (70). tcalc= x−μ s √n =58,89−70 14 ,95 √9 =−11,11 4,983 =−2,229 Considerando o teste bilateral e tendo α = 10%, tem-se que a região de aceitação é constituída pelo intervalo RA = [-1,86, 1,86], isso porque t α 2 =1,86. Como tcal<tα/2 (tcal está fora de RA), podemos rejeitar a hipótese nula, ou seja, a hipótese de que ao nível de 10% de significância pode-se afirmar que a média populacional pode ser aproximadamente 70. O Intervalo de confiança para estimativa de μ com σ desconhecido é: IC : x−t α 2 s √n <μ<x+t α 2 s √n IC :58,89−1,86 14 ,95 √9 <μ<58,89+1,86 14 ,95 √9 IC :49,62<μ<68,16 Diante disso, devemos rejeitar a hipótese da média populacional ser aproximadamente 70 a um nível de 10% de significância. c) Agora temos que encontrar o valor crítico t α 2 correspondente a um nível de confiança de 95%. Ao consultar a tabela t de Student para gl=8, considerando a distribuição bicaudal, temos: t (8;0,025)=2,306 Nesta etapa devemos calcular o tcalc para a média populacional fornecida na letra “c” (75). tcalc= x−μ s √n =58,89−75 14 ,95 √9 =−16,11 4,983 =−3,233 Considerando o teste bilateral e tendo α = 5%, tem-se que a região de aceitação é constituída pelo intervalo RA = [-2,306, 2,306], isso porque t α 2 =2,306. Como tcal<tα/2 (tcal está fora de RA), podemos rejeitar a hipótese nula, ou seja, a hipótese de que ao nível de 5% de significância pode-se afirmar que a média populacional pode ser aproximadamente 75. O Intervalo de confiança para estimativa de μ com σ desconhecido é: IC : x−t α 2 s √n <μ<x+t α 2 s √n IC :58,89−2,306 14 ,95 √9 <μ<58,89+2,306 14 ,95 √9 IC :47 ,40<μ<70,38 Diante disso, devemos rejeitar a hipótese da média populacional ser aproximadamente 75 a um nível de 5% de significância. QUESTÃO 03. a) Como M=22, temos que o consumidor resolveu comprar 4400 exemplares deste modelo T. Além disso, exatamente 264 apresentaram defeitos dentro de um ano de uso. Isto representa uma proporção de ^p= 12 M 200 M , ou seja, ^p= 264 4400=0,06. Inicialmente, vamos considerar que os dados relacionados à proporção apresentam distribuição aproximadamente normal. Para este tipo de problema deve ser aplicado um teste unilateral à esquerda (teste para a proporção populacional), o qual tem as seguintes hipóteses: { H 0: p=p0 H 1: p< p0 →{ H 0: p=0,05 H 1: p<0,05 Esse teste tem por finalidade verificar se as unidades fabricadas por uma determinada fabricante não só diferem de p0, mas também se é menor do que μ0. Logo, podemos usar a equação abaixo para determinar a estatística de teste: Zcal=√n ^p−p0 √ p0(1−p0) =√4400 0,06−0,05 √0,05 (1−0,05) =3,044 Como o teste é unilateral a esquerda e α=0,01, a região de não rejeição (RNR) é: P (Z ≥ Zα)=1−α=1−0,01=0,99 Diante disso, temos que Zα=−2,32635 (calculado no Excel usando a função “INV.NORMP.N”, mas pode ser observado na Tabela da Distribuição Normal Padrão), logo Zcal>Zα. Então, para o nível de significância de 0,01 (1%), Zcal>Zα, então não devemos rejeitar a hipótese nula, ou seja, a hipótese de que as unidades fabricadas por uma determinada fabricante são diferentes de p0. Conclusão: A afirmação feita pela fabricante deve ser rejeitada (o modelo T tem probabilidade menor do que 5% de apresentar defeitos no primeiro ano de uso). b) Independentemente do valor de x (que está associado ao número de matrícula “M” e será sempre positivo) a proporção de defeitos dentro de um ano de uso será sempre ^p=0,06. Se reduzirmos o valor de “x”, o Zcal reduzirá mais seguirá positivo, portanto, para o nível de significância de 0,01 (1%), Zcal>Zα, então não devemos rejeitar a hipótese nula, ou seja, afirmação feita pela fabricante deve ser rejeitada (o modelo T tem probabilidade menor do que 5% de apresentar defeitos no primeiro ano de uso). Se considerarmos que este problema deve ser aplicado um teste unilateral à direita (teste para a proporção populacional), o qual tem as seguintes hipóteses: { H 0: p=p0 H 1: p> p0 →{ H 0: p=0,05 H 1: p>0,05 Como o teste é unilateral a direita e α=0,01, a região de não rejeição (RNR) é: P (Z ≤ Zα)=1−α=1−0,01=0,99 Diante disso, temos que Zα=2,32635 (calculado no Excel usando a função “INV.NORMP.N”, mas pode ser observado na Tabela da Distribuição Normal Padrão). Podemos usar esse valor para definir o valor de “n” e consequentemente o valor de “M”. Independentemente do valor de x (que está associado ao número de matrícula “M” e será sempre positivo) a proporção de defeitos dentro de um ano de uso será sempre ^p=0,06. n= ( Zcal ^p−p0 √ p0(1−p0)) 2 = ( 2,32635 0,06−0,05 √0,05 (1−0,05)) 2 =2570,65 M= n 200=2570,65 200 =12,85 Portanto, para “x” maior ou igual a 13, devemos rejeitar a hipótese nula e aceitar que o modelo T tem probabilidade maior do que 5% de apresentar defeitos no primeiro ano de uso. Se x pudesse assumir valores negativos, a hipótese da fabricante pudesse ser aceita. QUESTÃO 04. a) Devemos calcular o coeficiente de correlação de Pearson usando a equação abaixo e para fins de simplicidade, utilizaremos a Tabela 1 (as informações em negrito representam a soma dos dados da respectiva coluna). r= n∑ i=1 n xi yi−(∑ i=1 n xi)(∑ i=1 n yi) √n∑ i=1 n xi 2−(∑ i=1 n xi) 2 √n∑ i=1 n yi 2−(∑ i=1 n yi) 2 Tabela 1. Dados usados nos cálculos. X Y XiY i xi 2 yi 2 -2,00 3,30 -6,60 4,00 10,89 -0,40 2,00 -0,80 0,16 4,00 1,00 1,20 1,20 1,00 1,44 0,00 1,00 0,00 0,00 1,00 2,00 -2,00 -4,00 4,00 4,00 5,00 -3,00 -15,00 25,00 9,00 7,50 -3,10 -23,25 56,25 9,61 8,00 -4,00 -32,00 64,00 16,00 21,10 -4,60 -80,45 154,41 55,94 r= 8∙ (−80,45)−21,10∙(−4 ,60) √8∙154 ,41−(21,10) 2√8∙55,94−(−4 ,60) 2 r=−546,54 580,391 =−0,942 Notamos que há uma correlação forte negativa entre as variáveis analisadas. Para determinar a equação da reta usando mínimos quadrados, temos que resolver o sistema de equações, denominado “equações normais” do problema, cujas incógnitas são os parâmetros a e b da equação da reta y=a+bx (detalhes sobre a dedução deste sistema pode ser visto em http://www.decom.ufop.br/prof/marcone/Disciplinas/MetodosNumericoseEstatisticos/ QuadradosMinimos.pdf). Além disso, para fins de simplicidade na realização dos cálculos, usaremos a Tabela 1. { na+(∑ i=1 n xi)b=∑ i=1 n yi (∑ i=1 n xi)a+(∑ i=1 n xi 2)b=∑ i=1 n xi∙ yi Com os dados da Tabela 1, podemos montar e resolver o sistema de equações para determinar os parâmetros da equação da reta. { 8a+21,10b=−4 ,60 21,10a+154 ,41b=−80,45(1) Multiplicando a primeira equação (1ª linha) por “-21,10” e a segunda equação (2ª linha) por 8, temos: { −168,8a−445,21b=97,06 168,8a+1235,28b=−643,6 Somando as equações anteriores, membro a membro, temos o valor de “b”. b=−546,54 790,07 =−0,692 Agora podemos substituir o valor calculado para “b” na primeira equação de (1) para determinar “a”. a=−4 ,60−21,10∙(−0,692) 8 =1,25 Então podemos escrever a equação da reta como y=1,25−0,692 x. A Figura 1 representa as variáveis analisadas (gráfico de dispersão) e a reta obtida por meio da aplicação do método de mínimos quadrados. -4.00 -2.00 0.00 2.00 4.00 6.00 8.00 10.00 -5.00 -4.00 -3.00 -2.00 -1.00 0.00 1.00 2.00 3.00 4.00 Y Y previsto x y Figura 1. Variáveis dependente e independente e a reta obtida por meio da aplicação de mínimos quadrados. b) Devemos calcular o coeficiente de correlação de Pearson usando a equação abaixo e para fins de simplicidade, utilizaremos a Tabela 2 (as informações em negrito representam a soma dos dados da respectiva coluna). r= n∑ i=1 n xi yi−(∑ i=1 n xi)(∑ i=1 n yi) √n∑ i=1 n xi 2−(∑ i=1 n xi) 2 √n∑ i=1 n yi 2−(∑ i=1 n yi) 2 Tabela 1. Dados usados nos cálculos. X Y XiY i xi 2 yi 2 0,80 3,50 2,80 0,64 12,25 1,10 -0,40 -0,44 1,21 0,16 4,69 4,50 21,11 22,00 20,25 2,40 -1,10 -2,64 5,76 1,21 6,20 9,60 59,52 38,44 92,16 3,70 0,80 2,96 13,69 0,64 6,00 8,20 49,20 36,00 67,24 24,89 25,10 132,51 117,74 193,91 r= 7∙132,51−24 ,89∙25,10 √7∙117,74−(24 ,89) 2√7∙193,91−(25,10) 2 r=302,799 385,814 =0,785 Notamos que há uma correlação positiva entre as variáveis analisadas. Para determinar a equação da reta usando mínimos quadrados, temos que resolver o sistema de equações, denominado “equações normais” do problema, cujas incógnitas são os parâmetros a e b da equação da reta y=a+bx (detalhes sobre a dedução deste sistema pode ser visto em http://www.decom.ufop.br/prof/marcone/Disciplinas/MetodosNumericoseEstatisticos/ QuadradosMinimos.pdf). Além disso, para fins de simplicidade na realização dos cálculos, usaremos a Tabela 2. { na+(∑ i=1 n xi)b=∑ i=1 n yi (∑ i=1 n xi)a+(∑ i=1 n xi 2)b=∑ i=1 n xi∙ yi Com os dados da Tabela 2, podemos montar e resolver o sistema de equações para determinar os parâmetros da equação da reta. { 7 a+24 ,89b=25,10 24 ,89a+117,74 b=132,51(1) Multiplicando a primeira equação (1ª linha) por “-24,89” e a segunda equação (2ª linha) por 7, temos: { −174 ,233a−619,533b=−624 ,7 49 174 ,233a+824 ,180b=927,548 Somando as equações anteriores, membro a membro, temos o valor de “b”. b= 302,799 204 ,6 47 =1,480 Agora podemos substituir o valor calculado para “b” na primeira equação de (1) para determinar “a”. a=25,10−24 ,89∙(1,480) 7 =−1,675 Então podemos escrever a equação da reta como y=−1,675+1,48 x. A Figura 2 representa as variáveis analisadas (gráfico de dispersão) e a reta obtida por meio da aplicação do método de mínimos quadrados. 0.00 1.00 2.00 3.00 4.00 5.00 6.00 7.00 -2.00 0.00 2.00 4.00 6.00 8.00 10.00 12.00 Y Y previsto Eixo x Eixo y Figura 2. Variáveis dependente e independente e a reta obtida por meio da aplicação de mínimos quadrados. Apesar do coeficiente de correlação e Person ter dado relativamente forte (r > 0,5), a curva de dispersão indica que o melhor ajuste é uma função polinomial. De fato, quando usamos o Excel para fazer regressão linear e regressão polinomial nestes dados, notamos que a regressão polinomial ( y=0,734 x 2−3,672 x+4,296) apresenta um melhor desempenho (os resultados estão apresentados na Figura 3. É possível notar que há um aumento no coeficiente de determinação, o qual é o quadrado do coeficiente de correção de Pearson. 0.00 1.00 2.00 3.00 4.00 5.00 6.00 7.00 -2.00 0.00 2.00 4.00 6.00 8.00 10.00 12.00 f(x) = 1.47961299238646 x − 1.67545464916221 R² = 0.61596022972108 f(x) = 0.733989618278681 x² − 3.67169975017217 x + 4.29574223869902 R² = 0.925541846224732 Eixo x Eixo y UNIVERSIDADE FEDERAL DE OURO PRETO - ICEA - DECEA Estat´ıstica e Probabilidade - CEA020 - PER´IODO LETIVO DE 2021-1 3ª Lista de CEA307 Professor: Hugo Fonseca Ara´ujo Data: 06/06/2022 Respostas sem os respectivos c´alculos ou justificativas n˜ao ser˜ao consideradas. Instru¸c˜oes: Resolva a prova a m˜ao, escaneie ou fotografe as p´aginas com as respostas das quest˜oes e submeta no local indicado pela plataforma Moodle at´e segunda-feira, dia 13 de junho de 2022 `as 23:59h. Em caso de problemas, envie para o e-mail hugo.araujo@ufop.edu.br, com o assunto “Lista 3 Estat´ıstica e Probabilidade”. Por favor, n˜ao mande no formato RAR. Use PDF, JPG, JPEG, ZIP ou PNG. Seja M o n´umero formado pelos dois ´ultimos d´ıgitos de seu n´umero de matr´ıcula e N o ´ultimo d´ıgito de sua matr´ıcula. Por exemplo, para a matr´ıcula 12.3.4507, temos M =07 e N=7. Substitua o valor de M ou N antes de fazer as contas, antes de come¸car a resolver cada quest˜ao. Lista A - Se o seu nome come¸ca com a letra J ou menor Quest˜ao 1. (15 pontos) Suponha que uma construtora necessita comprar barras de ferro para realizar uma grande obra. Para que seu projeto seja bem sucedido, ´e muito importante que a resistˆencia m´edia dessas barras seja superior a certo valor µ0. Para decidir comprar ou n˜ao as barras de ferro de determinado fabricante, a construtora realizar´a um teste de hip´otese. Neste teste ela ir´a calcular a resistˆencia m´edia x de 50 barras de ferro fornecidas como amostra pelo fabricante e, a partir deste valor, decidir´a se as barras de ferro `a venda s˜ao adequadas ou n˜ao para os seus prop´ositos. a) Considerando que µ representa a resistˆencia m´edia das barras de ferro produzidas pela empresa, qual das hip´oteses abaixo deve ser utilizada para que se decida pela compra das barras de ferro em caso de rejei¸c˜ao de H0? H0 : µ ≤ µ0 H0 : µ = µ0 H0 : µ ≥ µ0 b) Neste contexto, qual seria o tipo de erro cometido caso a construtora compre as barras de ferro, quando na verdade elas s˜ao inadequadas para o uso? c) Considere a hip´otese que vocˆe escolheu na letra a). Suponha que ela ser´a testada a um n´ıvel de significˆancia α, utilizando o valor x calculado a partir da amostra pela construtora. Considere o valor xc que divide a reta real na regi˜ao que indica rejei¸c˜ao da hip´otese ou aceita¸c˜ao da hip´otese. Se diminu´ımos o valor de α, o valor de xc aumenta ou diminui? Quest˜ao 2. (20 pontos) Seguem abaixo os dados de uma amostra retirada de uma popula¸c˜ao normalmente distribu´ıda: 40 54 + N 70 − N 60 + 2N 86 60 (N + 10)2 4 55 65. a) Calcule a m´edia e a variˆancia da amostra. b) Determine se a hip´otese da m´edia populacional ser aproximadamente 70 deve ou n˜ao ser rejeitada a um n´ıvel de 10% de significˆancia. c) Determine se a hip´otese da m´edia populacional ser maior que 75 deve ou n˜ao ser rejeitada a um n´ıvel de 5% de significˆancia. 1 Quest˜ao 3. (20 pontos) Nesta quest˜ao, x representa um n´umero inteiro. Um fabricante de televisores anunciou que o modelo T tem probabilidade menor do que 5% de apresentar defeitos no primeiro ano de uso. Um consumidor muito desconfiado resolveu comprar 200x exemplares deste modelo T. Dentre estes televisores, exatamente 12x apresentaram defeitos dentro de um ano de uso. a) Suponha que x = M. A um n´ıvel de 1% de significˆancia, a afirma¸c˜ao do fabricante deve ser rejeitada? b) Para quais valores de x a afirma¸c˜ao acima deveria ser rejeitada? Para quais valores deveria ser aceita? Quest˜ao 4. (35 pontos) a) Considere o seguinte conjunto de pares de dados (x, y): (−2.0, 3.3) (−0.4, 2.0) (1.0, 1.2) (N − 2, 3 − N) (N, 2 − 2N) (5.0, −3.0) (7.5, −3.1) (8.0, −4). 1. Calcule o coeficiente de correla¸c˜ao linear de Pearson desse conjunto de dados e esboce estes pontos em um diagrama de dispers˜ao. 2. Utilizando o m´etodo dos m´ınimos quadrados, encontre a reta que melhor aproxima este conjunto de dados. b) Considere o seguinte conjunto de pares de dados (x, y): (−0.8, 3.5) (1.1, −0.4) ( √ N + 20, 4.5) (2.4, −1.1) (0.1 · N + 6, 9.6) (3.7, 0.8) (6.0, 8.2) 1. Calcule o coeficiente de correla¸c˜ao linear de Pearson desse conjunto de dados e esboce estes pontos em um diagrama de dispers˜ao. 2. Utilizando o m´etodo dos m´ınimos quadrados, encontre a reta que melhor aproxima este conjunto de dados. 3. Considerando o valor do coeficiente de correla¸c˜ao linear e o diagrama de dispers˜ao desenhado, discuta a razoabilidade da aproxima¸c˜ao linear encontrada no item 2. Que outro tipo de correla¸c˜ao parece mais adequada no entendimento deste conjunto de dados? Quest˜ao 5. (10 pontos) Fa¸ca uma pequena reda¸c˜ao observando como os estudos de probabilidade que realizamos na primeira parte do curso s˜ao importantes nos estudos de inferˆencia estat´ıstica que realizamos na parte final deste curso. Dˆe exemplos que ilustrem o seu coment´ario. 2