...

p - sisne.org

by user

on
Category: Documents
7

views

Report

Comments

Transcript

p - sisne.org
Estatística II – Antonio Roque – Aula 4
Distribuição de uma proporção amostral
Exemplo Ilustrativo: Suponha que se saiba que em uma certa
população humana uma proporção de pessoas igual a p = 0,08 (8%)
seja cega para cores. Se fizermos uma amostragem aleatória de 150
indivíduos da população, qual a probabilidade de que a proporção de
pessoas dessa amostra que seja cega para cores seja menor que 0,15?
Neste problema, precisamos saber as propriedades da distribuição
amostral da proporção dentro de uma amostra. Já que resolvemos
chamar a proporção da população de p , vamos chamar a proporção de
uma amostra individual de p̂ .
Note que este problema poderia ser resolvido usando-se a distribuição
binomial, pois só existem duas possibilidades para uma pessoa: ou ela
é cega para cores ou não é. No entanto, a sua solução seria mais
trabalhosa e o método usado aqui é mais simples quando as amostras
têm grandes tamanhos.
A construção de uma distribuição amostral para a proporção de uma
amostra é feita da maneira usual: da população, tomam-se todas as
possíveis amostras de um dado tamanho (150 no caso do exemplo) e
calcula-se, para cada uma delas, a proporção p̂ . Com isso, pode-se
construir uma tabela de freqüências para p̂ que é a distribuição
amostral de p̂ .
1
Estatística II – Antonio Roque – Aula 4
Quando o tamanho das amostras é grande, a distribuição amostral de p̂
é aproximadamente normal pelo T.C.L. Os seguintes resultados são
dados sem demonstração: A média da distribuição amostral de p̂ é
igual a µ pˆ = p , a própria proporção da população; e a variância da
2
distribuição amostral de p̂ é igual a σ pˆ =
p(1 − p )
.
n
Um critério normalmente usado para definir quão grande uma amostra
tem que ser para que o T.C.L. seja válido e que a distribuição amostral
de p̂ seja aproximadamente normal é o de que tanto np como
n (1 − p ) sejam maiores que 5 .
Para o problema em questão, o critério acima é satisfeito:
np = 150 x0,08 = 12 e n(1 − p ) = 150 x0,92 = 138 .
Logo, podemos dizer que, neste caso,
p̂
é aproximadamente
normalmente distribuída com média µ pˆ = p = 0,08 e desvio padrão
σ pˆ = σ 2pˆ =
p(1 − p )
0,08x0,92
=
= 0,00049 = 0,0222 .
n
150
Portanto, P( pˆ < 0,15) = P( z < zˆ ) onde
zˆ =
pˆ − p 0,15 − 0,08
=
= 3,15 .
σ pˆ
0,0222
Consultando a tabela, temos que a probabilidade pedida vale: 0,5 +
0,49918 = 0,99918 (99,92 %). Portanto, a probabilidade de se
encontrar uma proporção de pessoas cegas para cores abaixo de 0,15
em uma amostra aleatória de 150 pessoas é quase 1.
2
Estatística II – Antonio Roque – Aula 4
Mais um resultado a ser dado sem demonstração:
Se amostras aleatórias de tamanhos n1 e n2 são tomadas de duas
populações distintas cujas proporções de casos com a característica de
interesse sejam p1 e p2 respectivamente, a distribuição da diferença
entre as proporções amostrais, pˆ 1 − pˆ 2 , é aproximadamente normal com
média µ pˆ 1 − pˆ 2 = p1 − p2 e variância σ 2pˆ
1 − pˆ 2
=
p1 (1 − p1 ) p2 (1 − p2 )
+
,
n1
n2
quando n1 e n2 são grandes.
Exemplo 1: Suponha que a proporção de usuários freqüentes de drogas
em uma população seja de 0,50, enquanto que a proporção em outra
população seja de 0,33. Qual é a probabilidade de que amostras de
tamanho 100 das duas populações tenham um valor pˆ1 − pˆ 2 maior que
0,30?
Assumimos que a distribuição amostral de pˆ 1 − pˆ 2 é aproximadamente
normal
σ
2
pˆ1 − pˆ 2
=
com
média
µ pˆ1 − pˆ 2 = p1 − p2 = 0,50 − 0,33 = 0,17
e
0,5 x 0,5 0,33 x 0,67
+
= 0,004711 .
100
100
Logo, z =
( pˆ 1 − pˆ 2 ) − ( p1 − p2 ) = 0,30 − 0,17 = 1,89
σ p2ˆ1 − pˆ 2
0,004711
.
E a área sob a curva normal padrão à direita de z = 1,89 vale
0,5 − 0,4706 = 0,0294 (2,94 %).
3
Estatística II – Antonio Roque – Aula 4
Exemplo 2: Em uma certa população de adolescentes, sabe-se que 10%
dos rapazes são obesos. Se a mesma proporção de garotas da população
for obesa, qual a probabilidade de que uma amostra aleatória de 250
rapazes e 200 garotas tenha pˆ 1 − pˆ 2 ≥ 0,06 ?
Assumimos que a distribuição amostral de pˆ 1 − pˆ 2 é aproximadamente
normal. Se a proporção de obesos for a mesma nas duas populações, a
média da distribuição de pˆ 1 − pˆ 2 será 0 ( p1 − p 2 = 0) e a sua variância
será σ p2ˆ − pˆ =
1
2
Portanto, z =
p1 (1 − p1 ) p 2 (1 − p 2 ) 0,1x0,9 0,1x 0,9
+
=
+
= 0,00081 .
n1
n2
250
200
0,06 − 0
= 2,11 .
0,00081
E a área sob a curva normal padrão à direita de z = 2,11 vale
0,5 − 0,4826 = 0,0174 (1,74 %).
4
Estatística II – Antonio Roque – Aula 4
Exercícios sobre Distribuições Amostrais
1. O gerente de uma dada agência bancária sabe que o saldo médio dos
clientes da sua agência é de R$ 520 com um desvio padrão de R$
280. Se for escolhida uma amostra aleatória de 50 clientes da
agência, qual a probabilidade de que a média dos seus saldos médios
seja maior do que R$ 550?
2. Suponha que se saiba que as durações das chamadas telefônicas
interurbanas sejam distribuídas de forma aproximadamente normal
com média de 9 minutos com desvio padrão de 3 minutos. Se a
companhia telefônica escolher uma amostra aleatória de 20
chamadas telefônicas, qual a probabilidade de que a média das suas
durações esteja entre 8 e 10 minutos?
3. A distribuição dos tempos gastos por clientes de uma agência
bancária nos seus caixas eletrônicos é aproximadamente normal
com média de 3,4 minutos e desvio padrão de 1,2 minuto. Em um
dado momento, encontram-se 9 clientes usando caixas eletrônicos
na agência bancária. Qual a probabilidade de que o seu tempo médio
de uso dos caixas eletrônicos seja maior que 3,5 minutos? E qual a
probabilidade de que ele seja menor que 2 minutos?
4. Os alunos do Cursinho A tiraram nota média na prova de
matemática do vestibular de 5,5 com desvio padrão de 2,1 e os
alunos do Cursinho B tiraram nota média na mesma prova de 4,8
com desvio padrão de 2,0. Selecionam-se duas amostras aleatórias
de alunos, 35 do Cursinho A e 37 do Cursinho B. Qual a
5
Estatística II – Antonio Roque – Aula 4
probabilidade de que a diferença entre as suas notas médias na prova
de matemática,
x A − xB
seja maior que 2?
5. O número de horas semanais que duas populações, uma de
estudantes de graduação e outra de estudantes de pós-graduação,
passa na cantina de uma faculdade é distribuído de maneira
aproximadamente normal para as duas populações. A média de
horas/semana da população de estudantes de graduação é de 12 hs
com desvio padrão de 4 hs. A média de horas/semana da população
de estudantes de pós-graduação é de 7 horas com desvio padrão de 3
horas. Selecionam-se duas amostras aleatórias de 10 estudantes de
cada população. Qual a probabilidade de que a diferença entre as
médias de horas semanais gastas na cantina pelas duas amostras seja
menor do que 2 hs?
6. Com base em estatísticas históricas, sabe-se que 60% das compras
feitas com cartão de crédito em um supermercado são para quantias
acima de 100 reais. Se for escolhida uma amostra aleatória de 100
compras feitas com cartão de crédito em um certo dia no
supermercado, qual a probabilidade de que a proporção de compras
acima de 100 reais esteja entre 50% e 70%?
7. As proporções dos carros produzidos pelas fábricas A e B que
apresentam defeito durante o primeiro ano de uso são,
respectivamente, iguais a 8% e a 5%. Se forem selecionadas
amostras aleatórias de carros produzidos pelas duas fábricas com
tamanhos iguais a 230 e 250 respectivamente, qual a probabilidade
de que a diferença entre as proporções amostrais de carros com
defeito no primeiro ano de uso seja maior do que 1%?
6
Fly UP