Este documento apresenta a resolução de um problema envolvendo variáveis aleatórias independentes e identicamente distribuídas (iid) e a distribuição da soma de variáveis indicadoras.
Definição do Problema
Sejam \(X_1, X_2, \ldots, X_n\) variáveis aleatórias iid com função de distribuição acumulada contínua \(F_X(x)\), e suponha que \(E[X_i] = \mu\). Defina as variáveis aleatórias \(Y_1, Y_2, \ldots, Y_n\) por:
Encontre a distribuição de \(\sum_{i=1}^{n} Y_i\) e assinale a alternativa correspondente.
-
- a) \(\sum_{i-1}^{n}Y_i ~ Bernoulli \left ( p=1-F_x\left ( \mu \right ) \right )\)
-
- b) \(\sum_{i-1}^{n}Y_i ~ Bernoulli \left ( p= F_x\left ( \mu \right ) \right )\)
-
- c) \(\sum_{i-1}^{n}Y_i ~ Binomial \left ( n,p= 1-F_x\left ( \mu \right ) \right )\)
-
- d) \(\sum_{i-1}^{n}Y_i ~ Binomial \left ( n,p= F_x\left ( \mu \right ) \right )\)
Resolução Matemática
Passo 1: Análise das Variáveis \(Y_i\)
Cada \(Y_i\) é uma variável indicadora (Bernoulli) que assume valor 1 quando \(X_i > \mu\) e 0 quando \(X_i \leq \mu\).
A probabilidade de sucesso (valor 1) é:
\(P(Y_i = 1) = P(X_i > \mu) = 1 – P(X_i \leq \mu) = 1 – F_X(\mu)\)Portanto, cada \(Y_i \sim \text{Bernoulli}(p = 1 – F_X(\mu))\).
Passo 2: Soma das Variáveis \(Y_i\)
A soma \(S = \sum_{i=1}^{n} Y_i\) representa o número de variáveis \(X_i\) que são maiores que \(\mu\).
Como as variáveis \(Y_i\) são independentes (pois as \(X_i\) são iid) e identicamente distribuídas, a soma segue uma distribuição Binomial:
\(S = \sum_{i=1}^{n} Y_i \sim \text{Binomial}(n, p = 1 – F_X(\mu))\)Passo 3: Interpretação do Parâmetro P
Para uma distribuição contínua, \(F_X(\mu) = P(X_i \leq \mu)\). Como \(\mu\) é a média da distribuição, em geral não temos \(F_X(\mu) = 0.5\) (isso só ocorre para distribuições simétricas).
Assim, \(p = 1 – F_X(\mu)\) é a probabilidade de que uma observação exceda a média da distribuição.
Resposta Correta
A distribuição de \(\sum_{i=1}^{n} Y_i\) é:
\(\sum_{i=1}^{n} Y_i \sim \text{Binomial}(n, p = 1 – F_X(\mu))\)Portanto, a alternativa correta é a c).
Simulação em R
O código R abaixo simula a situação descrita no problema para uma distribuição normal, onde \(F_X(\mu) = 0.5\), e verifica a distribuição da soma \(\sum_{i=1}^{n} Y_i\).
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 |
#Parâmetros da simulação n <- 1000 # Tamanho da amostra mu <- 5 # Média da distribuição sigma <- 2 # Desvio padrão num_simulacoes <- 10000 # Número de simulações #Vetor para armazenar os resultados somas <- numeric(num_simulacoes) #Simulação set.seed(123) # Para reproducibilidade for (i in 1:num_simulacoes) { #Gerar amostra da distribuição normal X <- rnorm(n, mean = mu, sd = sigma) #Calcular Y_i para cada observação Y <- ifelse(X > mu, 1, 0) #Calcular a soma somas[i] <- sum(Y) } # Verificar se a distribuição é binomial # Para uma distribuição normal, F_X(mu) = 0.5, então p = 0.5 # A média esperada é n * p = n * 0.5 = 500 media_esperada <- n * 0.5 variancia_esperada <- n * 0.5 * 0.5 # Estatísticas observadas media_observada <- mean(somas) variancia_observada <- var(somas) # Resultados cat("Média esperada:", media_esperada, "\n") cat("Média observada:", media_observada, "\n") cat("Variância esperada:", variancia_esperada, "\n") cat("Variância observada:", variancia_observada, "\n") #================== # Resultado #================== # Média esperada: 500 # Média observada: 500.176 # Variância esperada: 250 # Variância observada: 246.6327 |