Problema 2 de Variáveis Aleatórias

Este documento apresenta a resolução de um problema envolvendo variáveis aleatórias independentes e identicamente distribuídas (iid) e a distribuição da soma de variáveis indicadoras.

Definição do Problema

Sejam \(X_1, X_2, \ldots, X_n\) variáveis aleatórias iid com função de distribuição acumulada contínua \(F_X(x)\), e suponha que \(E[X_i] = \mu\). Defina as variáveis aleatórias \(Y_1, Y_2, \ldots, Y_n\) por:

\(Y_i = \begin{cases} 1, & \text{se } X_i > \mu \\ 0, & \text{se } X_i \leq \mu \end{cases}\)

Encontre a distribuição de \(\sum_{i=1}^{n} Y_i\) e assinale a alternativa correspondente.

    1. a) \(\sum_{i-1}^{n}Y_i ~ Bernoulli \left ( p=1-F_x\left ( \mu \right ) \right )\)
    1. b) \(\sum_{i-1}^{n}Y_i ~ Bernoulli \left ( p= F_x\left ( \mu \right ) \right )\)
    1. c) \(\sum_{i-1}^{n}Y_i ~ Binomial \left ( n,p= 1-F_x\left ( \mu \right ) \right )\)
    1. d) \(\sum_{i-1}^{n}Y_i ~ Binomial \left ( n,p= F_x\left ( \mu \right ) \right )\)

Resolução Matemática

Passo 1: Análise das Variáveis \(Y_i\)

Cada \(Y_i\) é uma variável indicadora (Bernoulli) que assume valor 1 quando \(X_i > \mu\) e 0 quando \(X_i \leq \mu\).

A probabilidade de sucesso (valor 1) é:

\(P(Y_i = 1) = P(X_i > \mu) = 1 – P(X_i \leq \mu) = 1 – F_X(\mu)\)

Portanto, cada \(Y_i \sim \text{Bernoulli}(p = 1 – F_X(\mu))\).

Passo 2: Soma das Variáveis \(Y_i\)

A soma \(S = \sum_{i=1}^{n} Y_i\) representa o número de variáveis \(X_i\) que são maiores que \(\mu\).

Como as variáveis \(Y_i\) são independentes (pois as \(X_i\) são iid) e identicamente distribuídas, a soma segue uma distribuição Binomial:

\(S = \sum_{i=1}^{n} Y_i \sim \text{Binomial}(n, p = 1 – F_X(\mu))\)

Passo 3: Interpretação do Parâmetro P

Para uma distribuição contínua, \(F_X(\mu) = P(X_i \leq \mu)\). Como \(\mu\) é a média da distribuição, em geral não temos \(F_X(\mu) = 0.5\) (isso só ocorre para distribuições simétricas).

Assim, \(p = 1 – F_X(\mu)\) é a probabilidade de que uma observação exceda a média da distribuição.

Resposta Correta

A distribuição de \(\sum_{i=1}^{n} Y_i\) é:

\(\sum_{i=1}^{n} Y_i \sim \text{Binomial}(n, p = 1 – F_X(\mu))\)

Portanto, a alternativa correta é a c).

Simulação em R

O código R abaixo simula a situação descrita no problema para uma distribuição normal, onde \(F_X(\mu) = 0.5\), e verifica a distribuição da soma \(\sum_{i=1}^{n} Y_i\).