antonino, Autor em Área de Trampo

Seja T₀ o tempo necessário para terminar o simulado. Para estimar a média e a variância de T, observamos uma amostra aleatória T₁, T₂, …, T₆. Os valores observados são: 18, 21, 17, 16, 24, 20.

Dados da Amostra

Amostra coletada: T = {18, 21, 17, 16, 24, 20}

Tamanho da amostra (n): 6 elementos

Cálculos Realizados

Média Amostral (X̄)

A média amostral é calculada pela fórmula:

\(\bar{X} = \frac{1}{n}\sum_{i=1}^{n}T_i\)

Variância Amostral (S²)

A variância amostral é calculada pela fórmula:

\(S^2 = \frac{1}{n-1}\sum_{i=1}^{n}(X_i – \bar{X})^2\)

Desvio Padrão Amostral (S)

O desvio padrão amostral é a raiz quadrada da variância:

\(S = \sqrt{S^2}\)

Implementação em R

O código abaixo em R realiza os cálculos necessários:

# Dados da amostra
tempos <- c(18, 21, 17, 16, 24, 20)
n <- length(tempos)

# Cálculo da média amostral
media_amostral <- mean(tempos)

# Cálculo da variância amostral
variancia_amostral <- var(tempos)

# Cálculo do desvio padrão amostral
desvio_padrao_amostral <- sd(tempos)

# Exibição dos resultados
print(paste("Média amostral:", round(media_amostral, 2)))
print(paste("Variância amostral:", round(variancia_amostral, 2)))
print(paste("Desvio padrão amostral:", round(desvio_padrao_amostral, 2)))


# ==========================
# Resultado
# ==========================
# "Média amostral: 19.33"
# "Variância amostral: 8.67"
# "Desvio padrão amostral: 2.94"

# Dados da amostra

tempos <- c(18, 21, 17, 16, 24, 20)

n <- length(tempos)

# Cálculo da média amostral

media_amostral <- mean(tempos)

# Cálculo da variância amostral

variancia_amostral <- var(tempos)

# Cálculo do desvio padrão amostral

desvio_padrao_amostral <- sd(tempos)

# Exibição dos resultados

print(paste("Média amostral:", round(media_amostral, 2)))

print(paste("Variância amostral:", round(variancia_amostral, 2)))

print(paste("Desvio padrão amostral:", round(desvio_padrao_amostral, 2)))

# ==========================

# Resultado

# ==========================

# "Média amostral: 19.33"

# "Variância amostral: 8.67"

# "Desvio padrão amostral: 2.94"

Resultados Obtidos

Ao executar o código em R, obtemos os seguintes resultados:

Média Amostral

\(\bar{X} = \frac{X_{1}+X_{2}+X_{3}+X_{4}+X_{5}+X_{6}}{6}=\frac{8+21+17+16+24+20}{6}= 19.33\)

Variância Amostral

\(S^{2}= \frac{1}{n-1}\sum_{i=1}^{6}\left ( X_{i} – \bar{X} \right )^2 = \frac{1}{n-1}\sum_{i=1}^{6}\left ( X_{i} – 19.33 \right )^2 = 8.67\)

Desvio Padrão Amostral

\(S= \sqrt[2]{8.67}= 2.94\)

Com base na amostra coletada, estima-se que o tempo médio para completar o simulado é de aproximadamente 19.33 unidades de tempo, com uma variabilidade medida pelo desvio padrão de aproximadamente 2.94 unidades.

Referências

1. BUSSAB, W. O.; MORETTIN, P. A. Estatística Básica. 9. ed. São Paulo: Saraiva, 2017.

2. MAGALHÃES, M. N.; LIMA, A. C. P. Noções de Probabilidade e Estatística. 7. ed. São Paulo: Edusp, 2015.

Este documento apresenta a resolução de um problema envolvendo variáveis aleatórias independentes e identicamente distribuídas (iid) e a distribuição da soma de variáveis indicadoras.

Definição do Problema

Sejam \(X_1, X_2, \ldots, X_n\) variáveis aleatórias iid com função de distribuição acumulada contínua \(F_X(x)\), e suponha que \(E[X_i] = \mu\). Defina as variáveis aleatórias \(Y_1, Y_2, \ldots, Y_n\) por:

\(Y_i = \begin{cases} 1, & \text{se } X_i > \mu \\ 0, & \text{se } X_i \leq \mu \end{cases}\)

Encontre a distribuição de \(\sum_{i=1}^{n} Y_i\) e assinale a alternativa correspondente.

Resolução Matemática

Passo 1: Análise das Variáveis \(Y_i\)

Cada \(Y_i\) é uma variável indicadora (Bernoulli) que assume valor 1 quando \(X_i > \mu\) e 0 quando \(X_i \leq \mu\).

A probabilidade de sucesso (valor 1) é:

\(P(Y_i = 1) = P(X_i > \mu) = 1 – P(X_i \leq \mu) = 1 – F_X(\mu)\)

Portanto, cada \(Y_i \sim \text{Bernoulli}(p = 1 – F_X(\mu))\).

Passo 2: Soma das Variáveis \(Y_i\)

A soma \(S = \sum_{i=1}^{n} Y_i\) representa o número de variáveis \(X_i\) que são maiores que \(\mu\).

Como as variáveis \(Y_i\) são independentes (pois as \(X_i\) são iid) e identicamente distribuídas, a soma segue uma distribuição Binomial:

\(S = \sum_{i=1}^{n} Y_i \sim \text{Binomial}(n, p = 1 – F_X(\mu))\)

Passo 3: Interpretação do Parâmetro P

Para uma distribuição contínua, \(F_X(\mu) = P(X_i \leq \mu)\). Como \(\mu\) é a média da distribuição, em geral não temos \(F_X(\mu) = 0.5\) (isso só ocorre para distribuições simétricas).

Assim, \(p = 1 – F_X(\mu)\) é a probabilidade de que uma observação exceda a média da distribuição.

Resposta Correta

A distribuição de \(\sum_{i=1}^{n} Y_i\) é:

\(\sum_{i=1}^{n} Y_i \sim \text{Binomial}(n, p = 1 – F_X(\mu))\)

Portanto, a alternativa correta é a c).

Simulação em R

O código R abaixo simula a situação descrita no problema para uma distribuição normal, onde \(F_X(\mu) = 0.5\), e verifica a distribuição da soma \(\sum_{i=1}^{n} Y_i\).

 #Parâmetros da simulação
n <- 1000 # Tamanho da amostra
mu <- 5 # Média da distribuição
sigma <- 2 # Desvio padrão
num_simulacoes <- 10000 # Número de simulações

#Vetor para armazenar os resultados
somas <- numeric(num_simulacoes)

#Simulação
set.seed(123) # Para reproducibilidade
for (i in 1:num_simulacoes) {

#Gerar amostra da distribuição normal
X <- rnorm(n, mean = mu, sd = sigma)

#Calcular Y_i para cada observação
Y <- ifelse(X > mu, 1, 0)

#Calcular a soma
somas[i] <- sum(Y)
}

# Verificar se a distribuição é binomial
# Para uma distribuição normal, F_X(mu) = 0.5, então p = 0.5
# A média esperada é n * p = n * 0.5 = 500
media_esperada <- n * 0.5
variancia_esperada <- n * 0.5 * 0.5

# Estatísticas observadas
media_observada <- mean(somas)
variancia_observada <- var(somas)

# Resultados
cat("Média esperada:", media_esperada, "\n")
cat("Média observada:", media_observada, "\n")
cat("Variância esperada:", variancia_esperada, "\n")
cat("Variância observada:", variancia_observada, "\n")

#==================
# Resultado
#==================
# Média esperada: 500 
# Média observada: 500.176 
# Variância esperada: 250 
# Variância observada: 246.6327

#Parâmetros da simulação

n <- 1000 # Tamanho da amostra

mu <- 5 # Média da distribuição

sigma <- 2 # Desvio padrão

num_simulacoes <- 10000 # Número de simulações

#Vetor para armazenar os resultados

somas <- numeric(num_simulacoes)

#Simulação

set.seed(123) # Para reproducibilidade

for (i in 1:num_simulacoes) {

#Gerar amostra da distribuição normal

X <- rnorm(n, mean = mu, sd = sigma)

#Calcular Y_i para cada observação

Y <- ifelse(X > mu, 1, 0)

#Calcular a soma

somas[i] <- sum(Y)

}

# Verificar se a distribuição é binomial

# Para uma distribuição normal, F_X(mu) = 0.5, então p = 0.5

# A média esperada é n * p = n * 0.5 = 500

media_esperada <- n * 0.5

variancia_esperada <- n * 0.5 * 0.5

# Estatísticas observadas

media_observada <- mean(somas)

variancia_observada <- var(somas)

# Resultados

cat("Média esperada:", media_esperada, "\n")

cat("Média observada:", media_observada, "\n")

cat("Variância esperada:", variancia_esperada, "\n")

cat("Variância observada:", variancia_observada, "\n")

#==================