Compreendendo a Notação: $\prod_{i=1}^{n} f_{x_{i}} (x_{i})$

Esta notação é fundamental em estatística e probabilidade, especialmente quando trabalhamos com variáveis aleatórias independentes.

O que significa este símbolo?

A expressão $\prod_{i=1}^{n} f_{x_{i}} (x_{i})$ representa o produto das funções de densidade de probabilidade de n variáveis aleatórias.

Π (Pi maiúsculo): enquanto Σ faz somas (somatório), o símbolo Π faz multiplicações (produtório).
i=1 e n: Limites do produto (de i=1 até i=n)
fₓᵢ(xᵢ): Função de Densidade de Probabilidade (PDF) da variável Xᵢ avaliada no ponto xᵢ

Contexto e Aplicação

Esta expressão aparece no contexto de variáveis aleatórias independentes. Quando temos n variáveis aleatórias independentes, a densidade conjunta é o produto das densidades individuais:

$f_{X_1, X_2, \ldots, X_n} (x_1, x_2, \ldots, x_n) = \prod_{i=1}^{n} f_{X_i} (x_i)$

Se as variáveis forem Idependentes e Identicamente Distribuídas (i.i.d.), a fórmula simplifica para:

$f_{X_1, X_2, \ldots, X_n} (x_1, x_2, \ldots, x_n) = \prod_{i=1}^{n} f(x_i)$

Exemplo Prático com R

Lançamentos de Moeda

Suponha que temos 3 lançamentos de uma moeda justa (n=3). Seja Xᵢ uma variável que representa o resultado do i-ésimo lançamento.

# Função de massa de probabilidade para cada lançamento

f <- function(x_i) {
  return(0.5)  # Probabilidade igual para cara (1) ou coroa (0)
}

# Calculando a probabilidade conjunta de obter (Cara, Coroa, Cara)
probabilidade_conjunta <- f(1) * f(0) * f(1)

# Resultado
print(paste("Probabilidade conjunta:", probabilidade_conjunta))

# Função de massa de probabilidade para cada lançamento

f <- function(x_i) {

return(0.5) # Probabilidade igual para cara (1) ou coroa (0)

}

# Calculando a probabilidade conjunta de obter (Cara, Coroa, Cara)

probabilidade_conjunta <- f(1) * f(0) * f(1)

# Resultado

print(paste("Probabilidade conjunta:", probabilidade_conjunta))

Este código retornará 0.125, que é igual a 1/8, o resultado esperado para três lançamentos independentes de uma moeda justa.

Variáveis Normais Independentes

Para variáveis normalmente distribuídas com parâmetros diferentes:

# Densidades de três variáveis normais independentes
f1 <- function(x) { dnorm(x, mean = 0, sd = 1) }    # N(0,1)
f2 <- function(x) { dnorm(x, mean = 1, sd = 2) }    # N(1,4)
f3 <- function(x) { dnorm(x, mean = -1, sd = 1.5) } # N(-1,2.25)

# Calculando a densidade conjunta no ponto (0.5, 1.2, -0.3)
x1 <- 0.5
x2 <- 1.2
x3 <- -0.3

densidade_conjunta <- f1(x1) * f2(x2) * f3(x3)

# Resultado
print(paste("Densidade conjunta no ponto (0.5, 1.2, -0.3):", densidade_conjunta))

# Densidades de três variáveis normais independentes

f1 <- function(x) { dnorm(x, mean = 0, sd = 1) } # N(0,1)

f2 <- function(x) { dnorm(x, mean = 1, sd = 2) } # N(1,4)

f3 <- function(x) { dnorm(x, mean = -1, sd = 1.5) } # N(-1,2.25)

# Calculando a densidade conjunta no ponto (0.5, 1.2, -0.3)

x1 <- 0.5

x2 <- 1.2

x3 <- -0.3

densidade_conjunta <- f1(x1) * f2(x2) * f3(x3)

# Resultado

print(paste("Densidade conjunta no ponto (0.5, 1.2, -0.3):", densidade_conjunta))

Explicação do Código

Vamos analisar passo a passo o que este código faz:

1. Definição das Funções de Densidade

f1 <- function(x) { dnorm(x, mean = 0, sd = 1) }    # N(0,1)
f2 <- function(x) { dnorm(x, mean = 1, sd = 2) }    # N(1,4)
f3 <- function(x) { dnorm(x, mean = -1, sd = 1.5) } # N(-1,2.25)

f1 <- function(x) { dnorm(x, mean = 0, sd = 1) } # N(0,1)

f2 <- function(x) { dnorm(x, mean = 1, sd = 2) } # N(1,4)

f3 <- function(x) { dnorm(x, mean = -1, sd = 1.5) } # N(-1,2.25)

Estas linhas definem três funções de densidade de probabilidade para distribuições normais:

f1: Distribuição normal com média 0 e desvio padrão 1 $N(0,1)$
f2: Distribuição normal com média 1 e desvio padrão 2 $N(1,4)$ (variância = 4)
f3: Distribuição normal com média -1 e desvio padrão 1.5 $N(-1,2.25)$ (variância = 2.25)

A função dnorm() em R calcula o valor da função densidade de probabilidade no ponto x.

2. Definição dos Pontos de Avaliação

x1 <- 0.5
x2 <- 1.2
x3 <- -0.3

x1 <- 0.5

x2 <- 1.2

x3 <- -0.3

Estas linhas definem os pontos específicos onde queremos avaliar as densidades:

Avaliamos f1 no ponto x = 0.5
Avaliamos f2 no ponto x = 1.2
Avaliamos f3 no ponto x = -0.3

3. Cálculo da Densidade Conjunta

densidade_conjunta <- f1(x1) * f2(x2) * f3(x3)

1	densidade_conjunta <- f1(x1) * f2(x2) * f3(x3)

Esta é a parte crucial do código. Como as variáveis são independentes, a densidade conjunta é simplesmente o produto das densidades individuais:

$f_{X_1,X_2,X_3}(x_1,x_2,x_3) = f_{X_1}(x_1) \cdot f_{X_2}(x_2) \cdot f_{X_3}(x_3)$

O código calcula esse produto multiplicando os valores das três funções de densidade nos pontos especificados.

4. Exibição do Resultado

print(paste("Densidade conjunta no ponto (0.5, 1.2, -0.3):", densidade_conjunta))

1	print(paste("Densidade conjunta no ponto (0.5, 1.2, -0.3):", densidade_conjunta))

Esta linha exibe o resultado do cálculo, mostrando o valor da densidade conjunta no ponto especificado.

Interpretação do Resultado

O valor resultante representa a densidade de probabilidade conjunta das três variáveis normais independentes no ponto (0.5, 1.2, -0.3).

É importante notar que:

Este valor não é uma probabilidade, mas sim uma densidade de probabilidade
Para variáveis contínuas, valores individuais de densidade não representam probabilidades (que são zero para pontos específicos)
Valores de densidade são usados principalmente para comparações relativas e cálculos de verossimilhança

O valor calculado seria útil em contextos como:

Estimativa de máxima verossimilhança
Cálculo de probabilidades através de integração
Comparação de quão “prováveis” são diferentes conjuntos de valores sob o modelo especificado

Conclusão

O produtório $\prod_{i=1}^{n} f_{x_{i}} (x_{i})$ é uma forma compacta de representar a probabilidade conjunta de eventos independentes, onde cada evento tem sua probabilidade individual dada por sua própria função de densidade. Este conceito é fundamental para estimação por máxima verossimilhança e modelagem estatística baseada na independência entre observações.

Referências

Casella, G., & Berger, R. L. (2002). Statistical Inference.
James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An Introduction to Statistical Learning.

Média e mediana são duas medidas de tendência central fundamentais em estatística.
Ambas fornecem informações sobre o “centro” de um conjunto de dados, contudo uma é mais sensível a dados extremos (outliers).

O que é Média?

A média aritmética é calculada somando todos os valores de um conjunto
de dados e dividindo pelo número de elementos. É representada pela fórmula:

			    \({\color{Red} \sum_{i=1}^{n} x_i} = x_{1} + x_{2} + .. + x_{n}\)

                \(\bar{x}_{n} =\frac{1}{n} \times {\color{Red} \sum_{i=1}^{n} x_i} = \frac{{\color{Red} \sum_{i=1}^{n} x_i}}{n}\)

                \({\color{Red} S_{n}} = x_{1} + x_{2} + .. + x_{n}\)

				\(\bar{x} = \frac{1}{n} \times {\color{Red} S_{n}} = \frac{{\color{Red} S_{n}}}{n}\)

Onde:

$\bar{x}$ é a média
$x_i$ são os valores individuais
$n$ é o número de elementos no conjunto
$\sum_{i=1}^{n} x_i$ ou $S_{n}$ representa o somatório
$i$ representa um indice ou contador que indica a posição de cada elemento na sequência de dados.

Exemplo com dados reais

Vamos calcular a média dos salários da planilha “media”:

Funcionários	Salários (mil R$)
1	13
2	15
3	20
4	13
5	20
6	13
7	13
8	30
9	16
10	20

Cálculo da média:

Soma = 13 + 15 + 20 + 13 + 20 + 13 + 13 + 30 + 16 + 20 = 173

Número de elementos = 10

Média = 173 ÷ 10 = 17.3 mil R$

Em R, podemos calcular assim:

# Dados da planilha "media"
salarios_media <- c(13, 15, 20, 13, 20, 13, 13, 30, 16, 20)

# Cálculo da média
media <- mean(salarios_media)
print(paste("Média dos salários:", media, "mil R$"))

# Resultado: "Média dos salários: 17.3 mil R$"

# Dados da planilha "media"

salarios_media <- c(13, 15, 20, 13, 20, 13, 13, 30, 16, 20)

# Cálculo da média

media <- mean(salarios_media)

print(paste("Média dos salários:", media, "mil R$"))

# Resultado: "Média dos salários: 17.3 mil R$"

O que é Mediana?

A mediana é o valor que divide um conjunto de dados ordenados em duas partes iguais.
Metade dos valores estão abaixo da mediana e metade estão acima.

Mediana de uma População

Para representar a mediana de uma população, é comum usar:

$\tilde{\mu}$ (mu til) – Por analogia com a média populacional $\mu$
$Med$ – Mantendo a mesma abreviatura, mas aplicada à população
$Md$ – Similar ao caso amostral

Conjunto ÍMPAR de elementos

Para um número ímpar de elementos, a mediana é o valor central quando os dados estão ordenados.

Exemplo com a planilha “mediana impar” (11 elementos):

Funcionários	Salários (mil R$)
1	13
2	15
3	20
4	13
5	20
6	13
7	13
8	30
9	16
10	20
11	250

Dados ordenados: 13, 13, 13, 13, 15, 16, 20, 20, 20, 30, 250

Mediana = 16 (o 6º elemento, que divide os 11 elementos em duas partes iguais)

# Dados da planilha "mediana impar"
salarios_impar <- c(13, 15, 20, 13, 20, 13, 13, 30, 16, 20, 250)

# Cálculo da mediana
mediana_impar <- median(salarios_impar)
print(paste("Mediana (conjunto ímpar):", mediana_impar, "mil R$"))

# Verificando o processo manualmente
salarios_ordenados <- sort(salarios_impar)
n <- length(salarios_ordenados)
posicao_mediana <- (n + 1) / 2
print(paste("Dados ordenados:", paste(salarios_ordenados, collapse = ", ")))
print(paste("Posição da mediana:", posicao_mediana))
print(paste("Valor na posição", posicao_mediana, ":", salarios_ordenados[posicao_mediana]))

# Resultado: "Mediana (conjunto ímpar): 16 mil R$"

# Dados da planilha "mediana impar"

salarios_impar <- c(13, 15, 20, 13, 20, 13, 13, 30, 16, 20, 250)

# Cálculo da mediana

mediana_impar <- median(salarios_impar)

print(paste("Mediana (conjunto ímpar):", mediana_impar, "mil R$"))

# Verificando o processo manualmente

salarios_ordenados <- sort(salarios_impar)

n <- length(salarios_ordenados)

posicao_mediana <- (n + 1) / 2

print(paste("Dados ordenados:", paste(salarios_ordenados, collapse = ", ")))

print(paste("Posição da mediana:", posicao_mediana))

print(paste("Valor na posição", posicao_mediana, ":", salarios_ordenados[posicao_mediana]))

# Resultado: "Mediana (conjunto ímpar): 16 mil R$"

Conjunto PAR de elementos

Para um número par de elementos, a mediana é a média dos dois valores centrais.

Exemplo com a planilha “mediana par” (10 elementos):

Funcionários	Salários (mil R$)
1	13
2	15
3	20
4	13
5	20
6	13
7	13
8	30
9	16
10	20

Dados ordenados: 13, 13, 13, 13, 15, 16, 20, 20, 20, 30, 250

Mediana = (15 + 16) ÷ 2 = 15.5 (média do 5º e 6º elementos)

# Dados da planilha "mediana par"
salarios_par <- c(13, 15, 20, 13, 20, 13, 13, 30, 16, 20)

# Cálculo da mediana
mediana_par <- median(salarios_par)
print(paste("Mediana (conjunto par):", mediana_par, "mil R$"))

# Verificando o processo manualmente
salarios_ordenados <- sort(salarios_par)
n <- length(salarios_ordenados)
posicao1 <- n / 2
posicao2 <- n / 2 + 1
print(paste("Dados ordenados:", paste(salarios_ordenados, collapse = ", ")))
print(paste("Posições centrais:", posicao1, "e", posicao2))
print(paste("Valores nas posições:", salarios_ordenados[posicao1], "e", salarios_ordenados[posicao2]))
print(paste("Média dos valores:", (salarios_ordenados[posicao1] + salarios_ordenados[posicao2]) / 2))

# Resultado: "Mediana (conjunto par): 15.5 mil R$"

# Dados da planilha "mediana par"

salarios_par <- c(13, 15, 20, 13, 20, 13, 13, 30, 16, 20)

# Cálculo da mediana

mediana_par <- median(salarios_par)

print(paste("Mediana (conjunto par):", mediana_par, "mil R$"))

# Verificando o processo manualmente

salarios_ordenados <- sort(salarios_par)

n <- length(salarios_ordenados)

posicao1 <- n / 2

posicao2 <- n / 2 + 1

print(paste("Dados ordenados:", paste(salarios_ordenados, collapse = ", ")))

print(paste("Posições centrais:", posicao1, "e", posicao2))

print(paste("Valores nas posições:", salarios_ordenados[posicao1], "e", salarios_ordenados[posicao2]))

print(paste("Média dos valores:", (salarios_ordenados[posicao1] + salarios_ordenados[posicao2]) / 2))

# Resultado: "Mediana (conjunto par): 15.5 mil R$"

Comparação entre Média e Mediana

Média

Vantagens:

Considera todos os valores do conjunto
Fácil de calcular e interpretar
Boa para dados com distribuição simétrica

Desvantagens:

Sensível a valores extremos (outliers)
Pode não representar bem o centro em distribuições assimétricas

Mediana

Vantagens:

Robusta a valores extremos (outliers)
Melhor representante do centro em distribuições assimétricas
Fácil de entender como “o valor do meio”

Desvantagens:

Ignora a magnitude dos outros valores
Pode não ser representativa em conjuntos muito pequenos
Mais difícil de usar em análises estatísticas avançadas

Quando usar cada medida?

Use a média quando: Os dados têm distribuição simétrica e não há valores extremos.

Use a mediana quando: Os dados têm distribuição assimétrica ou contêm valores extremos.

No exemplo dos salários, note como a média (17.3) é maior que a mediana (15.5),
indicando uma assimetria à direita causada por salários mais altos que puxam a média para cima.

Conclusão

Média e mediana são ambas medidas de tendência central importantes, mas respondem a perguntas
diferentes sobre os dados. Enquanto a média representa o “centro de gravidade” do conjunto,
a mediana representa o “valor do meio”. A escolha entre elas depende da distribuição dos dados
e da presença de valores extremos.

Em muitos casos, o ideal é reportar ambas as medidas para ter uma visão mais completa
da distribuição dos dados.

Produtório de Densidades

Compreendendo a Notação: \(\prod_{i=1}^{n} f_{x_{i}} (x_{i})\)

O que significa este símbolo?

Contexto e Aplicação

Exemplo Prático com R

Lançamentos de Moeda

Variáveis Normais Independentes

Explicação do Código

1. Definição das Funções de Densidade

2. Definição dos Pontos de Avaliação

3. Cálculo da Densidade Conjunta

4. Exibição do Resultado

Interpretação do Resultado

Conclusão

Referências

Média e Mediana: Conceitos e Aplicações

O que é Média?

Exemplo com dados reais

O que é Mediana?

Mediana de uma População

Conjunto ÍMPAR de elementos

Conjunto PAR de elementos

Comparação entre Média e Mediana

Média

Mediana

Quando usar cada medida?

Conclusão