Produtório de Densidades

dados

Compreendendo a Notação: \(\prod_{i=1}^{n} f_{x_{i}} (x_{i})\)

Esta notação é fundamental em estatística e probabilidade, especialmente quando trabalhamos com variáveis aleatórias independentes.

O que significa este símbolo?

A expressão \(\prod_{i=1}^{n} f_{x_{i}} (x_{i})\) representa o produto das funções de densidade de probabilidade de n variáveis aleatórias.

  • Π (Pi maiúsculo): enquanto Σ faz somas (somatório), o símbolo Π faz multiplicações (produtório).
  • i=1 e n: Limites do produto (de i=1 até i=n)
  • fₓᵢ(xᵢ): Função de Densidade de Probabilidade (PDF) da variável Xᵢ avaliada no ponto xᵢ

Contexto e Aplicação

Esta expressão aparece no contexto de variáveis aleatórias independentes. Quando temos n variáveis aleatórias independentes, a densidade conjunta é o produto das densidades individuais:

\(f_{X_1, X_2, \ldots, X_n} (x_1, x_2, \ldots, x_n) = \prod_{i=1}^{n} f_{X_i} (x_i)\)

Se as variáveis forem Idependentes e Identicamente Distribuídas (i.i.d.), a fórmula simplifica para:

\(f_{X_1, X_2, \ldots, X_n} (x_1, x_2, \ldots, x_n) = \prod_{i=1}^{n} f(x_i)\)

Exemplo Prático com R

Lançamentos de Moeda

Suponha que temos 3 lançamentos de uma moeda justa (n=3). Seja Xᵢ uma variável que representa o resultado do i-ésimo lançamento.

Este código retornará 0.125, que é igual a 1/8, o resultado esperado para três lançamentos independentes de uma moeda justa.

Variáveis Normais Independentes

Para variáveis normalmente distribuídas com parâmetros diferentes:

Explicação do Código

Vamos analisar passo a passo o que este código faz:

1. Definição das Funções de Densidade

Estas linhas definem três funções de densidade de probabilidade para distribuições normais:

  • f1: Distribuição normal com média 0 e desvio padrão 1 \(N(0,1)\)
  • f2: Distribuição normal com média 1 e desvio padrão 2 \(N(1,4)\) (variância = 4)
  • f3: Distribuição normal com média -1 e desvio padrão 1.5 \(N(-1,2.25)\) (variância = 2.25)

A função dnorm() em R calcula o valor da função densidade de probabilidade no ponto x.

2. Definição dos Pontos de Avaliação

Estas linhas definem os pontos específicos onde queremos avaliar as densidades:

  • Avaliamos f1 no ponto x = 0.5
  • Avaliamos f2 no ponto x = 1.2
  • Avaliamos f3 no ponto x = -0.3

3. Cálculo da Densidade Conjunta

Esta é a parte crucial do código. Como as variáveis são independentes, a densidade conjunta é simplesmente o produto das densidades individuais:

\(f_{X_1,X_2,X_3}(x_1,x_2,x_3) = f_{X_1}(x_1) \cdot f_{X_2}(x_2) \cdot f_{X_3}(x_3)\)

O código calcula esse produto multiplicando os valores das três funções de densidade nos pontos especificados.

4. Exibição do Resultado

Esta linha exibe o resultado do cálculo, mostrando o valor da densidade conjunta no ponto especificado.

Interpretação do Resultado

O valor resultante representa a densidade de probabilidade conjunta das três variáveis normais independentes no ponto (0.5, 1.2, -0.3).

É importante notar que:

  • Este valor não é uma probabilidade, mas sim uma densidade de probabilidade
  • Para variáveis contínuas, valores individuais de densidade não representam probabilidades (que são zero para pontos específicos)
  • Valores de densidade são usados principalmente para comparações relativas e cálculos de verossimilhança

O valor calculado seria útil em contextos como:

  • Estimativa de máxima verossimilhança
  • Cálculo de probabilidades através de integração
  • Comparação de quão “prováveis” são diferentes conjuntos de valores sob o modelo especificado

Conclusão

O produtório \(\prod_{i=1}^{n} f_{x_{i}} (x_{i})\) é uma forma compacta de representar a probabilidade conjunta de eventos independentes, onde cada evento tem sua probabilidade individual dada por sua própria função de densidade. Este conceito é fundamental para estimação por máxima verossimilhança e modelagem estatística baseada na independência entre observações.

Referências

  • Casella, G., & Berger, R. L. (2002). Statistical Inference.
  • James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An Introduction to Statistical Learning.

Média e Mediana: Conceitos e Aplicações

população

Média e mediana são duas medidas de tendência central fundamentais em estatística.
Ambas fornecem informações sobre o “centro” de um conjunto de dados, contudo uma é mais sensível a dados extremos (outliers).

O que é Média?

A média aritmética é calculada somando todos os valores de um conjunto
de dados e dividindo pelo número de elementos. É representada pela fórmula:

\({\color{Red} \sum_{i=1}^{n} x_i} = x_{1} + x_{2} + .. + x_{n}\)
\(\bar{x}_{n} =\frac{1}{n} \times {\color{Red} \sum_{i=1}^{n} x_i} = \frac{{\color{Red} \sum_{i=1}^{n} x_i}}{n}\)

OU

\({\color{Red} S_{n}} = x_{1} + x_{2} + .. + x_{n}\)
\(\bar{x} = \frac{1}{n} \times {\color{Red} S_{n}} = \frac{{\color{Red} S_{n}}}{n}\)

Onde:

  • \(\bar{x}\) é a média
  • \(x_i\) são os valores individuais
  • \(n\) é o número de elementos no conjunto
  • \(\sum_{i=1}^{n} x_i\) ou \(S_{n}\) representa o somatório
  • \(i\) representa um indice ou contador que indica a posição de cada elemento na sequência de dados.

Exemplo com dados reais

Vamos calcular a média dos salários da planilha “media”:

Funcionários Salários (mil R$)
1 13
2 15
3 20
4 13
5 20
6 13
7 13
8 30
9 16
10 20

Cálculo da média:

Soma = 13 + 15 + 20 + 13 + 20 + 13 + 13 + 30 + 16 + 20 = 173

Número de elementos = 10

Média = 173 ÷ 10 = 17.3 mil R$

Em R, podemos calcular assim:

O que é Mediana?

A mediana é o valor que divide um conjunto de dados ordenados em duas partes iguais.
Metade dos valores estão abaixo da mediana e metade estão acima.

Mediana de uma População

Para representar a mediana de uma população, é comum usar:

  • \(\tilde{\mu}\) (mu til) – Por analogia com a média populacional \(\mu\)
  • \(Med\) – Mantendo a mesma abreviatura, mas aplicada à população
  • \(Md\) – Similar ao caso amostral

Conjunto ÍMPAR de elementos

Para um número ímpar de elementos, a mediana é o valor central quando os dados estão ordenados.

Exemplo com a planilha “mediana impar” (11 elementos):

Funcionários Salários (mil R$)
1 13
2 15
3 20
4 13
5 20
6 13
7 13
8 30
9 16
10 20
11 250

Dados ordenados: 13, 13, 13, 13, 15, 16, 20, 20, 20, 30, 250

Mediana = 16 (o 6º elemento, que divide os 11 elementos em duas partes iguais)

Conjunto PAR de elementos

Para um número par de elementos, a mediana é a média dos dois valores centrais.

Exemplo com a planilha “mediana par” (10 elementos):

Funcionários Salários (mil R$)
1 13
2 15
3 20
4 13
5 20
6 13
7 13
8 30
9 16
10 20

Dados ordenados: 13, 13, 13, 13, 15, 16, 20, 20, 20, 30, 250

Mediana = (15 + 16) ÷ 2 = 15.5 (média do 5º e 6º elementos)

Comparação entre Média e Mediana

Média

Vantagens:

  • Considera todos os valores do conjunto
  • Fácil de calcular e interpretar
  • Boa para dados com distribuição simétrica

Desvantagens:

  • Sensível a valores extremos (outliers)
  • Pode não representar bem o centro em distribuições assimétricas

Mediana

Vantagens:

  • Robusta a valores extremos (outliers)
  • Melhor representante do centro em distribuições assimétricas
  • Fácil de entender como “o valor do meio”

Desvantagens:

  • Ignora a magnitude dos outros valores
  • Pode não ser representativa em conjuntos muito pequenos
  • Mais difícil de usar em análises estatísticas avançadas

Quando usar cada medida?

Use a média quando: Os dados têm distribuição simétrica e não há valores extremos.

Use a mediana quando: Os dados têm distribuição assimétrica ou contêm valores extremos.

No exemplo dos salários, note como a média (17.3) é maior que a mediana (15.5),
indicando uma assimetria à direita causada por salários mais altos que puxam a média para cima.

Conclusão

Média e mediana são ambas medidas de tendência central importantes, mas respondem a perguntas
diferentes sobre os dados. Enquanto a média representa o “centro de gravidade” do conjunto,
a mediana representa o “valor do meio”. A escolha entre elas depende da distribuição dos dados
e da presença de valores extremos.

Em muitos casos, o ideal é reportar ambas as medidas para ter uma visão mais completa
da distribuição dos dados.