Produtório de Densidades

dados

Compreendendo a Notação: \(\prod_{i=1}^{n} f_{x_{i}} (x_{i})\)

Esta notação é fundamental em estatística e probabilidade, especialmente quando trabalhamos com variáveis aleatórias independentes.

O que significa este símbolo?

A expressão \(\prod_{i=1}^{n} f_{x_{i}} (x_{i})\) representa o produto das funções de densidade de probabilidade de n variáveis aleatórias.

  • Π (Pi maiúsculo): enquanto Σ faz somas (somatório), o símbolo Π faz multiplicações (produtório).
  • i=1 e n: Limites do produto (de i=1 até i=n)
  • fₓᵢ(xᵢ): Função de Densidade de Probabilidade (PDF) da variável Xᵢ avaliada no ponto xᵢ

Contexto e Aplicação

Esta expressão aparece no contexto de variáveis aleatórias independentes. Quando temos n variáveis aleatórias independentes, a densidade conjunta é o produto das densidades individuais:

\(f_{X_1, X_2, \ldots, X_n} (x_1, x_2, \ldots, x_n) = \prod_{i=1}^{n} f_{X_i} (x_i)\)

Se as variáveis forem Idependentes e Identicamente Distribuídas (i.i.d.), a fórmula simplifica para:

\(f_{X_1, X_2, \ldots, X_n} (x_1, x_2, \ldots, x_n) = \prod_{i=1}^{n} f(x_i)\)

Exemplo Prático com R

Lançamentos de Moeda

Suponha que temos 3 lançamentos de uma moeda justa (n=3). Seja Xᵢ uma variável que representa o resultado do i-ésimo lançamento.

Este código retornará 0.125, que é igual a 1/8, o resultado esperado para três lançamentos independentes de uma moeda justa.

Variáveis Normais Independentes

Para variáveis normalmente distribuídas com parâmetros diferentes:

Explicação do Código

Vamos analisar passo a passo o que este código faz:

1. Definição das Funções de Densidade

Estas linhas definem três funções de densidade de probabilidade para distribuições normais:

  • f1: Distribuição normal com média 0 e desvio padrão 1 \(N(0,1)\)
  • f2: Distribuição normal com média 1 e desvio padrão 2 \(N(1,4)\) (variância = 4)
  • f3: Distribuição normal com média -1 e desvio padrão 1.5 \(N(-1,2.25)\) (variância = 2.25)

A função dnorm() em R calcula o valor da função densidade de probabilidade no ponto x.

2. Definição dos Pontos de Avaliação

Estas linhas definem os pontos específicos onde queremos avaliar as densidades:

  • Avaliamos f1 no ponto x = 0.5
  • Avaliamos f2 no ponto x = 1.2
  • Avaliamos f3 no ponto x = -0.3

3. Cálculo da Densidade Conjunta

Esta é a parte crucial do código. Como as variáveis são independentes, a densidade conjunta é simplesmente o produto das densidades individuais:

\(f_{X_1,X_2,X_3}(x_1,x_2,x_3) = f_{X_1}(x_1) \cdot f_{X_2}(x_2) \cdot f_{X_3}(x_3)\)

O código calcula esse produto multiplicando os valores das três funções de densidade nos pontos especificados.

4. Exibição do Resultado

Esta linha exibe o resultado do cálculo, mostrando o valor da densidade conjunta no ponto especificado.

Interpretação do Resultado

O valor resultante representa a densidade de probabilidade conjunta das três variáveis normais independentes no ponto (0.5, 1.2, -0.3).

É importante notar que:

  • Este valor não é uma probabilidade, mas sim uma densidade de probabilidade
  • Para variáveis contínuas, valores individuais de densidade não representam probabilidades (que são zero para pontos específicos)
  • Valores de densidade são usados principalmente para comparações relativas e cálculos de verossimilhança

O valor calculado seria útil em contextos como:

  • Estimativa de máxima verossimilhança
  • Cálculo de probabilidades através de integração
  • Comparação de quão “prováveis” são diferentes conjuntos de valores sob o modelo especificado

Conclusão

O produtório \(\prod_{i=1}^{n} f_{x_{i}} (x_{i})\) é uma forma compacta de representar a probabilidade conjunta de eventos independentes, onde cada evento tem sua probabilidade individual dada por sua própria função de densidade. Este conceito é fundamental para estimação por máxima verossimilhança e modelagem estatística baseada na independência entre observações.

Referências

  • Casella, G., & Berger, R. L. (2002). Statistical Inference.
  • James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An Introduction to Statistical Learning.

Histograma

professor apresenta gráfico no quadro

O que é um Histograma?

Um histograma é uma representação gráfica de distribuição de dados numéricos contínuos.
É similar a um gráfico de barras, mas agrupa os dados em intervalos (chamados de “bins” ou “classes”) e mostra a frequência de observações em cada intervalo.

O histograma é muito importante no estudo de variáveis quantitativas principalmente para variáveis contínuas, com ele podemos saber como as variáveis estão distribuídas

Por meio do histograma conseguimos calcular os quantis

Primeiro precisamos definir o número de intervalos a serem considerados, para este caso consideraremos 6 intervalos.
Vamos obter nos dados o valor mínimo e máximo.
amplitude do intervalo = (valor máximo – valor mínimo) ÷ 6
limite inferior = valor mínimo
limite superior = valor máximo
densidade da frequência = frequência relativa ÷ amplitude do intervalo
Abaixo vamos calcular no R e obter a tabela de frequência e histogramas com frequência absoluta e densidade de frequência .

Exemplo prático em R

Resultado

tabela_frequencia
histograma1_frequencia_absoluta
histograma2_densidade_frequencia

INFORMATIVO: Lembre-se no exemplo anterior a AMPLITUDES DOS INTERVALOS ERAM IGUAIS com tamanho 3866.833 km2.
ATENÇÃO: Caso o seu histograma tenha AMPLITUDES DIFERENTES a sua leitura poderá ser distorcida se forem utilizadas as frequências absolutas ou relativas.

Características Principais de um Histograma

Elementos de um Histograma

  • Eixo horizontal (x): Representa os intervalos de valores (classes)
  • Eixo vertical (y): Representa a frequência ou contagem de observações
  • Barras: Mostram a frequência em cada intervalo
  • Largura das barras: Representa a amplitude do intervalo
  • Altura das barras: Representa a frequência no intervalo

Diferenças para Gráfico de Barras

  • No histograma, as barras são adjacentes (não há espaço entre elas)
  • As categorias no eixo x são intervalos numéricos contínuos
  • Usado para dados quantitativos contínuos
  • Mostra a distribuição e forma dos dados