Compreendendo a Notação: $\prod_{i=1}^{n} f_{x_{i}} (x_{i})$

Esta notação é fundamental em estatística e probabilidade, especialmente quando trabalhamos com variáveis aleatórias independentes.

O que significa este símbolo?

A expressão $\prod_{i=1}^{n} f_{x_{i}} (x_{i})$ representa o produto das funções de densidade de probabilidade de n variáveis aleatórias.

Π (Pi maiúsculo): enquanto Σ faz somas (somatório), o símbolo Π faz multiplicações (produtório).
i=1 e n: Limites do produto (de i=1 até i=n)
fₓᵢ(xᵢ): Função de Densidade de Probabilidade (PDF) da variável Xᵢ avaliada no ponto xᵢ

Contexto e Aplicação

Esta expressão aparece no contexto de variáveis aleatórias independentes. Quando temos n variáveis aleatórias independentes, a densidade conjunta é o produto das densidades individuais:

$f_{X_1, X_2, \ldots, X_n} (x_1, x_2, \ldots, x_n) = \prod_{i=1}^{n} f_{X_i} (x_i)$

Se as variáveis forem Idependentes e Identicamente Distribuídas (i.i.d.), a fórmula simplifica para:

$f_{X_1, X_2, \ldots, X_n} (x_1, x_2, \ldots, x_n) = \prod_{i=1}^{n} f(x_i)$

Exemplo Prático com R

Lançamentos de Moeda

Suponha que temos 3 lançamentos de uma moeda justa (n=3). Seja Xᵢ uma variável que representa o resultado do i-ésimo lançamento.

# Função de massa de probabilidade para cada lançamento

f <- function(x_i) {
  return(0.5)  # Probabilidade igual para cara (1) ou coroa (0)
}

# Calculando a probabilidade conjunta de obter (Cara, Coroa, Cara)
probabilidade_conjunta <- f(1) * f(0) * f(1)

# Resultado
print(paste("Probabilidade conjunta:", probabilidade_conjunta))

# Função de massa de probabilidade para cada lançamento

f <- function(x_i) {

return(0.5) # Probabilidade igual para cara (1) ou coroa (0)

}

# Calculando a probabilidade conjunta de obter (Cara, Coroa, Cara)

probabilidade_conjunta <- f(1) * f(0) * f(1)

# Resultado

print(paste("Probabilidade conjunta:", probabilidade_conjunta))

Este código retornará 0.125, que é igual a 1/8, o resultado esperado para três lançamentos independentes de uma moeda justa.

Variáveis Normais Independentes

Para variáveis normalmente distribuídas com parâmetros diferentes:

# Densidades de três variáveis normais independentes
f1 <- function(x) { dnorm(x, mean = 0, sd = 1) }    # N(0,1)
f2 <- function(x) { dnorm(x, mean = 1, sd = 2) }    # N(1,4)
f3 <- function(x) { dnorm(x, mean = -1, sd = 1.5) } # N(-1,2.25)

# Calculando a densidade conjunta no ponto (0.5, 1.2, -0.3)
x1 <- 0.5
x2 <- 1.2
x3 <- -0.3

densidade_conjunta <- f1(x1) * f2(x2) * f3(x3)

# Resultado
print(paste("Densidade conjunta no ponto (0.5, 1.2, -0.3):", densidade_conjunta))

# Densidades de três variáveis normais independentes

f1 <- function(x) { dnorm(x, mean = 0, sd = 1) } # N(0,1)

f2 <- function(x) { dnorm(x, mean = 1, sd = 2) } # N(1,4)

f3 <- function(x) { dnorm(x, mean = -1, sd = 1.5) } # N(-1,2.25)

# Calculando a densidade conjunta no ponto (0.5, 1.2, -0.3)

x1 <- 0.5

x2 <- 1.2

x3 <- -0.3

densidade_conjunta <- f1(x1) * f2(x2) * f3(x3)

# Resultado

print(paste("Densidade conjunta no ponto (0.5, 1.2, -0.3):", densidade_conjunta))

Explicação do Código

Vamos analisar passo a passo o que este código faz:

1. Definição das Funções de Densidade

f1 <- function(x) { dnorm(x, mean = 0, sd = 1) }    # N(0,1)
f2 <- function(x) { dnorm(x, mean = 1, sd = 2) }    # N(1,4)
f3 <- function(x) { dnorm(x, mean = -1, sd = 1.5) } # N(-1,2.25)

f1 <- function(x) { dnorm(x, mean = 0, sd = 1) } # N(0,1)

f2 <- function(x) { dnorm(x, mean = 1, sd = 2) } # N(1,4)

f3 <- function(x) { dnorm(x, mean = -1, sd = 1.5) } # N(-1,2.25)

Estas linhas definem três funções de densidade de probabilidade para distribuições normais:

f1: Distribuição normal com média 0 e desvio padrão 1 $N(0,1)$
f2: Distribuição normal com média 1 e desvio padrão 2 $N(1,4)$ (variância = 4)
f3: Distribuição normal com média -1 e desvio padrão 1.5 $N(-1,2.25)$ (variância = 2.25)

A função dnorm() em R calcula o valor da função densidade de probabilidade no ponto x.

2. Definição dos Pontos de Avaliação

x1 <- 0.5
x2 <- 1.2
x3 <- -0.3

x1 <- 0.5

x2 <- 1.2

x3 <- -0.3

Estas linhas definem os pontos específicos onde queremos avaliar as densidades:

Avaliamos f1 no ponto x = 0.5
Avaliamos f2 no ponto x = 1.2
Avaliamos f3 no ponto x = -0.3

3. Cálculo da Densidade Conjunta

densidade_conjunta <- f1(x1) * f2(x2) * f3(x3)

1	densidade_conjunta <- f1(x1) * f2(x2) * f3(x3)

Esta é a parte crucial do código. Como as variáveis são independentes, a densidade conjunta é simplesmente o produto das densidades individuais:

$f_{X_1,X_2,X_3}(x_1,x_2,x_3) = f_{X_1}(x_1) \cdot f_{X_2}(x_2) \cdot f_{X_3}(x_3)$

O código calcula esse produto multiplicando os valores das três funções de densidade nos pontos especificados.

4. Exibição do Resultado

print(paste("Densidade conjunta no ponto (0.5, 1.2, -0.3):", densidade_conjunta))

1	print(paste("Densidade conjunta no ponto (0.5, 1.2, -0.3):", densidade_conjunta))

Esta linha exibe o resultado do cálculo, mostrando o valor da densidade conjunta no ponto especificado.

Interpretação do Resultado

O valor resultante representa a densidade de probabilidade conjunta das três variáveis normais independentes no ponto (0.5, 1.2, -0.3).

É importante notar que:

Este valor não é uma probabilidade, mas sim uma densidade de probabilidade
Para variáveis contínuas, valores individuais de densidade não representam probabilidades (que são zero para pontos específicos)
Valores de densidade são usados principalmente para comparações relativas e cálculos de verossimilhança

O valor calculado seria útil em contextos como:

Estimativa de máxima verossimilhança
Cálculo de probabilidades através de integração
Comparação de quão “prováveis” são diferentes conjuntos de valores sob o modelo especificado

Conclusão

O produtório $\prod_{i=1}^{n} f_{x_{i}} (x_{i})$ é uma forma compacta de representar a probabilidade conjunta de eventos independentes, onde cada evento tem sua probabilidade individual dada por sua própria função de densidade. Este conceito é fundamental para estimação por máxima verossimilhança e modelagem estatística baseada na independência entre observações.

Referências

Casella, G., & Berger, R. L. (2002). Statistical Inference.
James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An Introduction to Statistical Learning.

O que é um Histograma?

Um histograma é uma representação gráfica de distribuição de dados numéricos contínuos.
É similar a um gráfico de barras, mas agrupa os dados em intervalos (chamados de “bins” ou “classes”) e mostra a frequência de observações em cada intervalo.

O histograma é muito importante no estudo de variáveis quantitativas principalmente para variáveis contínuas, com ele podemos saber como as variáveis estão distribuídas

Por meio do histograma conseguimos calcular os quantis

Primeiro precisamos definir o número de intervalos a serem considerados, para este caso consideraremos 6 intervalos.
Vamos obter nos dados o valor mínimo e máximo.
amplitude do intervalo = (valor máximo – valor mínimo) ÷ 6
limite inferior = valor mínimo
limite superior = valor máximo
densidade da frequência = frequência relativa ÷ amplitude do intervalo
Abaixo vamos calcular no R e obter a tabela de frequência e histogramas com frequência absoluta e densidade de frequência .

Exemplo prático em R

# Linguagem : R

#========================================
#          CRIAR DIRETÓRIO PARA SALVAR
#========================================
# Definir o diretório de destino
diretorio <- "C:/graficos"

# Criar o diretório se não existir
if (!dir.exists(diretorio)) {
  dir.create(diretorio, recursive = TRUE)
  cat("\nDiretório criado:", diretorio, "\n")
}

x <- c(27772, 19014, 14286, 11651, 12911, 7464, 7000, 6418, 4571,5891,5012, 6207, 7893, 6947, 7536, 10129)
cat("valor mínimo = ",min(x))
cat("valor máximo = ",max(x))
cat("tamanho do intervalo = (", max(x), " - ", min(x), ") ÷ 6 = ", (max(x) - min(x))/6, "Km2")
aux = min(x) + (max(x) - min(x)) * (0:6)/6



#========================================
#          TABELA DE FREQUÊNCIAS (COM FORMATAÇÃO BRASILEIRA)
#========================================
# Criar breaks arredondados
aux_rounded <- round(aux, 1)

# Criar intervalos formatados no estilo brasileiro
intervalos <- character()
for(i in 1:(length(aux_rounded)-1)) {
  inicio <- format(aux_rounded[i], nsmall = 1, big.mark = ".", decimal.mark = ",")
  fim <- format(aux_rounded[i+1], nsmall = 1, big.mark = ".", decimal.mark = ",")
  intervalos[i] <- paste0("de ", inicio, " a ", fim)
}

# Contar frequências manualmente
frequencias <- numeric()
for(i in 1:(length(aux_rounded)-1)) {
  if(i == 1) {
    frequencias[i] <- sum(x >= aux_rounded[i] & x <= aux_rounded[i+1])
  } else {
    frequencias[i] <- sum(x > aux_rounded[i] & x <= aux_rounded[i+1])
  }
}

# Criar dataframe manualmente
freq_df <- data.frame(
  `CLASSE (KM²)` = intervalos,
  `FREQUÊNCIA ABSOLUTA` = frequencias,
  `FREQUÊNCIA RELATIVA` = paste0(round(frequencias / length(x) * 100, 2), "%"),
  check.names = FALSE
)

# Imprimir a tabela de frequências
cat("\n=== TABELA DE FREQUÊNCIAS ===\n")
print(freq_df, row.names = FALSE)

#========================================
#          SALVAR TABELA COMO IMAGEM PNG
#========================================
if(!require(gridExtra)) install.packages("gridExtra")
if(!require(ggplot2)) install.packages("ggplot2")
library(gridExtra)
library(ggplot2)

# Salvar a tabela como PNG
png("C:/graficos/tabela_frequencia.png", 
    width = 1200,  
    height = 400,   
    res = 100)

# Criar tabela formatada
grid.table(freq_df, 
           rows = NULL,
           theme = ttheme_minimal(
             base_size = 10,
             padding = unit(c(4, 4), "mm"),
             core = list(
               bg_params = list(fill = c("#F7F7F7", "#FFFFFF"), col = "black"),
               fg_params = list(hjust = 0, x = 0.03)
             ),
             colhead = list(
               bg_params = list(fill = "#0E4C3E", col = "black"),
               ffg_params = list(col = "white", fontface = "bold")
             )
           ))

dev.off()
cat("Tabela de frequência salva como: C:/graficos/tabela_frequencia.png\n")



#========================================
#          HISTOGRAMA 1 (Frequência Absoluta)
#========================================
# x      = Os dados numéricos para construir o histograma
# breaks = Define os intervalos (bins) do histograma
# right  = Controla como os intervalos são fechados se
#          TRUE: Intervalos são fechados à direita (a, b]
#          FALSE: Intervalos são fechados à esquerda [a, b)
# ylab   = Rótulo do eixo Y (vertical)
# main   = Título principal do gráfico
# xlab   = Rótulo do eixo X (horizontal)
# col    = Cor das barras do histograma
# ylim   = Limites do eixo Y (de 0 a 12)
# axes   = Suprime a criação automática dos eixos
# xlim   = Limites do eixo X (de 0 a 30.000 km²)

# Salvar o histograma 1 como PNG
png(file.path(diretorio, "histograma1_frequencia_absoluta.png"), width = 800, height = 600)

d = hist(x, 
         breaks = aux,
         right  = T,
         ylab   = "FREQUÊNCIA ABSOLUTA", 
         main   = "DESMATAMENTO EM KM2", 
         xlab   = "KM2", col="#0E4C3E",
         ylim   = c(0,12), 
         axes   = F, 
         xlim   = c(0,30000))

axis(1, c(0,aux),round(c(0,aux),1))
axis(2)
text(d$mids, d$counts+0.5, paste(round(d$density*(max(x) - min(x))/6*100,2),"%", sep=""))

dev.off()  # Fechar o dispositivo gráfico
cat("Histograma 1 salvo como: histograma1_frequencia_absoluta.png\n")

#========================================
#          HISTOGRAMA 2 (Densidade de Frequência)
#========================================
# Salvar o histograma 2 como PNG
png(file.path(diretorio, "histograma2_densidade_frequencia.png"), width = 800, height = 600)

d = hist(x, breaks=aux, right=T, prob=T, 
         ylab="DENSIDADE DE FREQUÊNCIA",
         main="DESMATAMENTO EM KM2", 
         xlab="KM2", col="#0E4C3E",
         ylim=c(0,0.0002), axes=F, xlim=c(0,30000))
axis(1, c(0,aux), round(c(0,aux),1))
axis(2)
text(d$mids, d$density+0.5e-5, paste(round(d$density*(max(x) - min(x))/6*100,2),"%", sep=""))

dev.off()  # Fechar o dispositivo gráfico
cat("Histograma 2 salvo como: histograma2_densidade_frequencia.png\n")

#========================================
#          MOSTRAR HISTOGRAMAS NA TELA TAMBÉM
#========================================
# Mostrar o histograma 1 na tela
d = hist(x, 
         breaks = aux,
         right  = T,
         ylab   = "FREQUÊNCIA ABSOLUTA", 
         main   = "DESMATAMENTO EM KM2", 
         xlab   = "KM2", col="#0E4C3E",
         ylim   = c(0,12), 
         axes   = F, 
         xlim   = c(0,30000))

axis(1, c(0,aux),round(c(0,aux),1))
axis(2)
text(d$mids, d$counts+0.5, paste(round(d$density*(max(x) - min(x))/6*100,2),"%", sep=""))

# ----------------------- 
# RESULTADO 
# -----------------------
# valor mínimo =  4571
# valor máximo =  27772
# amplitude do intervalo = ( 27772  -  4571 ) ÷ 6 =  3866.833 Km2
# histograma1_frequencia_absoluta.png
# histograma2_densidade_frequencia.png
# tabela_frequencia.png

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

132

133

134

135

136

137

138

139

140

141

142

143

144

145

146

147

148

149

150

151

152

153

154

155

156

157

158

159

160

161

162

163

164

165

166

167

168

169

170

171

172

173

174

# Linguagem : R

#========================================

# CRIAR DIRETÓRIO PARA SALVAR

#========================================

# Definir o diretório de destino

diretorio <- "C:/graficos"

# Criar o diretório se não existir

if (!dir.exists(diretorio)) {

dir.create(diretorio, recursive = TRUE)

cat("\nDiretório criado:", diretorio, "\n")

}

x <- c(27772, 19014, 14286, 11651, 12911, 7464, 7000, 6418, 4571,5891,5012, 6207, 7893, 6947, 7536, 10129)

cat("valor mínimo = ",min(x))

cat("valor máximo = ",max(x))

cat("tamanho do intervalo = (", max(x), " - ", min(x), ") ÷ 6 = ", (max(x) - min(x))/6, "Km2")

aux = min(x) + (max(x) - min(x)) * (0:6)/6

#========================================

# TABELA DE FREQUÊNCIAS (COM FORMATAÇÃO BRASILEIRA)

#========================================

# Criar breaks arredondados

aux_rounded <- round(aux, 1)

# Criar intervalos formatados no estilo brasileiro

intervalos <- character()

for(i in 1:(length(aux_rounded)-1)) {

inicio <- format(aux_rounded[i], nsmall = 1, big.mark = ".", decimal.mark = ",")

fim <- format(aux_rounded[i+1], nsmall = 1, big.mark = ".", decimal.mark = ",")

intervalos[i] <- paste0("de ", inicio, " a ", fim)

}

# Contar frequências manualmente

frequencias <- numeric()

for(i in 1:(length(aux_rounded)-1)) {

if(i == 1) {

frequencias[i] <- sum(x >= aux_rounded[i] & x <= aux_rounded[i+1])

} else {

frequencias[i] <- sum(x > aux_rounded[i] & x <= aux_rounded[i+1])

}

# Criar dataframe manualmente

freq_df <- data.frame(

`CLASSE (KM²)` = intervalos,

`FREQUÊNCIA ABSOLUTA` = frequencias,

`FREQUÊNCIA RELATIVA` = paste0(round(frequencias / length(x) * 100, 2), "%"),

check.names = FALSE

)

# Imprimir a tabela de frequências

cat("\n=== TABELA DE FREQUÊNCIAS ===\n")

print(freq_df, row.names = FALSE)

#========================================

# SALVAR TABELA COMO IMAGEM PNG

#========================================

if(!require(gridExtra)) install.packages("gridExtra")

if(!require(ggplot2)) install.packages("ggplot2")

library(gridExtra)

library(ggplot2)

# Salvar a tabela como PNG

png("C:/graficos/tabela_frequencia.png",

width = 1200,

height = 400,

res = 100)

# Criar tabela formatada

grid.table(freq_df,

rows = NULL,

theme = ttheme_minimal(

base_size = 10,

padding = unit(c(4, 4), "mm"),

core = list(

bg_params = list(fill = c("#F7F7F7", "#FFFFFF"), col = "black"),

fg_params = list(hjust = 0, x = 0.03)

colhead = list(

bg_params = list(fill = "#0E4C3E", col = "black"),

ffg_params = list(col = "white", fontface = "bold")

)

))

dev.off()

cat("Tabela de frequência salva como: C:/graficos/tabela_frequencia.png\n")

#========================================

# HISTOGRAMA 1 (Frequência Absoluta)

#========================================

# x = Os dados numéricos para construir o histograma

# breaks = Define os intervalos (bins) do histograma

# right = Controla como os intervalos são fechados se

# TRUE: Intervalos são fechados à direita (a, b]

# FALSE: Intervalos são fechados à esquerda [a, b)

# ylab = Rótulo do eixo Y (vertical)

# main = Título principal do gráfico

# xlab = Rótulo do eixo X (horizontal)

# col = Cor das barras do histograma

# ylim = Limites do eixo Y (de 0 a 12)

# axes = Suprime a criação automática dos eixos

# xlim = Limites do eixo X (de 0 a 30.000 km²)

# Salvar o histograma 1 como PNG

png(file.path(diretorio, "histograma1_frequencia_absoluta.png"), width = 800, height = 600)

d = hist(x,

breaks = aux,

right = T,

ylab = "FREQUÊNCIA ABSOLUTA",

main = "DESMATAMENTO EM KM2",

xlab = "KM2", col="#0E4C3E",

ylim = c(0,12),

axes = F,

xlim = c(0,30000))

axis(1, c(0,aux),round(c(0,aux),1))

axis(2)

text(d$mids, d$counts+0.5, paste(round(d$density*(max(x) - min(x))/6*100,2),"%", sep=""))

dev.off() # Fechar o dispositivo gráfico

cat("Histograma 1 salvo como: histograma1_frequencia_absoluta.png\n")

#========================================

# HISTOGRAMA 2 (Densidade de Frequência)

#========================================

# Salvar o histograma 2 como PNG

png(file.path(diretorio, "histograma2_densidade_frequencia.png"), width = 800, height = 600)

d = hist(x, breaks=aux, right=T, prob=T,

ylab="DENSIDADE DE FREQUÊNCIA",

main="DESMATAMENTO EM KM2",

xlab="KM2", col="#0E4C3E",

ylim=c(0,0.0002), axes=F, xlim=c(0,30000))

axis(1, c(0,aux), round(c(0,aux),1))

axis(2)

text(d$mids, d$density+0.5e-5, paste(round(d$density*(max(x) - min(x))/6*100,2),"%", sep=""))

dev.off() # Fechar o dispositivo gráfico

cat("Histograma 2 salvo como: histograma2_densidade_frequencia.png\n")

#========================================

# MOSTRAR HISTOGRAMAS NA TELA TAMBÉM

#========================================

# Mostrar o histograma 1 na tela

d = hist(x,

breaks = aux,

right = T,

ylab = "FREQUÊNCIA ABSOLUTA",

main = "DESMATAMENTO EM KM2",

xlab = "KM2", col="#0E4C3E",

ylim = c(0,12),

axes = F,

xlim = c(0,30000))

axis(1, c(0,aux),round(c(0,aux),1))

axis(2)

text(d$mids, d$counts+0.5, paste(round(d$density*(max(x) - min(x))/6*100,2),"%", sep=""))

# -----------------------

# RESULTADO

# -----------------------

# valor mínimo = 4571

# valor máximo = 27772

# amplitude do intervalo = ( 27772 - 4571 ) ÷ 6 = 3866.833 Km2

# histograma1_frequencia_absoluta.png

# histograma2_densidade_frequencia.png

# tabela_frequencia.png

Resultado

INFORMATIVO: Lembre-se no exemplo anterior a AMPLITUDES DOS INTERVALOS ERAM IGUAIS com tamanho 3866.833 km2.

ATENÇÃO: Caso o seu histograma tenha AMPLITUDES DIFERENTES a sua leitura poderá ser distorcida se forem utilizadas as frequências absolutas ou relativas.

Referências

Vídeo YouTube: Como fazer um Histograma – Noções de Estatística #4 – A Ciência da Estatística

Características Principais de um Histograma

Elementos de um Histograma

Eixo horizontal (x): Representa os intervalos de valores (classes)
Eixo vertical (y): Representa a frequência ou contagem de observações
Barras: Mostram a frequência em cada intervalo
Largura das barras: Representa a amplitude do intervalo
Altura das barras: Representa a frequência no intervalo

Diferenças para Gráfico de Barras

No histograma, as barras são adjacentes (não há espaço entre elas)
As categorias no eixo x são intervalos numéricos contínuos
Usado para dados quantitativos contínuos
Mostra a distribuição e forma dos dados

Produtório de Densidades

Compreendendo a Notação: \(\prod_{i=1}^{n} f_{x_{i}} (x_{i})\)

O que significa este símbolo?

Contexto e Aplicação

Exemplo Prático com R

Lançamentos de Moeda

Variáveis Normais Independentes

Explicação do Código

1. Definição das Funções de Densidade

2. Definição dos Pontos de Avaliação

3. Cálculo da Densidade Conjunta

4. Exibição do Resultado

Interpretação do Resultado

Conclusão

Referências

Histograma

O que é um Histograma?

Exemplo prático em R

Resultado

Referências

Características Principais de um Histograma

Elementos de um Histograma

Diferenças para Gráfico de Barras