GIL em Python - Área de Trampo

GIL significa Global Interpreter Lock (Trava Global do Interpretador).
É um mutex que protege o acesso a objetos internos do Python.
Primeiramente, o GIL permite que apenas uma thread execute bytecode por vez.
Por exemplo, mesmo com 8 núcleos de CPU, apenas um executa Python puro.
Isso limita severamente o paralelismo para código CPU-intensivo.
Além disso, o GIL simplifica a gerência de memória do Python.
A voz passiva é usada aqui: “objetos são protegidos contra corrupção pelo GIL”.
Quando o GIL é um problema? Em tarefas que consomem muita CPU.
Por exemplo, cálculos matemáticos, loops pesados ou processamento de imagens.
Por outro lado, o GIL não atrapalha operações de I/O.
Leitura de arquivos, requisições de rede ou acesso a banco são liberados.
Portanto, Python com threads é excelente para I/O-bound.
Vamos explorar na prática esses conceitos.
Três subtítulos mostram quando o GIL atrapalha ou ajuda.

Gil prejudicando: cpu-bound com threads

Quando o código é intensivo em CPU, threads não ajudam.
O GIL força as threads a executarem uma por vez.
Portanto, o ganho de performance é zero ou negativo.
Por exemplo, calcular números primos em várias threads não acelera.
A voz passiva é aplicada: “o tempo total é similar ao sequencial”.
Veja um exemplo prático dessa limitação:

import threading
import time

def tarefa_cpu_pesada():
    """Função que consome muita CPU."""
    total = 0
    for i in range(50_000_000):
        total += i * i
    return total

def executar_sequencial():
    """Executa a tarefa várias vezes em sequência."""
    inicio = time.time()
    for _ in range(4):
        tarefa_cpu_pesada()
    return time.time() - inicio

def executar_com_threads():
    """Executa a tarefa em threads paralelas."""
    threads = []
    inicio = time.time()
    for _ in range(4):
        t = threading.Thread(target=tarefa_cpu_pesada)
        threads.append(t)
        t.start()
    
    for t in threads:
        t.join()
    return time.time() - inicio

if __name__ == "__main__":
    print("Executando sequencialmente...")
    tempo_seq = executar_sequencial()
    print(f"Sequencial: {tempo_seq:.2f} segundos")
    
    print("\nExecutando com 4 threads...")
    tempo_thread = executar_com_threads()
    print(f"Com threads: {tempo_thread:.2f} segundos")
    
    print(f"\nAceleração: {tempo_seq / tempo_thread:.2f}x")
    print("(Esperado próximo de 1.0, não 4.0)")

import threading

import time

def tarefa_cpu_pesada():

"""Função que consome muita CPU."""

total = 0

for i in range(50_000_000):

total += i * i

return total

def executar_sequencial():

"""Executa a tarefa várias vezes em sequência."""

inicio = time.time()

for _ in range(4):

tarefa_cpu_pesada()

return time.time() - inicio

def executar_com_threads():

"""Executa a tarefa em threads paralelas."""

threads = []

inicio = time.time()

for _ in range(4):

t = threading.Thread(target=tarefa_cpu_pesada)

threads.append(t)

t.start()

for t in threads:

t.join()

return time.time() - inicio

if __name__ == "__main__":

print("Executando sequencialmente...")

tempo_seq = executar_sequencial()

print(f"Sequencial: {tempo_seq:.2f} segundos")

print("\nExecutando com 4 threads...")

tempo_thread = executar_com_threads()

print(f"Com threads: {tempo_thread:.2f} segundos")

print(f"\nAceleração: {tempo_seq / tempo_thread:.2f}x")

print("(Esperado próximo de 1.0, não 4.0)")

O resultado mostra aceleração próxima de 1.0.
Ou seja, threads não trouxeram ganho para CPU.
Para esses casos, use multiprocessing ou bibliotecas em C (NumPy).

Gil ajudando: i/o-bound com threads

Para operações de I/O, o GIL é liberado durante a espera.
Enquanto uma thread aguarda dados da rede, outra executa.
Portanto, threads trazem ganhos enormes para I/O-bound.
Por exemplo, baixar 10 arquivos simultaneamente é muito mais rápido.
A voz passiva é aplicada: “as operações de I/O são realizadas fora do GIL”.
Exemplo demonstrando a eficiência para I/O:

import threading
import time
import requests

def tarefa_io_pesada(url, nome):
    """Simula uma operação de I/O (requisição de rede)."""
    inicio = time.time()
    resposta = requests.get(url)
    tempo = time.time() - inicio
    print(f"[{nome}] {url} -> {resposta.status_code} em {tempo:.2f}s")
    return tempo

def executar_io_sequencial():
    """Executa requisições em sequência."""
    urls = ['https://httpbin.org/delay/1'] * 5
    inicio = time.time()
    for i, url in enumerate(urls):
        tarefa_io_pesada(url, f"Seq-{i}")
    return time.time() - inicio

def executar_io_com_threads():
    """Executa requisições em threads concorrentes."""
    urls = ['https://httpbin.org/delay/1'] * 5
    threads = []
    inicio = time.time()
    
    for i, url in enumerate(urls):
        t = threading.Thread(target=tarefa_io_pesada, args=(url, f"Thread-{i}"))
        threads.append(t)
        t.start()
    
    for t in threads:
        t.join()
    return time.time() - inicio

if __name__ == "__main__":
    print("=== Teste com I/O (requisições de 1 segundo cada) ===\n")
    
    tempo_seq = executar_io_sequencial()
    print(f"\nTotal sequencial: {tempo_seq:.2f}s")
    
    tempo_thread = executar_io_com_threads()
    print(f"Total com threads: {tempo_thread:.2f}s")
    
    print(f"\nAceleração: {tempo_seq / tempo_thread:.2f}x")
    print("(Esperado próximo de 5.0 - ganho real!)")

import threading

import time

import requests

def tarefa_io_pesada(url, nome):

"""Simula uma operação de I/O (requisição de rede)."""

inicio = time.time()

resposta = requests.get(url)

tempo = time.time() - inicio

print(f"[{nome}] {url} -> {resposta.status_code} em {tempo:.2f}s")

return tempo

def executar_io_sequencial():

"""Executa requisições em sequência."""

urls = ['https://httpbin.org/delay/1'] * 5

inicio = time.time()

for i, url in enumerate(urls):

tarefa_io_pesada(url, f"Seq-{i}")

return time.time() - inicio

def executar_io_com_threads():

"""Executa requisições em threads concorrentes."""

urls = ['https://httpbin.org/delay/1'] * 5

threads = []

inicio = time.time()

for i, url in enumerate(urls):

t = threading.Thread(target=tarefa_io_pesada, args=(url, f"Thread-{i}"))

threads.append(t)

t.start()

for t in threads:

t.join()

return time.time() - inicio

if __name__ == "__main__":

print("=== Teste com I/O (requisições de 1 segundo cada) ===\n")

tempo_seq = executar_io_sequencial()

print(f"\nTotal sequencial: {tempo_seq:.2f}s")

tempo_thread = executar_io_com_threads()

print(f"Total com threads: {tempo_thread:.2f}s")

print(f"\nAceleração: {tempo_seq / tempo_thread:.2f}x")

print("(Esperado próximo de 5.0 - ganho real!)")

Threads reduzem o tempo total de 5 segundos para cerca de 1 segundo.
Isso é o poder da concorrência para operações de I/O.
A fórmula do ganho teórico é:
\(G = \frac{T_{\text{sequencial}}}{T_{\text{thread}}} \approx N_{\text{tarefas}}\)
Quando as tarefas são independentes e bloqueantes.

Alternativas para contornar o gil

Para CPU-bound, use multiprocessing em vez de threading.
Cada processo tem seu próprio GIL e memória separada.
Assim, você aproveita múltiplos núcleos de verdade.
Outra alternativa é usar bibliotecas em C como NumPy.
Elas liberam o GIL durante operações pesadas.
Para I/O-bound, threading e asyncio são excelentes.
A escolha certa depende do seu problema específico.
A voz passiva é aplicada: “decisões informadas são tomadas após medição”.
Exemplo de multiprocessing para contornar o GIL:

import multiprocessing
import time

def trabalho_cpu_pesado(n):
    """Função CPU-bound que libera o GIL via multiprocessing."""
    total = 0
    for i in range(50_000_000):
        total += i * i
    return total

def com_multiprocessing():
    """Usa múltiplos processos para contornar o GIL."""
    with multiprocessing.Pool(processes=4) as pool:
        resultados = pool.map(trabalho_cpu_pesado, range(4))
    return resultados

def com_threads_falho():
    """Tenta usar threads (falha devido ao GIL)."""
    import threading
    resultados = [0] * 4
    
    def wrapper(idx):
        resultados[idx] = trabalho_cpu_pesado(idx)
    
    threads = []
    for i in range(4):
        t = threading.Thread(target=wrapper, args=(i,))
        threads.append(t)
        t.start()
    
    for t in threads:
        t.join()
    return resultados

if __name__ == "__main__":
    print("Multiprocessing (contorna o GIL):")
    inicio = time.time()
    com_multiprocessing()
    print(f"Tempo: {time.time() - inicio:.2f}s")
    
    print("\nThreads (limitado pelo GIL):")
    inicio = time.time()
    com_threads_falho()
    print(f"Tempo: {time.time() - inicio:.2f}s")

import multiprocessing

import time

def trabalho_cpu_pesado(n):

"""Função CPU-bound que libera o GIL via multiprocessing."""

total = 0

for i in range(50_000_000):

total += i * i

return total

def com_multiprocessing():

"""Usa múltiplos processos para contornar o GIL."""

with multiprocessing.Pool(processes=4) as pool:

resultados = pool.map(trabalho_cpu_pesado, range(4))

return resultados

def com_threads_falho():

"""Tenta usar threads (falha devido ao GIL)."""

import threading

resultados = [0] * 4

def wrapper(idx):

resultados[idx] = trabalho_cpu_pesado(idx)

threads = []

for i in range(4):

t = threading.Thread(target=wrapper, args=(i,))

threads.append(t)

t.start()

for t in threads:

t.join()

return resultados

if __name__ == "__main__":

print("Multiprocessing (contorna o GIL):")

inicio = time.time()

com_multiprocessing()

print(f"Tempo: {time.time() - inicio:.2f}s")

print("\nThreads (limitado pelo GIL):")

inicio = time.time()

com_threads_falho()

print(f"Tempo: {time.time() - inicio:.2f}s")

Multiprocessing mostra aceleração real próxima ao número de núcleos.
Threads para CPU-bound mostram aceleração próxima de 1.0.
Entenda o GIL e escolha a ferramenta certa.
Para I/O: threading ou asyncio.
Para CPU: multiprocessing, NumPy ou Cython.
O GIL não é um monstro, apenas uma característica.
Aprenda a conviver com ele e seja feliz em Python.

Indice

Gil prejudicando: cpu-bound com threads

Gil ajudando: i/o-bound com threads

Alternativas para contornar o gil

Deixe um comentário Cancelar resposta