July 29, 2025

Titanic ML: Prevendo Sobrevivência de Passageiros

Visualização de dados e predição de sobrevivência dos passageiros do Titanic.

O projeto Titanic ML é um projeto de classificação binária que utiliza técnicas de Aprendizado de Máquina (Machine Learning) para prever a sobrevivência de passageiros a bordo do RMS Titanic, com base em variáveis socioeconômicas.

O modelo vencedor, Logistic Regression, alcançou uma acurácia de 76,79% no conjunto de testes.


🎯 Objetivo e Modelo Principal

Esta seção demonstra a aplicação de Machine Learning na predição de um evento histórico.

Objetivo

O objetivo principal é prever a sobrevivência dos passageiros (Survived) com base em variáveis como sexo, idade, classe de embarque e tarifa.

Modelo Vencedor

O Logistic Regression foi selecionado como o modelo final, servindo como uma base sólida para comparações futuras:

MétricaValor
Acurácia76.79%

💡 Tecnologias e Repositório

Aqui estão as ferramentas e bibliotecas utilizadas neste projeto e o link para o código completo.

⚙️ Tecnologias Principais

  • Linguagem: Python
  • Machine Learning: scikit-learn
  • Processamento de Dados: Pandas & NumPy
  • Visualização: Matplotlib & Seaborn

🌐 Repositório do Código

O código completo do projeto está disponível em:

👉 View Project on GitHub


⚙️ Funcionalidades e Pipeline

O projeto implementa um pipeline de Machine Learning focado em pré-processamento de dados mistos (categóricos e numéricos).

Etapas do Pipeline

  • Pré-processamento e Limpeza de Dados para tratar valores nulos (Age, Cabin).
  • Engenharia de Features para converter variáveis categóricas (Sex, Embarked) em numéricas.
  • Visualização de Dados para identificar correlações (e.g., Pclass e Survived).
  • Treinamento e Avaliação do modelo de Logistic Regression.

📖 Variáveis do Dataset

As variáveis (features) utilizadas para a predição da variável alvo.

VariávelDescriçãoObservações
PclassClasse de ingresso1º = Alto, 3º = Baixo
SexSexoMasculino ou Feminino
AgeIdade em anosPode conter valores nulos
SibSpNº de irmãos/cônjuges a bordoInteiro
ParchNº de pais/filhos a bordoInteiro
FareTarifa de passageiroValor numérico (moeda)
CabinNúmero da cabinePode conter valores nulos
EmbarkedPorto de embarqueC, Q, ou S
SurvivedVariável alvo: Sobrevivência0 = Não, 1 = Sim
Compartilhar