Imputando valores ausentes na análise de cluster

Um ótimo recurso usando linguagem de mineração de dados do SQL Server.

Anúncios
Imputando valores ausentes na análise de cluster

Mineração de Dados lança luz nos casos de Autismo

Este é um caso bastante relevante do uso da mineração de dados na área biomédica. Os cientistas da Rockfeller University conduziram um estudo utilizando as técnicas de mineração de dados para geração de insights a respeito das causas de autismo. 

Mineração de Dados lança luz nos casos de Autismo

A Toda Poderosa Floresta Aleatória

Um ótimo post sobre as potencialidades das Florestas Aleatórias (Random Forests) com o direito de um Salmo no final do post. O post ainda apresenta duas referências sobre o uso das Random Forests.

The Random Forest™ is my shepherd; I shall not want.
He makes me watch the mean squared error decrease rapidly.
He leads me beside classification problems.
He restores my soul.
He leads me in paths of the power of ensembles
for his name’s sake.

Even though I walk through the valley of the curse of dimensionality,
I will fear no overfitting,
for you are with me;
your bootstrap and your randomness,
they comfort me.

You prepare a prediction before me
in the presence of complex interactions;
you anoint me data scientist;
my wallet overflows.
Surely goodness of fit and money shall follow me
all the days of my life,
and I shall use Random Forests™
forever.

A Toda Poderosa Floresta Aleatória

Modelo de Mineração de Dados para previsão de medalhas em Sochi-2014

Um trabalho interessante do Dan Graettinger usando modelos com regressão logística. Achei somente que ele usou muitas variáveis irrelevantes no modelo (consumo de energia?). Mas o trabalho foi muito bem escrito! Achei que ele poderia jogar um pouco do resultado para o acaso (cerca de 30-35% da estimativa.

2014 Winter Olympics Medal Count Prediction article

Modelo de Mineração de Dados para previsão de medalhas em Sochi-2014