Scikit-Plot

Simplemente um dos melhores pacotes para plotting em Machine Learning.

Anúncios
Scikit-Plot

Livro Data Points: Visualization That Means Something

O Nathan Yau do ótimo site Flowing Data a algum tempo vem trazendo a tona que a visualização de dados possuí um papel importante em relação à descoberta de conhecimento.

Ele acaba de lançar um livro bastante interessante chamado Data Points: Visualization That Means Something.

Para quem deseja aplicar os conceitos de análise exploratória de dados via visualização de dados o livro pode ser um ótimo material de partida.

Livro Data Points: Visualization That Means Something

A Análise Data-Driven é uma falha Imaginativa

Este post do R Cereals mostra mais uma vez que a velha guerrinha entre machine learners e estatísticos vai continuar por um longo tempo devido a mais desconhecimento de cada uma das partes com o segmento do outro do que divergências técnicas conceituais.

Em suma o post trata de que o modelo de análise Data-Driven é uma falha imaginativa na qual (na visão do autor), qualquer análise que se chame de “ciência” deve haver uma hipótese.

Oras, se somente a hipótese for o motor da ciência então tudo o que nós mineradores de dados conhecemos como análise exploratória de dados não é ciência de fato?

Essa afirmação por sí só já é absurda.

Então quer dizer que a NASA (a instituição mais científica do mundo) manda a Mars Rover sedimentada apenas por uma hipótese? As viagens espaciais da Challenger e da Discovery foram somente baseadas em uma hipótese?

Certamente o autor nunca leu algum livro sobre KDD ou Mineração de Dados no qual em 80% tempo temos a citação de que o processo de descoberta de conhecimento é the “…non-trivial process of identifying valid, novel, potentially useful and ultimately understandable patterns in data…”.

É um assunto que ainda será pauta aqui do Mineração de Dados.

A Análise Data-Driven é uma falha Imaginativa

Análise PCA com R

Este post do Systemtic Investor mostra como. É importante ressaltar, que como o WEKA ainda não tem uma engine de visualização tão robusta como o R; essa pode ser uma ótima abordagem antes mesmo de se realizar qualquer tipo de análise exploratória de dados em uma base de dados no WEKA.

Análise PCA com R

Tempo em Projeto Modelagem de Mineração de Dados

Alguns bons insights Will Dwinnell neste post.

Em se tratando de projetos de modelagem/análise exploratória de dados, vale a pena aplicar parte do que foi colocado no post; até porque em muitas das vezes os padrões por trás dos dados não serão triviais, e virão muito provavelmente em forma de nuggets.

 

 

Tempo em Projeto Modelagem de Mineração de Dados

Utilização de Teoria de Redes em Análises de Estratégias de Futebol

Esse bom artigo escrito Javier Lopez Pena e Hugo Touchette apresenta a teoria de redes aplicada na análise de estratégia de times de futebol. Através de alguns atributos como Proximidade, Interligação, e “Popularidade” e com dados provenientes da Copa do Mundo de 2010 os autores chegaram em uma análise bem razoável da aplicação da teoria de redes para avaliação de times, e demonstrar por exemplo, o fluxo do time, bem como as relações entre os atletas dentro de campo e sua importância em termos estratégicos.

O trabalho é ótimo em se tratando de análise esportiva; e com uma base um pouco mais refinada pode render muitas frutos bem interessantes nesse domínio.

Rede de passes dos times da Holanda e Espanha antes da Final da Copa do Mundo de 2010, usando dados dos passes e as formações táticas das semi-finais.

A network theory analysis of football strategies

Utilização de Teoria de Redes em Análises de Estratégias de Futebol

Scolopax Project

Para quem interessar, o Projeto Scolopax é uma iniciativa endossada pela National Science Foundation e tem como foco a realização de diversos desafios no campo da análise exploratória de dados; em especial Mineração de Dados. O projeto tem como foco a transformação de dados em conhecimento através de do tratamento de dados, combinação de diversos elementos de dados, e validação de hipóteses através da análise exploratória de dados.

Scolopax Project