Nate Silver, a Mineração de Dados e Modelos Preditivos: E porque você deveria olhar os seus dados?

As 9:37hs do dia 7 Novembro cerca de 90% dos estados já estão com os votos computados; e o Presidente Barack Hussein Obama foi reeleito; e dentro da esfera da análise de dados o grande nome dessa eleição se chama Nate Silver.

Para quem não sabe; Nate Silver é o autor do livro The Signal and the Noise: Why So Many Predictions Fail-but Some Don’t (O Sinal e o Ruído: Porque muitas previsões falham, mas algumas não. Tradução do Autor); no qual em linhas gerais coloca em perspectiva a causa da falha de muitos modelos de predição, onde o autor coloca que aspectos conjunturais são mais importantes do que tendências baseadas em critérios mais técnicos. Particularmente o livro apresenta muitos Rules of Thumb (regras de aplicação geral sem nenhum tipo de explicação exata de fato); mas a idéias do blog do Nate são muito mais consistentes e tem um grau de profundidade maior que o livro; mas isso é outro assunto.

O ponto principal é o que ninguém (fora do campo de análise de dados) conseguiu responder: É como um geek da área de análise de dados (um estatśitico de ofício e blogueiro (como diria o João Manoel Mello))  conseguiu acertar previsões das eleições em TODOS OS ESTADOS? E o mais importante: Como todo o establishment televisivo, acadêmico e político com analistas políticos, cientistas políticos, comentaristas (palpiteiros profissionais como diria Olavo de Carvalho) não conseguiram sequer realizarem projeções com eficácia mínima; chegando ao ponto dos apresentadores do Manhattan Connection (que é um ótimo programa por sinal) parecerem patetas com palpites que mudavam a cada 15 minutos, ao invés de analisarem aquilo que estava evidente para todos que era a conjectura política-econômica e os dados que foi exatamente que o Nate Silver viu e apresentou um resultado bastante consistente baseado nestes dois aspectos.

State by State Probabilities
State by State Probabilities
State By State Results
State By State Results

Dentro desse cenário fica mais que provado que para quem trabalha com análises preditivas deve ser consideradas as seguintes regras de ouro: 1)Olhe os dados; 2) Olhe os dados novamente; 3)Assim que terminar o passo Nr 2 olhe os dados novamente; 4) Considere a conjectura que envolve os dados que você está olhando; 5) Considere as ferramentas que tem disponível e extraia o máximo de conhecimento dos dados; 6) Faça uma análise analítica dos dados; e por final 7) Faça a junção das análises analíticas com as conjecturas e você terá um modelo preditivo.

Nate Silver, a Mineração de Dados e Modelos Preditivos: E porque você deveria olhar os seus dados?

Os Perigos da Mineração de Dados no Aspecto Eleitoral

Sobre a utilização da mineração de dados nas eleições americanas; e com um quote que já vale o artigo:

Do you watch college football? Listen to smooth jazz? Search the Internet for guidance on parenting, spirituality or a health concern? Look at pornography sites online?

Do you like the fact that political strategists with the presidential campaigns know the answers to each of those questions?

Os Perigos da Mineração de Dados no Aspecto Eleitoral

A mineração de dados como nova ferramenta para as eleições americanas

A matéria da Dawn mostra que grande parte da porcentagem de votos do próximo Presidente dos Estados Unidos da América terá na mineração de dados uma forma de 1) angariar recursos de campanha, 2) realizar prospecções de potenciais doadores, 3) mobilizar nichos de usuários na rede em prol da militância sobre um determinado candidato, e 4) alinhamento de discurso sobre em qual o candidato irá adotar em determinada região do país.

 Esse domínio eleitoral, está se estabelecendo a passos largos e essa eleição nos EUA será algo como o batismo de fogo, onde; na mesma forma em que as mídias sociais foram na eleição do Presidente Obama a 4 anos; no qual o paradigma mudou nesse meio tempo no qual se antes a necessidade era saber onde os eleitores se mobilizavam, hoje a necessidade é saber o que esses eleitores pensam e realizar o micro-targeting de acordo com os seus pensamentos e comportamentos na esfera digital. Essas informações são de grande importância em relação a campanha; pois, dependendo do potencial de eleitores pode-se angariar mais recursos de patrocinadores, ou mesmo para elaboração de campanhas do tipo corpo a corpo na qual o candidado pode tanto fortalecer a sua base eleitoral nos lugares em que tem vantagem, ou mesmo fazer prospecção de novos votos em bases na qual não é tão forte eleitoralmente.

 O candidato Mitt Romney já investiu cerca de 60% a mais que Barack Hussein Obama e as pesquisas apontam hoje um empate técnico entre os dois, mesmo com o segundo candidato ter o apoio da máquina estatal a seu favor; o que mostra esse método até então tem uma eficácia bastante significativa.

A mineração de dados como nova ferramenta para as eleições americanas

Marketing eleitoral dirigido

A mineração de dados através das técnicas de agrupamento e classificação são um importante campo de estudo/aplicação em domínios distintos. Entretanto, uma tendência que está tomando força é a utilização das técnicas de mineração para aplicação no contexto eleitoral, no qual de acordo com a criação de personas (profiles de registros que têm características em comum) os candidatos podem realizar um trabalho de marketing e propaganda eleitoral mais dirigida, i.e. eles podem atingir diretamente os seus potenciais eleitores, e de acordo com as suas necessidades adaptariam os seus discursos e prioridades de campanha. Vale a pena ver esse artigo de apresenta padrões bem interessantes sobre os eleitores americanos de acordo com a sua inclinação política.

Marketing eleitoral dirigido