Data Mining e Eleições

Passado o vendaval das eleições que mais uma vez mostram o pior do nosso povo nas redes sociais, uma noticia sobre Mineração de Dados e as Eleições.

GOP Wins With Mix of Data Mining, Door Knocking

Skunked by Obama’s campaign in 2012, the Republican National Committee decided it would focus on building the team and systems it needed to identify potential GOP voters and then getting them to the polls.

The RNC bragged a few days after the election that effort reached 35 million voters, including more than 2.4 million they identified as low propensity, or unlikely to cast a ballot without a push.

“We fundamentally changed our strategy by expanding the electorate to turn out low-propensity Republican voters and to turn them out early,” said RNC spokesman Michael Short.

Democrats’ turnout machine worked, too, but it wasn’t enough. “A dynamite turnout operation is only worth 1, 2, 3 points at the most,” said Justin Barasky, a spokesman for the Democratic Senatorial Campaign Committee, “and it’s not enough to overcome a national wave.”

Com essa informação, não e difícil entender o turnaround da campanha do Partido Republicano nos EUA.

Trazendo para a nossa realidade um projeto de captação de eleitores poderia ser baseado na mesma estratégia, i.e. análise demográfica para entender como que determinada região vota historicamente e realizar ações como elaboração de estratégias para busca dos indecisos , ou busca de potenciais eleitores que poderiam voltar nulo, etc.

Data Mining e Eleições

Nate Silver, a Mineração de Dados e Modelos Preditivos: E porque você deveria olhar os seus dados?

As 9:37hs do dia 7 Novembro cerca de 90% dos estados já estão com os votos computados; e o Presidente Barack Hussein Obama foi reeleito; e dentro da esfera da análise de dados o grande nome dessa eleição se chama Nate Silver.

Para quem não sabe; Nate Silver é o autor do livro The Signal and the Noise: Why So Many Predictions Fail-but Some Don’t (O Sinal e o Ruído: Porque muitas previsões falham, mas algumas não. Tradução do Autor); no qual em linhas gerais coloca em perspectiva a causa da falha de muitos modelos de predição, onde o autor coloca que aspectos conjunturais são mais importantes do que tendências baseadas em critérios mais técnicos. Particularmente o livro apresenta muitos Rules of Thumb (regras de aplicação geral sem nenhum tipo de explicação exata de fato); mas a idéias do blog do Nate são muito mais consistentes e tem um grau de profundidade maior que o livro; mas isso é outro assunto.

O ponto principal é o que ninguém (fora do campo de análise de dados) conseguiu responder: É como um geek da área de análise de dados (um estatśitico de ofício e blogueiro (como diria o João Manoel Mello))  conseguiu acertar previsões das eleições em TODOS OS ESTADOS? E o mais importante: Como todo o establishment televisivo, acadêmico e político com analistas políticos, cientistas políticos, comentaristas (palpiteiros profissionais como diria Olavo de Carvalho) não conseguiram sequer realizarem projeções com eficácia mínima; chegando ao ponto dos apresentadores do Manhattan Connection (que é um ótimo programa por sinal) parecerem patetas com palpites que mudavam a cada 15 minutos, ao invés de analisarem aquilo que estava evidente para todos que era a conjectura política-econômica e os dados que foi exatamente que o Nate Silver viu e apresentou um resultado bastante consistente baseado nestes dois aspectos.

State by State Probabilities
State by State Probabilities
State By State Results
State By State Results

Dentro desse cenário fica mais que provado que para quem trabalha com análises preditivas deve ser consideradas as seguintes regras de ouro: 1)Olhe os dados; 2) Olhe os dados novamente; 3)Assim que terminar o passo Nr 2 olhe os dados novamente; 4) Considere a conjectura que envolve os dados que você está olhando; 5) Considere as ferramentas que tem disponível e extraia o máximo de conhecimento dos dados; 6) Faça uma análise analítica dos dados; e por final 7) Faça a junção das análises analíticas com as conjecturas e você terá um modelo preditivo.

Nate Silver, a Mineração de Dados e Modelos Preditivos: E porque você deveria olhar os seus dados?

A mineração de dados como nova ferramenta para as eleições americanas

A matéria da Dawn mostra que grande parte da porcentagem de votos do próximo Presidente dos Estados Unidos da América terá na mineração de dados uma forma de 1) angariar recursos de campanha, 2) realizar prospecções de potenciais doadores, 3) mobilizar nichos de usuários na rede em prol da militância sobre um determinado candidato, e 4) alinhamento de discurso sobre em qual o candidato irá adotar em determinada região do país.

 Esse domínio eleitoral, está se estabelecendo a passos largos e essa eleição nos EUA será algo como o batismo de fogo, onde; na mesma forma em que as mídias sociais foram na eleição do Presidente Obama a 4 anos; no qual o paradigma mudou nesse meio tempo no qual se antes a necessidade era saber onde os eleitores se mobilizavam, hoje a necessidade é saber o que esses eleitores pensam e realizar o micro-targeting de acordo com os seus pensamentos e comportamentos na esfera digital. Essas informações são de grande importância em relação a campanha; pois, dependendo do potencial de eleitores pode-se angariar mais recursos de patrocinadores, ou mesmo para elaboração de campanhas do tipo corpo a corpo na qual o candidado pode tanto fortalecer a sua base eleitoral nos lugares em que tem vantagem, ou mesmo fazer prospecção de novos votos em bases na qual não é tão forte eleitoralmente.

 O candidato Mitt Romney já investiu cerca de 60% a mais que Barack Hussein Obama e as pesquisas apontam hoje um empate técnico entre os dois, mesmo com o segundo candidato ter o apoio da máquina estatal a seu favor; o que mostra esse método até então tem uma eficácia bastante significativa.

A mineração de dados como nova ferramenta para as eleições americanas

Obama irá vencer as eleições de 2012

Em uma entrevista para o podcast IEEE Spectrum’s “Techwise Conversations” David Rothschild (Economista do Yahoo Labs) fala um pouco sobre a previsão elaborada por ele de que Obama irá vencer as eleições presidenciais desse ano. O destaque de fato da entrevista é que ele como economista apresenta diversas justificativas para o seu modelo de predição; no qual ele considerou diversas variáveis importantes e principalmente revelou que teve atenção especial sobre as tendências. Ótimo para quem quer saber em alto nível como se define um modelo para predição baseado em dados. 

Obama irá vencer as eleições de 2012