Análise Arquetípica de Dados

Esse e um post antigo do Engaging Market Research, no qual é apresentada a Análise Arquetípica de Dados; que é um estudo sobre bases de dados nas quais os clientes são segmentados de forma que suas características de caráter quantitativos e qualitativos sejam misturadas para fins de maximizar a similaridade intracluster, e possibilitar que esses grupos de clientes sejam, portanto, mais homogêneos.

Esses estudos aplicados ao Marketing e principalmente ao Customer Relationship Management (CRM) dão os responsáveis desses departamentos um raio X sobre as características de seus clientes, e consequentemente subsidiam as estratégias para retenção ou captação de novos clientes, de forma a não somente separar os clientes nos clusters; mas também provisionar uma estratégia de massa que tenha impacto em aspectos particulares desses clientes,  por exemplo campanhas de target-marketing dirigidas a preferências pessoais com alto potencial de RFM como preferência de time de preferência, experiências gastronômicas, entre outros.

 

Análise Arquetípica de Dados

Nem o DNA, nem a Mineração de Dados substituí o diálogo com os consumidores

Este post da B2C coloca em perspectiva a utilização de aspectos relativos aos genes dos consumidores e aspectos comportamentais para desenvolvimento de estratégias de marketing dirigido.

Nem o DNA, nem a Mineração de Dados substituí o diálogo com os consumidores

Básico sobre Segmentação de Clientes em Marketing

Para quem deseja aplica a mineração de dados especificamente em Marketing, este artigo do Inside Data Mining explica características bem interessantes sobre o tema, e como devem ser construídas as métricas de negócios.

Básico sobre Segmentação de Clientes em Marketing

New Journal – International Journal of Business Analytics and Intelligence

O lançamento do International Journal of Business Analytics and Intelligence vem a trazer para os analistas de dados, mais uma revista científica para os analistas de dados. Dentro da proposta da revista, o foco será indexar trabalhos relativos a análise de dados, Business Intelligence e ao que tudo indica pode ser um ótimo repositório de dados relativo à Mineração de Dados. Segue abaixo a apresentação da revista:

Journal includes key research areas (Not limited to) such as big data processing and analytics, business intelligence, visual analytics, descriptive analytics, predictive analytics, business analytics and optimization, actuarial modeling, social network analytics, data mining tools, web analytics, text analytics, marketing research, modeling, workforce analytics, business intelligence, data management, decision management, BI architecture, retail analytics, graph entropy, decision trees, analytics applications.

 

New Journal – International Journal of Business Analytics and Intelligence

Nate Silver, a Mineração de Dados e Modelos Preditivos: E porque você deveria olhar os seus dados?

As 9:37hs do dia 7 Novembro cerca de 90% dos estados já estão com os votos computados; e o Presidente Barack Hussein Obama foi reeleito; e dentro da esfera da análise de dados o grande nome dessa eleição se chama Nate Silver.

Para quem não sabe; Nate Silver é o autor do livro The Signal and the Noise: Why So Many Predictions Fail-but Some Don’t (O Sinal e o Ruído: Porque muitas previsões falham, mas algumas não. Tradução do Autor); no qual em linhas gerais coloca em perspectiva a causa da falha de muitos modelos de predição, onde o autor coloca que aspectos conjunturais são mais importantes do que tendências baseadas em critérios mais técnicos. Particularmente o livro apresenta muitos Rules of Thumb (regras de aplicação geral sem nenhum tipo de explicação exata de fato); mas a idéias do blog do Nate são muito mais consistentes e tem um grau de profundidade maior que o livro; mas isso é outro assunto.

O ponto principal é o que ninguém (fora do campo de análise de dados) conseguiu responder: É como um geek da área de análise de dados (um estatśitico de ofício e blogueiro (como diria o João Manoel Mello))  conseguiu acertar previsões das eleições em TODOS OS ESTADOS? E o mais importante: Como todo o establishment televisivo, acadêmico e político com analistas políticos, cientistas políticos, comentaristas (palpiteiros profissionais como diria Olavo de Carvalho) não conseguiram sequer realizarem projeções com eficácia mínima; chegando ao ponto dos apresentadores do Manhattan Connection (que é um ótimo programa por sinal) parecerem patetas com palpites que mudavam a cada 15 minutos, ao invés de analisarem aquilo que estava evidente para todos que era a conjectura política-econômica e os dados que foi exatamente que o Nate Silver viu e apresentou um resultado bastante consistente baseado nestes dois aspectos.

State by State Probabilities
State by State Probabilities
State By State Results
State By State Results

Dentro desse cenário fica mais que provado que para quem trabalha com análises preditivas deve ser consideradas as seguintes regras de ouro: 1)Olhe os dados; 2) Olhe os dados novamente; 3)Assim que terminar o passo Nr 2 olhe os dados novamente; 4) Considere a conjectura que envolve os dados que você está olhando; 5) Considere as ferramentas que tem disponível e extraia o máximo de conhecimento dos dados; 6) Faça uma análise analítica dos dados; e por final 7) Faça a junção das análises analíticas com as conjecturas e você terá um modelo preditivo.

Nate Silver, a Mineração de Dados e Modelos Preditivos: E porque você deveria olhar os seus dados?

A Mineração de Dados e a Degradação da Democracia

Esse artigo explica o que está por trás das estratégias de target marketing dos presidenciáveis dos Estados Unidos; e algumas desvantagens relativas ao uso de dados pessoais para mapeamento de delineamento de estratégias de campanha.

A Mineração de Dados e a Degradação da Democracia

O Atirador de Aurora em Perspectiva

Alguns atrás dias postamos algo a respeito desse assunto, indicando que com uma seleção de variáveis simples; e posterior análises o atirador de Aurora poderia ter sido facilmente identificado sob a perspectiva da mineração de dados.

Nessa entrevista do Robert L. Mitchell na qual ele chama um dos ícones da mineração de dados o Dean Abbott (autor do bom artigo An Evaluation of High-end Data Mining Tools for Fraud Detection) o qual o mesmo dá a seguinte declaração:

“While it certainly was the case here that [the shooter] purchased a lot of stuff and that there didn’t appear to be a good, law-abiding reason for him to purchase the gear, it is unclear if his pattern of purchases is unusual”  when examined in the context of the purchases of hundreds of millions of other citizens, he says.  For example, given the universe of more than 400 million people, it might very well be possible that 20,000 people made similar volumes of purchases in the same time period. But how many of those are exhibiting risky behavior?

Não tirando o mérito e tudo o que o Dean já fez pela mineração de dados, mas pegar um especialista em target marketing e projetos ligados à área comercial para tratar de um tema altamente criminal não parece ser algo inteligente, ou bem intencionado quando para se colocar a mineração de dados à mesa.

Há no mínimo três fontes primárias no assunto que são os livros Investigative Data Mining for Security and Criminal Detection do Jesus Mena, Data Mining and Predictive Analysis: Intelligence Gathering and Crime Analysis do Colleen McCue e o Data Mining for Intelligence, Fraud & Criminal Detection: Advanced Analytics & Information Sharing Technologies do Christopher Westphal.

Esses livros (que já estão na fila para serem resenhados aqui no site) tratam exatamente desse tema, dentro de uma perspectiva constitucional para tomada de decisão, seja do poder legislativo com modificações nas leis; seja na esfera executiva/policial com vigilância e prevenção.

Aqui no Brasil uma ótima apresentação foi realizada por André Cavalcante Hora e Zilton Cordeiro Junior sob o acompanhamento do professor Wagner Meira Júnior; no qual os autores utilizaram regras de associação no WEKA para descobrir regras para auxiliar na formulação de políticas e estratégias de policiamento. Até mesmo chegamos a formular uma base de teste chamadas Crimes, na qual é um pequeno mock-up baseado no projeto dos alunos citados.

A mineração de dados pode auxiliar na tomada de decisões relacionadas à esfera criminal e negar isso mostra não só desconhecimento, mas total ignorância com os recursos dessas técnicas que vem crescendo mais e mais ao redor do mundo.

O Atirador de Aurora em Perspectiva

A mineração de dados como nova ferramenta para as eleições americanas

A matéria da Dawn mostra que grande parte da porcentagem de votos do próximo Presidente dos Estados Unidos da América terá na mineração de dados uma forma de 1) angariar recursos de campanha, 2) realizar prospecções de potenciais doadores, 3) mobilizar nichos de usuários na rede em prol da militância sobre um determinado candidato, e 4) alinhamento de discurso sobre em qual o candidato irá adotar em determinada região do país.

 Esse domínio eleitoral, está se estabelecendo a passos largos e essa eleição nos EUA será algo como o batismo de fogo, onde; na mesma forma em que as mídias sociais foram na eleição do Presidente Obama a 4 anos; no qual o paradigma mudou nesse meio tempo no qual se antes a necessidade era saber onde os eleitores se mobilizavam, hoje a necessidade é saber o que esses eleitores pensam e realizar o micro-targeting de acordo com os seus pensamentos e comportamentos na esfera digital. Essas informações são de grande importância em relação a campanha; pois, dependendo do potencial de eleitores pode-se angariar mais recursos de patrocinadores, ou mesmo para elaboração de campanhas do tipo corpo a corpo na qual o candidado pode tanto fortalecer a sua base eleitoral nos lugares em que tem vantagem, ou mesmo fazer prospecção de novos votos em bases na qual não é tão forte eleitoralmente.

 O candidato Mitt Romney já investiu cerca de 60% a mais que Barack Hussein Obama e as pesquisas apontam hoje um empate técnico entre os dois, mesmo com o segundo candidato ter o apoio da máquina estatal a seu favor; o que mostra esse método até então tem uma eficácia bastante significativa.

A mineração de dados como nova ferramenta para as eleições americanas

Como as empresas aprendem os seus segredos?

Esse especial do New York Times escrito por Charles Duhigg  (Autor do livro The Power of Habit: Why We Do What We Do in Life and Business) tem como foco um tema bastante recorrente em relação a modelagem, e entendimento de domínio de Mineração de Dados que é o estudo de hábitos do consumidor.

Em geral o artigo trata do fato das empresas em especial de varejo buscarem mais dados dos consumidores e realizarem a construção de Personas (Profiles de clientes com determinadas características em comum) para realizar um marketing mais segmentado no qual com uma gama de recursos minimizada obter o máximo de retorno no ato de atingir os consumidores em potencial dos produtos. O caso mais emblemático tratado no artigo é o fato de um varejista realizar um trabalho de construção de personas tão apurado que através dos produtos adquiridos eles conseguem saber se a consumidora está grávida.

Veja essa construção de Persona feita pelo artigo:

A fictional Target shopper named Jenny Ward, 23, lives in Atlanta and in March she bought cocoa-butter lotion, a purse large enough to double as a diaper bag, zinc and magnesium supplements and a bright blue rug. There’s a very high chance that she’s pregnant, and her delivery date is sometime in late August, and Target connects those dots.

Vale a pena a leitura.

Como as empresas aprendem os seus segredos?