Análise Arquetípica de Dados

Esse e um post antigo do Engaging Market Research, no qual é apresentada a Análise Arquetípica de Dados; que é um estudo sobre bases de dados nas quais os clientes são segmentados de forma que suas características de caráter quantitativos e qualitativos sejam misturadas para fins de maximizar a similaridade intracluster, e possibilitar que esses grupos de clientes sejam, portanto, mais homogêneos.

Esses estudos aplicados ao Marketing e principalmente ao Customer Relationship Management (CRM) dão os responsáveis desses departamentos um raio X sobre as características de seus clientes, e consequentemente subsidiam as estratégias para retenção ou captação de novos clientes, de forma a não somente separar os clientes nos clusters; mas também provisionar uma estratégia de massa que tenha impacto em aspectos particulares desses clientes,  por exemplo campanhas de target-marketing dirigidas a preferências pessoais com alto potencial de RFM como preferência de time de preferência, experiências gastronômicas, entre outros.

 

Análise Arquetípica de Dados

Básico sobre Segmentação de Clientes em Marketing

Para quem deseja aplica a mineração de dados especificamente em Marketing, este artigo do Inside Data Mining explica características bem interessantes sobre o tema, e como devem ser construídas as métricas de negócios.

Básico sobre Segmentação de Clientes em Marketing

Um modelo de aplicação de Mineração de Dados para Score de Crédito – A framework of data mining application process for credit scoring

Esse artigo apresenta um framework muito elaborado no qual Yang Liu passa pelos aspectos básicos da mineração de dados. O artigo conta com uma ótima bibliografia de apoio. De maneira geral o artigo coloca a mineração de dados como um meio de obter análises de portfólios através de métodos indutivos paramétricos e/ou não paramétricos. A diagramação é ótima na qual dá apoio significativo ao que está sendo explicado. Obrigatório para quem trabalha com scoring de crédito em geral.

A Framework of a Data Mining Application Process to a Credit Scoring

Um modelo de aplicação de Mineração de Dados para Score de Crédito – A framework of data mining application process for credit scoring

Resenha: Data Mining Techniques: For Marketing, Sales, and Customer Relationship Management

Este livro do Berry e Linoff é um bom manual de mineração de dados dirigido para managers e analistas de marketing.

O livro é bem estruturado em questão de escolha capítulos para abordagem, os quais através de um texto conciso os autores passam pelas principais técnicas de mineração de dados e passam desde o básico até o avançado.

O texto tem como principal característica uma série de exemplos, e uma parte textual bem densa; o que para alguns pode representar uma determinada prolixidade dos autores. Como em alguns livros da Wiley, o livro tem uma série de caixas de texto auxiliares os quais tem alguns insights muito bons para auxiliar na fixação dos conceitos.

Alguns pontos negativos do livro são a) A prolixidade dos autores quando na descrição das técnicas e principalmente na forma de criar cenários de utilização, o que pode tirar a paciência dos leitores que conhecem ao menos o básico da mineração de dados; b) no ponto de vista técnico o livro carece de um cuidado maior quanto à editoração do texto em si, no qual coloca um leque de possibilidades, e, contudo não fala que para aplicar aqueles conceitos seria necessário no mínimo umas 8 ferramentas e que holisticamente nem todas as técnicas são adequadas para uma análise direcionada a profissionais de marketing; e c) muito overview, onde quem tem os conhecimentos básicos em mineração de dados pode sentir a sensação de tópico requentado.

Os pontos positivos do livro são sem sombra de dúvidas a) a amplitude de assuntos no qual os autores colocam muito bem as técnicas de mineração de dados através de um texto bem elaborado e com uma linguagem acessível, b) os estudos de casos e as caixas de texto ao longo o livro formam um material de apoio muitíssimo elaborado e auxiliam na fixação dos conceitos, c) um livro de domínio de aplicação de mineração de dados com um direcionamento muito claro o que é um recurso muito bom para os profissionais da área e quem não é profissional de marketing pode aproveitar os conceitos, e d) gráficos bem elaborados.

 O livro é muito bom, e é voltado diretamente para o publico de marketing, em especial managers e analistas; entretanto a audiência de mineração de dados pode adquirir o livro sem problemas. Não espere um livro com walkthrough em algoritmos e técnicas, pois há outras obras muito mais interessantes nesse sentido.

Resenha: Data Mining Techniques: For Marketing, Sales, and Customer Relationship Management

2011 Data Miner Survey – Relatório sobre práticas em Mineração de Dados

No ano de 2011 foi realizada uma pesquisa pela Rexer Analytics sobre as principais práticas de mineração de dados, bem como as tendências. De forma geral pelos highlights dá para se perceber que apesar da evolução das técnicas muito do que está em ‘produção’ hoje tem a ver com o básico: Árvore de Decisão, Análise de Cluster e Regressão.

Isso mostra que deve haver um trabalho de base forte para consolidação da mineração de dados no cenário nacional; em especial, na área acadêmica na qual há a apresentação de conceitos avançados sendo que na prática há pouco sendo feito.

 Alguns dos pontos principais elencados pela pesquisa:

 FIELDS & GOALS:  Data miners work in a diverse set of fields.  CRM / Marketing has been the #1 field in each of the past five years.  Fittingly, “improving the understanding of customers”, “retaining customers” and other CRM goals continue to be the goals identified by the most data miners.

 ALGORITHMS:  Decision trees, regression, and cluster analysis continue to form a triad of core algorithms for most data miners.  However, a wide variety of algorithms are being used.   A third of data miners currently use text mining and another third plan to in the future.  Text mining is most often used to analyze customer surveys and blogs/social media.

TOOLS:  R continued its rise this year and is now being used by close to half of all data miners (47%).  R users report preferring it for being free, open source, and having a wide variety of algorithms.  Many people also cited R’s flexibility and the strength of the user community.  In the 2011 survey we asked R users to tell us more about their use of R.  Read the R user comments about why these use R (pros), the cons of using R, why they select their R interface, and how they use R in conjuction with other tools.  STATISTICA is selected as the primary data mining tool by the most data miners (17%).  Data miners report using an average of 4 software tools overall.  STATISTICA, KNIME, Rapid Miner and Salford Systems received the strongest satisfaction ratings in 2011.

TECHNOLOGY:  Data Mining most often occurs on a desktop or laptop computer, and  requently the data is stored locally.  Model scoring typically happens using the same software used to develop models.

VISUALIZATION:  Data miners frequently use data visualization techniques.  More than four in five use them to explain results to others.  MS Office is the most often used tool  for data visualization.  Extensive use of data visualization is less prevalent in the Asia-Pacific region than other parts of the world.

ANALYTIC CAPABILITY & SUCCESS:  Only 12% of corporate respondents rate their company as having very high analytic sophistication.  However, companies with better analytic capabilities are outperforming their peers.  Respondents report analyzing analytic success via Return on Investment (ROI), and analyzing the predictive validity or accuracy of their models.  Challenges to measuring analytic success include client or user cooperation and data availability / quality.  

FUTURE:  Data miners are optimistic about continued growth in data mining adoption and the positive impact data mining will have.  As in previous years, data miners see growth in the number of projects they will be conducting.  And growth in data mining adoption is the number one “future trend” identified.  Participants pointed out that care must be taken to protect privacy when conducting data mining.  Data miners also shared many examples of the positive impact they feel data mining can have to benefit society.  Health / medical advances was the area of positive impact identified by the most data miners. 

2011 Data Miner Survey – Relatório sobre práticas em Mineração de Dados

Análise RFM

Um dos tópicos mais comuns para quem trabalha com Mineração de Dados em escala gerencial em especial em setores de CRM é RFM que é a sigla de Recency, Frequency, and Monetary Value (Fator de Recência, Frequência e Valor Monetário) e é um fator de metrificação que tem como finalidade identificar a distribuição de clientes, e o seu comportamento de acordo com a última situação de consumo mais a frequência que o mesmo realiza suas compras bem como o seu valor monetário, isto é o quanto ele efetivamente gasta.

Com esse tipo de métrica é possível realizar análises de segmentação de clientes, como desenvolvimento de campanhas de marketing, ou até mesmo auxiliar setores de cobrança na questão do modelo de liquidação de portfólio de cobrança.

Dois cenários rápidos de aplicação do RFM:

a)      Dentro de uma base de clientes você deseja realizar uma campanha de marketing para fidelização de clientes, no qual de acordo com o RFM você pode escolher os clientes que tenham menor fator F (Frequência) ordenados pelo seu valor monetário e posteriormente pela última atividade de compra (Recência); e

b)      Através de uma campanha de cobrança, você pode incluir o RFM para indicar o quão valioso é o cliente na questão de enviar ou não uma carta; ou mesmo dentro de um limite de acionamento você colocar os clientes mais valiosos em valor monetário (M) em prioridade de acordo com o quão recente é o seu débito (R) já que dívidas recentes tem uma propensão maior para serem pagas.

O artigo em si é bem sintético, porém  dá ótimas dicas de como utilizar o conceito de RFM.

Análise RFM