Os top 10 piores gráficos

Isso mostra que substância sem apresentação não faz qualquer sentido.

Roeder K (1994) DNA fingerprinting: A review of the controversy (with discussion). Statistical Science9:222-278, Figure 4
[The article | The figure | Discussion]
2. Wittke-Thompson JK, Pluzhnikov A, Cox NJ (2005) Rational inferences about departures from Hardy-Weinberg equilibrium. American Journal of Human Genetics 76:967-986, Figure 1
[The article | Fig 1AB | Fig 1CD | Discussion]
3. Epstein MP, Satten GA (2003) Inference on haplotype effects in case-control studies using unphased genotype data. American Journal of Human Genetics 73:1316-1329, Figure 1
[The article | The figure | Discussion]
4. Mykland P, Tierney L, Yu B (1995) Regeneration in Markov chain samplers. Journal of the American Statistical Association 90:233-241, Figure 1
[The article | The figure | Discussion]
5. Hummer BT, Li XL, Hassel BA (2001) Role for p53 in gene induction by double-stranded RNA. J Virol75:7774-7777, Figure 4
[The article | The figure | Discussion]
6. Cawley S, et al. (2004) Unbiased mapping of transcription factor binding sites along human chromosomes 21 and 22 points to widespread regulation of noncoding RNAs. Cell 116:499-509, Figure 1
[The article | The figure | Discussion]
7. Kim OY, et al. (2012) Higher levels of serum triglyceride and dietary carbohydrate intake are associated with smaller LDL particle size in healthy Korean women. Nutrition Research and Practice 6:120-125, Figure 1
[The article | The figure | Discussion]
8. Jorgenson E, et al. (2005) Ethnicity and human genetic linkage maps. American Journal of Human Genetics76:276-290, Figure 2
[The article | Figure 2a | Figure 2b | Discussion]
9. Cotter DJ, et al. (2004) Hematocrit was not validated as a surrogate endpoint for survival amoung epoetin-treated hemodialysis patients. Journal of Clinical Epidemiology 57:1086-1095, Figure 2
[The article | The figure | Discussion]
10. Broman KW, Murray JC, Sheffield VC, White RL, Weber JL (1998) Comprehensive human genetic maps: Individual and sex-specific variation in recombination. American Journal of Human Genetics 63:861-869, Figure 1
[The article | The figure | Discussion]

 

Os top 10 piores gráficos

Porque visualizamos dados quantitativos?

O Stephen  Few dá uma explicação magistral:

But why is it that we must sometimes use graphical displays to perform these tasks rather than other forms of representation? Why not always express values as numbers in tables? Why express them visually rather than audibly? Essentially, there is only one good reason to express quantitative data visually: some features of quantitative data can be best perceived and understood, and some quantitative tasks can be best performed, when values are displayed graphically. This is so because of the ways our brains work. Vision is by far our dominant sense. We have evolved to perform many data sensing and processing tasks visually. This has been so since the days of our earliest ancestors who survived and learned to thrive on the African savannah. What visual perception evolved to do especially well, it can do faster and better than the conscious thinking parts of our brains. Data exploration, sensemaking, and communication should always involve an intimate collaboration between seeing and thinking (i.e., visual thinking).

Abaixo ele coloca a tabela das tarefas e metas da visualização de dados.

Web

Porque visualizamos dados quantitativos?

Visualização de Dados: Incerteza, e Ambigüidade

Neste artigo da Nature escrito por Vivien Marx ela traça bons paralelos com a atividade de visualização de dados e as incertezas e ambiguidades dessa forma de análise de dados.

A visualização de dados tornou-se uma disciplina muito estudada em especial nos últimos 20 anos, com especial destaque para os trabalhos do Edward Tufte. Entretanto um dos fatos que é pouco salientado até mesmo no estudo desta disciplina é que a visualização de dados obrigatoriamente implica na perda de informação. Ponto.

Essa perda refere-se a questões ligadas a modelagem gráfica na qual o analista de dados deve por obrigação realizar a abstração de dados para posteriormente enquadrar os mesmos em um formato orientado à visualização destes dados.

Não há nada de errado nisso, mas como a Sra. Marx coloca em ser artigo, nunca deve ser esquecido que:

“Being sure is good; being uncertain is not necessarily bad.”

Um dos pontos interessantes do artigo é sem dúvidas no aspecto da incerteza nos modelos de visualização de dados no qual a passagem abaixo representa muito bem isso:

“Uncertainty comes in many flavors. It can arise upon data capture, during analysis or during visualization. It may be due to missing, noisy or imprecise data or to filters that could skew calculations, or there may be too few data to begin with, says Heidrun Schumann, a computer scientist at the University of Rostock who studies uncertainty visualization in many research areas, including the life sciences”

O ponto principal do artigo e que pode servir para analistas de dados é que muitas das vezes um modelo de visualização mesmo com as suas abstrações de dados e com o seu grau de incerteza pode auxiliar na tomada de decisão por dois aspectos básicos que são 1) o tempo disponível para a análise dos dados e 2) forma de abstração e agregação da informação relevante que neste caso assume-se a incerteza e os riscos atrelados nela.

nmeth.2530

Visualização de Dados: Incerteza, e Ambigüidade

7 segredos da Visualização

Este post de Nate Agrin e Nick Rabinowitz realizam uma ótima lista a respeito dos segredos da visualização, no qual eles colocam uma visão bastante útil em relação à projetos dessa natureza.

Hoje com a facilidade do uso das ferramentas de visualização, muito do que se entendia como análise de dados está se resumindo a análise iconográfica, na qual aspectos como estacionariedade, análise de tendências/anomalias está virando mais um exercício lúdico do que ferramentas de suporte para executivos e tomadores de decisão.

Segue a lista destacada no post:

  1. Real data is ugly
  2. A bar chart is usually better
  3. There’s no substitute for real data
  4. The devil is in the details
  5. Animate only when appropriate
  6. Visualisation is not analysis
  7. Data visualisation takes more than code  

 

 

 

 

 

7 segredos da Visualização

Visualização de Dados, e o efeito Placebo

Nos dias atuais há uma preocupação latente de todas as empresas em ter o diferencial competitivo (tá eu sei que isso é papo chato de livrinho de administração de faculdade, mas o clichê nesse caso é válido devido a exemplificação do ponto de vista) e sem sombra de dúvidas os dados da empresa são esse diferencial (Alguns falam que é o Marketing, mas é engraçado como o mesmo como instrumento de ampliação de vendas tem que se basear nos… Dados).

Dentro desse contexto, os vendedores de ferramentas de Business Intelligence fazem o possível em termos de marketing para disponibilizar mais ferramentas para simplificar as análises dos gestores, e CEOs ao longo de diversas companhias. Nada de errado nisso; entretanto, o mundo de gráficos, termômetros, Dashboards não só estão estancando a capacidade de análise dos gestores, como tem colocado em posições de decisão pessoas despreparadas para analisar esses dados devido à essa simplicidade que os Dahboards oferecem, pois esses mesmos dashboards não te dão a noção das métricas e de toda a complexidade que está reduzida naquele ícone.

Um bom site com esse tipo de discussão é do Stephen Few, vale a pena conferir.

Visualização de Dados, e o efeito Placebo