Não, não precisamos de leis para a mineração de dados

Neste post do Frank Pasquale é aberta a discussão relativa à regulamentação da mineração de dados, especificamente na prática de escoragens (scoring), atividade esta que, na visão do autor, é um problema devido ao fato que pode discriminar as pessoas.

O argumento do artigo é que muitas formas de decisão baseadas em dados tornam o processo menos transparente do ponto de vista social.

Eis que o autor afirma:

Data-driven decision making is usually framed as a way of rewarding high performers and shaming shirkers. But it’s not so simple. Most of us don’t know that we’re being profiled, or, if we do, how the profiling works. We can’t anticipate, for instance, when an apparently innocuous action — such as joining the wrong group on Facebook — will trigger a red flag on some background checker that renders us in effect unemployable. We’ll likely never know what that action was, either, because we aren’t allowed to see our records.

It’s only complaints, investigations and leaks that give us occasional peeks into these black boxes of data mining. But what has emerged is terrifying.

Naturally, just as we’ve lost control of data, a plethora of new services are offering “credit repair” and “reputation optimization.” But can they really help? Credit scoring algorithms are secret, so it’s hard to know whether today’s “fix” will be tomorrow’s total fail. And no private company can save us from the thousands of other firms intent on mashing up whatever data is at hand to score and pigeonhole us. New approaches are needed.

In general, we need what technology law and policy researcher Meg Leta Jones calls “fair automation practices” to complement the “fair data practices” President Barack Obama is proposing. We can’t hope to prevent the collection or creation of inappropriate or inaccurate databases. But we can ensure the use of that data by employers, insurers and other decision makers is made clear to us when we are affected by it.

Uma afirmação que se não foi ingenua beira a maldade. A forma de decisão baseada em dados é a mais transparente que existe pois não obedece critérios subjetivos, vieses de qualquer natureza, e coloca a todos em um mesmo patamar de igualdade; isso para não dizer que é o mais justo.

Acreditar nos dados, em mais ainda entender o contexto decisório é a forma mais justa de se decidir.

O tema merece muitas discussões ligadas à diretrizes de como essas informações são manipuladas, mas não será com mais regulamentação que esse fato de que pessoas estão recebendo escores vai mudar.

Não, não precisamos de leis para a mineração de dados

Manipulação de opiniões no Facebook… Manipulação?

Primeiro uma breve contextualização sobre o assunto.

Em meados de setembro/outubro do ano passado alguns pesquisadores ligados à Google fizeram um estudo relativo ao contágio de sentimentos através das redes sociais usando informações do próprio Facebook.

Aqui está o abstract do artigo:

We show, via a massive (N = 689,003) experiment on Facebook, that emotional states can be transferred to others via emotional contagion, leading people to experience the same emotions without their awareness. We provide experimental evidence that emotional contagion occurs without direct interaction between people (exposure to a friend expressing an emotion is sufficient), and in the complete absence of nonverbal cues.

Emotional states can be transferred to others via emotional contagion, leading people to experience the same emotions without their awareness. Emotional contagion is well established in laboratory experiments, with people transferring positive and negative emotions to others. Data from a large real-world social network, collected over a 20-y period suggests that longer-lasting moods (e.g., depression, happiness) can be transferred through networks [Fowler JH, Christakis NA (2008) BMJ 337:a2338], although the results are controversial. In an experiment with people who use Facebook, we test whether emotional contagion occurs outside of in-person interaction between individuals by reducing the amount of emotional content in the News Feed. When positive expressions were reduced, people produced fewer positive posts and more negative posts; when negative expressions were reduced, the opposite pattern occurred. These results indicate that emotions expressed by others on Facebook influence our own emotions, constituting experimental evidence for massive-scale contagion via social networks. This work also suggests that, in contrast to prevailing assumptions, in-person interaction and nonverbal cues are not strictly necessary for emotional contagion, and that the observation of others’ positive experiences constitutes a positive experience for people.

Em suma: O Facebook propositalmente testou em pouco mais de 700 mil usuários o efeito do contágio de sentimentos através da ‘supressão ou adição de informações’ na linha do tempo desses usuários.

Houve uma grande polêmica em torno do assunto, inclusive até os editores emitiram uma nota esclarecendo alguns aspectos do estudo, e houve a mesma reclamação de sempre.

Com esse plano de fundo, no blog do Andrew Gelman foi escrito um post interessante sobre a questão e se essas reclamações são justificáveis ou não, e a resposta é categórica:

[…] It seems a bit ridiculous to say that a researcher needs special permission to do some small alteration of an internet feed, when advertisers and TV networks can broadcast all sorts of emotionally affecting images whenever they want. The other thing that’s bugging me is the whole IRB thing, the whole ridiculous idea that if you’re doing research you need to do permission for noninvasive things like asking someone a survey question.[…]

[…]So, do I consider this Facebook experiment unethical? No, but I could see how it could be considered thus, in which case you’d also have to consider all sorts of non-research experiments (the famous A/B testing that’s so popular now in industry) to be unethical as well. In all these cases, you have researchers, of one sort or another, experimenting on people to see their reactions. And I don’t see the goal of getting published in PNAS to be so much worse than the goal of making money by selling more ads.[…]

[…]Again, I can respect if you take a Stallman-like position here (or, at least, what I imagine rms would say) and argue that all of these manipulations are unethical, that the code should be open and we should all be able to know, at least in principle, how our messages are being filtered. So I agree that there is an ethical issue here and I respect those who have a different take on it than I do—but I don’t see the advantage of involving institutional review boards here. All sorts of things are unethical but still legal, and I don’t see why doing something and publishing it in a scientific journal should be considered more unethical or held to a more stringent standard than doing the same thing and publishing it in an internal business report.[…]

Em outras palavras: Não adianta a critica ao que o Facebook fez se de uma maneira ou de outra a propaganda/publicidade/marketing vem fazendo isso a anos. Não é porque alguém publica em um periódico acadêmico que faz ele menos “ético”(cabe ao juízo de valor de cada um) de quem faz isso internamente através de relatórios.

Nota Pessoal: Como ‘insider’ do mundo do crédito, produtos bancários não padronizados, e localização eu recomendo que a paranóia nada ajuda nestes casos. Hoje com um CEP preenchido em algum formulário para se ganhar um desconto em alguma coisa e o CPF qualquer pessoa pode ser localizada no Brasil; e as empresas de cartão de crédito sabem muito sobre nós todos.

Privacidade hoje só existe em dois lugares: Mídias não estruturadas  (e.g. cadernos, post it, anotações espúrias, etc); ou para terroristas e demais membros de organizações criminosas que não possuem nenhum traço no meio digital e só realizam transações off-market (e.g. contrabando, tráfico de drogas, fluxo de armas para terroristas, etc.) .

Manipulação de opiniões no Facebook… Manipulação?

Experimento do Facebook e Gatos Felizes

Direto do KDNuggets.

 

cartoon-facebook-data-science-experiment

Homem: “Eu estava para escrever um post agressivo sobre o estudo de manipulação emocional do Facebook, mas então eu me distraí com todas as fotos de gatos felizes que eles me mostraram.”

Para quem não entendeu esse é o artigo da Forbes que mostra um pouco sobre o estudo de manipulação de sentimentos, e aqui é o artigo original.

Para quem quiser realizar o download do artigo original, o link está abaixo.

PNAS-2014-Kramer-8788-90

 

Experimento do Facebook e Gatos Felizes

Palantir e a simbiose entre Governo e Empresas

Esse artigo do Andy Greenberg o autor faz um panorama muito útil sobre a história da Palantir e a simbiose  governo americano em relação aos casos de vazamento de informações sobre o maior programa de Data Gathering em curso da história da humanidade.

Palantir e a simbiose entre Governo e Empresas

França deseja tributar atividades de Mineração de Dados

O Presidente François Hollande acabou de chegar ao poder e já mostrou ao que veio 1) elevar de forma quase que pornográfica o imposto de renda, e 2) engajar uma guerra para “aquecer” a economia.

Entretanto, o Sr. Presidente Hollande ainda quer realizar a tributação de atividades de mineração de dados, e economia da informação de empresas estrangeiras que realizam Data Gathering de seus compatriotas.

A justificativa é que essas empresas (as americanas) tomaram conta do mercado e as mesmas realizam a consolidação de dados sobre os franceses, vendem propaganda direcionada a esta audiência e o estado não participa dessa receita.

Se isso for aprovado será o maior movimento estatal de Free Ride já registrado na história econômica. E ainda criaram um relatório sobre isso que pode ser acessado neste link.

Vejam a fala de  Félix Treguer que exerce a função semelhante a um conselheiro a assuntos relacionados a privacidade digital:

“The French government has a record of favoring local press or publishers over companies like Google or Amazon, sometimes to an extreme. The truth is that the French government is captive to these national lobbies. But it’s also the case that the digital economy is fast becoming a very large part of the global economy, yet France’s tax system, and other countries’ tax system, are not adapted to this. In this sense I think it’s legitimate that France is asking itself how it can tax more of the profitable digital activity taking place in France.”

Além dessa idéia ser absolutamente fora de contexto, é provavelmente impossível que o governo tenha algum tipo de controle, ao não ser que seja implantado algum tipo de filtro semelhante ao da China.

França deseja tributar atividades de Mineração de Dados

Agências americanas em conflito devido a programas de mineração de dados

Um assunto muito sério, que se não tratado de maneira sóbria por parte dos legisladores americanos, pode afetar e muito a vida dos usuários da web.

Agências americanas em conflito devido a programas de mineração de dados

A Patente “Personal Data Mining” e as implicações decorrentes

A patente registrada no escritório de patentes dos EUA relativa ao Personal Data Mining não está chamando muito atenção, mas tem o potencial de ter o maior impacto devido as suas implicações diretas sobre como questões de privacidade, mobilidade e principalmente monitoramento e acompanhamento de hábitos sejam eles offline ou online.

Primeiramente vemos como está o resumo da patente:

Personal data mining mechanisms and methods are employed to identify relevant information that otherwise would likely remain undiscovered. Users supply personal data that can be analyzed in conjunction with data associated with a plurality of other users to provide useful information that can improve business operations and/or quality of life. Personal data can be mined alone or in conjunction with third party data to identify correlations amongst the data and associated users. Applications or services can interact with such data and present it to users in a myriad of manners, for instance as notifications of opportunities.

Em termos gerais essa patente tem como principal característica realizar através de uma plataforma de integração de dispositivos um repositório de dados de usuários, no qual essas informações oriundas de diversos tipos de dispositivos entrariam nesse repositório de dados, e seriam consolidadas para serem utilizadas.

Lendo um pouco mais o texto do registro da patente (em especial a página 23), fica claro que está em curso um dos maiores movimentos de consolidação de dados a respeito de mídias sociais já realizado por qualquer organização de qualquer porte, na qual através de uma determinada rede de negócios, todos os passos online podem ser capturados, e utilizados para consolidação neste repositório de dados sem que haja uma política de privacidade citada no referido texto.

O texto e o assunto como um todo será tratado neste site mais adiante; contudo, esse é um tema que não pode passar sem uma reflexão de cunho ético para todos que se interessam sobre mineração de dados.

US7930197

A Patente “Personal Data Mining” e as implicações decorrentes

A vida como um livro aberto graças à mineração de dados

Essa reportagem do Kennebec Journal mostra que a vida está muito exposta com o advento da maior aquisição de dados via mineração de dados a vida de todos está mais exposta.

A vida como um livro aberto graças à mineração de dados

Os Perigos da Mineração de Dados no Aspecto Eleitoral

Sobre a utilização da mineração de dados nas eleições americanas; e com um quote que já vale o artigo:

Do you watch college football? Listen to smooth jazz? Search the Internet for guidance on parenting, spirituality or a health concern? Look at pornography sites online?

Do you like the fact that political strategists with the presidential campaigns know the answers to each of those questions?

Os Perigos da Mineração de Dados no Aspecto Eleitoral

Mineração de Dados X Senado

Esse embate está em vias de entrar na FTC (Federal Trade Comission, algo como o nosso Conselho de Administração Econômica (CADE) que tem como função auditar e verificar questões relativas as atividades comerciais no Estados Unidos) e tem como objeto uma dúvida do senador John Rockfeller na qual ele questiona os trabalhos de Data Gathering e comercialização de dados seja de birôs de cobrança; comércio de dados e agregadores diversos. É uma questão que merece uma atenção especial e que tem impacto direto dentro da mineração de dados.

O documento original está aqui.

John Rockfeller – Letter in FTC Commision

Mineração de Dados X Senado

A Mineração de Dados pode parar a matança? – Uma reflexão sobre o episódio do Atirador do Colorado e a Mineração de Dados

Até esse momento diversos sites já estão reportando a situação sobre o atirador do Colorado nos Estados Unidos e estão nesse exato momento acontecendo diversos debates (Controle de Armas, Vídeo Games, Políticas de Restrições de Liberdades, entre outros.) (http://www.nytimes.com/2012/07/21/us/shooting-at-colorado-theater-showing-batman-movie.html) que estão fora do escopo de atuação desse site.

Entretanto, o assunto serve como plano de fundo para uma discussão que envolve Mineração de Dados e desenvolvimento de políticas de acesso á dados e controle governamental sobre dados “privativos”. O artigo do Holman W. Jenkins, Jr do Wall Street Journal coloca a questão à mesa em uma visão sóbria e realista pegando como exemplo o massacre ocorrido.

O artigo realiza uma série de indagações sobre quando a mineração de dados poderá ser usada para  interromper esse tipo de matança (por isso o título original do artigo Can Data Mining Stop the Killing?) e sobre as discussões sobre o programa Total Information Awareness que regula sobre as questões de Data Gathering e Mineração de Dados sobre informações de todos os cidadãos dos EUA.

Mas há dois trechos do artigo que merecem um destaque especial, que são:

[…]The Colorado shooter Mr. Holmes dropped out of school via email. He tried to join a shooting range with phone calls and emails going back and forth. He bought weapons and bomb-making equipment. He placed orders at various websites for a large quantity of ammunition. Aside from privacy considerations, is there anything in principle to stop government computers, assuming they have access to the data, from algorithmically detecting the patterns of a mass shooting in the planning stages? […]

Tradução livre: O atirador do Colorado Sr. Holmes largou a escola via um e-mail. Ele tentou se filiar a um clube de tiro com chamadas telefônicas e e-mails indo e voltando. Ele comprou armas e equipamento para fabricação de bombas. Ele encomendou em diversos sites ampla quantidade de munição. Deixando de lado questões relacionadas à privacidade, há alguma coisa em princípio para interromper os computadores do governo, assumindo que eles têm o acesso aos dados, e detectar algoritmicamente os padrões de planos de chacinas em seus estágios iniciais?

 E esse trecho:

[…]The anguishing thing about mass-shooting incidents is that patterns are indeed present […]

Tradução livre: O angustiante sobre essas chacinas é que os padrões estão sempre presentes.

Utilizando como ponto de partida dessa reflexão, há uma frase que se enquadra bem nesse contexto que é “Quando a arma que mata é a mesma que defende a liberdade, os Santos choram; mas não acusam”. Isso quer dizer que partindo das indagações( justas) do Sr. Jenkins, bem como das diversas manifestações da American Civil Liberties Union (ACLU – Em tradução livre: União das Liberdades Civis Americanas) é possível dar duas respostas sobre essas perguntas: Não, e Sim.

A aplicação efetiva de Mineração de Dados na esfera pública, até mesmo no Brasil provou que é um campo que tem tudo para dar certo, se utilizada para o correto atendimento dos interesses gerais da administração pública; seja na área de economicidade (na qual trata o artigo) seja na área de segurança pública.

O fato é que hoje as empresas estão anos-luz à frente dos governos em relação à aquisição de dados, e principalmente na utilização desses dados para os mais diversos fins comerciais: cobrança, marketing direcionado, marketing político, design de produtos, disponibilização de linhas de crédito, e até mesmo predição de tendências comportamentais de consumo.

Dentro desse panorama, é de se espantar que associações de direitos civis se oponham de maneira ferrenha ao fato do governo poder ter essas informações consolidadas e para utilização para diversos tipos de aplicações para servir ao bem público (isso baseado e legislação específica, e com representantes e pautas de discussões eleitos democraticamente) sendo que informações como padrões de utilização de cartões de crédito, ligações telefônicas, e-mails, correspondências, informações sobre restrições e status de créditos bancários estejam na mão de empresas; as quais que além de tudo comercializam esses tipos de informações, seja via birôs de crédito e de informações; seja a comercialização de malas diretas.

Um praticante de mineração de dados razoável poderia modelar algo no mesmo sentido em que o colunista descreveu com determinada facilidade, contudo; a questão vai um pouco além do que foi descrito, e a mineração não pode tratada como a salvação em se tratando de crimes dessa natureza; pois, além das restrições legais, esse campo penaliza de forma severa erros de interpretação, os quais se hoje são a solução para auxiliar na esfera criminal em questão de prevenção, pode tornar um instrumento para criminalizar mais pessoas através de erros de interpretação.

Uma coisa que sempre este site faz questão de ressaltar é que a mineração de dados são um conjunto de técnicas que auxiliam na tomada de decisão, e que a ação propriamente dita é sempre condicionada, única e exclusivamente pelo agente humano através da interpretação dos padrões recebidos; e esse processo quase que dialético de extrair da expertise (conhecimento tácito) e do background técnico (conhecimento explicito) conhecimento para lidar com qualquer tipo de situação de acordo com os dados. Jogar na mineração de dados essa responsabilidade, é no mínimo preocupante, pois mostra ainda que as pessoas conhecem muito pouco do assunto e procuram uma bala de prata para resolver diversos problemas da sociedade; e é desse tipo de abordagem que a mineração de dados deve se afastar para não virar instrumento de um estado tecnocrático e policial que tem base valores totalitários e restritivos.

A discussão é interessante e está aberta, e cabe ressaltar que ainda haverá muita discussão nesse sentido nos outros países. Pena que ainda, nós brasileiros não acordamos para esse tipo de discussão.

 PARA LER

ACLU. Data Mining. Disponível em << http://www.aclu.org/technology-and-liberty/data-mining >> Acessado em 24 Jul 12 às 22:22hs.

PEÑA, Charles V. Information Awareness Office Makes Us a Nation of Suspects. CATO Institute. Disponível em << http://www.cato.org/research/articles/pena-021122.html  >> Acessado às 24 Jul 12 às 22:23hs.

ACLU. Testimony of Barry Steinhardt, Director of the ACLU Technology and Liberty Program on Government Data Mining Before the House Government Reform Subcommittee on Technology, Information Policy, Intergovernmental Relations and the Census. Disponível em << http://www.aclu.org/national-security/testimony-barry-steinhardt-director-aclu-technology-and-liberty-program-government >> Acessado em 24 Jul 12 às 22:22hs.

DARPA. DARPA’s S&T Privacy Principles. Disponível em << http://www.darpa.mil/About/Initiative/DARPA’s_S_T_Privacy_Principles.aspx >> Acessado em 24 Jul 12 às 22:25hs

ACLU. Total Information Compliance: The TIA’s Burden Under The Wyden Amendment – A Preemptive Analysis of the Government’s Proposed Super Surveillance Program. Disponível em << http://www.aclu.org/files/FilesPDFs/aclu_tia_report.pdf  >> Acessado em 24 Jul 12 às 22:26hs

ACLU. Technology And Liberty Program – A letter to Alex Türk. Disponível em << http://www.aclu.org/files/images/asset_upload_file750_34919.pdf >> Acessado às 22:38hs

SARMENTO SILVA, Carlos Vinícius; RALHA, Célia Ghedini. Detecção de Cartéis em Licitações Públicas com Agentes de Mineração de Dados . Revista Eletrônica de Sistemas de Informação. Disponível em << http://revistas.facecla.com.br/index.php/reinfo/article/view/754/pdf  >> Acessado em 24 Jul 12 às 22:37hs.

NATH, Shyam Varan. Crime Pattern Detection Using Data Mining. Oracle Corporation. Disponível em << http://ieeexplore.ieee.org/xpl/login.jsp?tp=&arnumber=4053200&url=http%3A%2F%2Fieeexplore.ieee.org%2Fxpls%2Fabs_all.jsp%3Farnumber%3D4053200  >> Acessado em 24 Jul 12 às 22:40hs.

A Mineração de Dados pode parar a matança? – Uma reflexão sobre o episódio do Atirador do Colorado e a Mineração de Dados

7 razões na qual a Mineração de Dados podem impactar a privacidade

Esse ensaio é uma ótima reflexão sobre a questão da privacidade na qual existe atualmente na ficção científica, e o que pode acontecer em um futuro não muito distante.

7 razões na qual a Mineração de Dados podem impactar a privacidade

Indústria Farmacêutica + Mineração de Dados + Dados de Pacientes = Violação de Direitos

Um dos episódios que mostram que ainda não há critérios para a utilização da Mineração de Dados; e porque a privacidade pode ser um fator crítico para o seu desenvolvimento nos próximos anos.

Indústria Farmacêutica + Mineração de Dados + Dados de Pacientes = Violação de Direitos

A Naïve Bayes Approach to Classifying Topics in Suicide Notes

Este paper bastante interessante sobre Text Mining (Mineração sobre bases textuais) trata de uma análise sobre cartas de suicídio e foi apresentado na I2B2 Challenge on Sentiment Classification.

O abstract traz informações relevantes sobre o método de trabalho e o resultado, porém; por mais doentio que possa parecer em um primeiro momento devido a morbidade do título; a iniciativa é amplamente válida para estudos relacionados a classificação e identificação de padrões de características que podem ajudar estudos psiquátricos, médicos, e até famacológicos na busca de atenuação desse tipo de comportamento humano.

A Naïve Bayes Approach to Classifying Topics in Suicide Notes

A Naïve Bayes Approach to Classifying Topics in Suicide Notes

Authors: Irena Spasic, Pete Burnap, Mark Greenwood and Michael Arribas-Ayllon
Publication Date: 30 Jan 2012
Journal: Biomedical Informatics Insights
Citation: Biomedical Informatics Insights 2012:5 (Suppl. 1) 87-97

Abstract
The authors present a system developed for the 2011 i2b2 Challenge on Sentiment Classification, whose aim was to automatically classify sentences in suicide notes using a scheme of 15 topics, mostly emotions. The system combines machine learning with a rule-based methodology. The features used to represent a problem were based on lexico–semantic properties of individual words in addition to regular expressions used to represent patterns of word usage across different topics. A naïve Bayes classifier was trained using the features extracted from the training data consisting of 600 manually annotated suicide notes. Classification was then performed using the naïve Bayes classifier as well as a set of pattern–matching rules. The classification performance was evaluated against a manually prepared gold standard consisting of 300 suicide notes, in which 1,091 out of a total of 2,037 sentences were associated with a total of 1,272 annotations. The competing systems were ranked using the micro-averaged F-measure as the primary evaluation metric. Our system achieved the F-measure of 53% (with 55% precision and 52% recall), which was significantly better than the average performance of 48.75% achieved by the 26 participating teams.

A Naïve Bayes Approach to Classifying Topics in Suicide Notes

Governmental Data Mining and its Alternatives

A Mineração de Dados no âmbito governamental tem se tornado uma preocupação bem recente na esfera acadêmica e judiciária. As implicações na aquisição, seleção, e privacidade sobre uma base de dados pública é de uma importância muito grande, e governos ao redor do mundo ainda não estão preparados para lidar com essas questões. Esse paper do pesquisador Tal Zarsky da University of Haifa – Faculty of Law apresenta um plano de trabalho bastante interessante sobre a utilização desses dados, para aplicação em diversas questões do quotidiano estatal como previsões, segurança, detecção de ameaças entre outros. Vale a pena a leitura.

Penn State Law Review, Vol. 116, No. 2, 2011

Abstract:

Governments face new and serious risks when striving to protect their citizens. Data mining has captured the imagination as a tool which can potentially close the intelligence gap constantly deepening between governments and their targets. The reaction to the data mining of personal information by governmental entities came to life in a flurry of reports, discussions, and academic papers. The general notion in these sources is that of fear and even awe. As this discourse unfolds, something is still missing. An important methodological step must be part of every one of these inquires mentioned above – the adequate consideration of alternatives. This article is devoted to bringing this step to the attention of academics and policymakers.

The article begins by explaining the term “data mining,” its unique traits, and the roles of humans and machines. It then maps out, with a very broad brush, the various concerns raised by these practices. Thereafter, it introduces four central alternative strategies to achieve the governmental objectives of security and law enforcement without engaging in extensive data mining and an additional strategy which applies some data mining while striving to minimize several concerns. The article sharpens the distinctions between the central alternatives to promote a full understanding of their advantages and shortcomings. Finally, the article briefly demonstrates how an analysis that takes alternative measures into account can be carried out in two contexts. First, it addresses a legal perspective, while considering the detriments of data mining and other alternatives as overreaching “searches.” Second, it tests the political process set in motion when contemplating these measures. This final analysis leads to an interesting conclusion: data mining (as opposed to other options) might indeed be disfavored by the public, but mandates the least scrutiny by courts. In addition, the majority’s aversion from the use of data mining might result from the fact that data mining refrains from shifting risk and costs to weaker groups.

Governmental Data Mining and its Alternatives

Governmental Data Mining and its Alternatives