sábado, 17 de outubro de 2020

Everybody Lies – Big Data, new data and what the Internet can tell us about who we really are

Uns 15 anos atrás, Steven Levitt e Stephen Dubner publicaram "Freakonomics", um best-seller que aplicava a abordagem dos economistas a análise de assuntos do dia a dia, do comportamento de corretores de imóveis e lutadores de sumô, a causas não-convencionais para queda da criminalidade em Nova York. Foi um grande sucesso e influenciou o cientista de dados Seth Stephens-Davidowitz a buscar dar o passo seguinte com "Everybody Lies", basicamente uma versão turbinada de "Freakonomics".



A diferença fundamental entre eles, entretanto, é que Davidowitz tem hoje acesso a uma massa infinitamente maior de dados e ferramentas muito mais poderosas para analisá-los. E isso faz toda a diferença.

Uma das fontes utilizadas nas análises de Davidowitz, por exemplo, está nos dados consolidados de buscas realizadas no Google – ele avalia os números de perguntas similares feitas sobre um determinado tema em diferentes regiões e momentos para analisar tópicos como a eficácia de discursos do Obama em diminuir o preconceito contra muçulmanos, a prevalência do racismo em diferentes regiões americanas ou as neuras sexuais dos internautas.

Mas porque o título “Everybody Lies”? Bom, a grande sacada de Davidowitz foi perceber que a tela de consulta do Google e o comportamento on-line em parte dos sites funcionam como um grande “soro da verdade”. Todo mundo (normal) se preocupa com a própria imagem no dia a dia, no Facebook, no médico ou mesmo ao responder uma pesquisa de opinião, mas se comporta de forma bem mais livre e autêntica quando não tem ninguém olhando, inclusive quando faz suas buscas no Google ou navega de forma anônima. Cruzar os dados de uma rede social com outras bases que não sejam enviesadas pela preocupação com imagem pode resultar em incoerências surpreendentes e bem interessantes. Por exemplo: é muito provável que ao pesquisar a sua rede de amigos no Facebook, você vá encontrar mais gente seguindo publicações como “The Economist” ou “Harvard Business Review” do que “Caras”, mas quando você for até a casa deles, qual revista vai encontrar?

O livro foi publicado em 2017, ou seja, antes do sucesso atual de “The Social Dilemma” na Netflix. Entretanto, um de seus insights mais interessantes é justamente com relação ao consenso de que a internet e as redes sociais estariam agravando a polarização política. Com base em um estudo realizado pelos economistas Matt Gentzkow e Jesse Shapiro em 2011, que coletou dados sobre o comportamento de um grande número de americanos de diferentes linhas ideológicas e avaliou o grau da segregação política na internet, Davidowitz sugere uma abordagem diferente:

Nós tendemos a ter um número muito maior de amigos no Facebook do que na vida real. Nossa lista de contatos nas redes sociais incluem pessoas como aqueles conhecidos do tempo de escola com quem nunca mais falamos, vizinhos de condomínio, ex-colegas de trabalho, o amigo do primo que conhecemos 10 anos atrás e mais um monte de gente que nunca convidaríamos para jantar em casa ou para um churrasco no final de semana. Entretanto, todo esse pessoal publica seus comentários e links e frequenta a nossa timeline diariamente, fazendo com que sejamos expostos a opiniões e assuntos a que dificilmente teríamos acesso dentro da nossa bolha de relacionamentos próximos, que tendem naturalmente a ser muito mais alinhados com as nossas próprias posições e realidade. Em suma, a internet acaba se tornando um ponto de contato entre pessoas com perfis muito mais diversos do aquelas com quem temos contato diário no mundo físico. Você pode ser um liberal que passa sua manhã com uma esposa e filhos liberais, a tarde com seus colegas de trabalho liberais, volta para casa ouvindo a rádio liberal a que se acostumou, mas à noite, quando acessa o Facebook, tem contato com os posts conservadores radicais de seu ex-colega de escola. Esta será provavelmente sua maior exposição a opiniões conservadoras no dia todo e este contraponto não é algo necessariamente ruim. 

“Everybody Lies” apresenta diversas análises de dados similares a esta, que desafiam o senso comum em áreas como comportamento, esportes, educação e política. É uma obra curta, mas muito interessante. Vale a pena.