05/10/2018

No UOL, a probabilidade nas pesquisas eleitorais

Roberto Imbuzeiro é pesquisador titular do IMPA da área de probabilidade

Reprodução do UOL

Reportagem: Stefhanie Piovezan

Nos EUA, em 2016, o jornal The New York Times fez um experimento: enviou questionários com as respostas coletadas de prováveis eleitores da Flórida para cinco pesquisadores eleitorais renomados analisarem.

E o resultado foi revelador. Cada um chegou a uma conclusão diferente, apesar de estarem diante dos mesmos 867 questionários.

A razão dessa diferença não é, como muitos sugerem a cada eleição, no Brasil e fora, que algum instituto manipule propositalmente o resultado. Essa variação é decorrente da diferença de metodologia e de critérios de cada instituto.

Dois bons pesquisadores, examinando os mesmos dados, podem encontrar resultados muito diferentes. Mas mais do que isso:,é pouco provável que os pesquisadores cheguem a analisar os mesmos dados – cada um tem critérios diferentes para selecionar os entrevistados.

“A amostra de um instituto pode ser de 10 mulheres jovens e 10 homens adultos, enquanto em outro instituto a amostra tem 10 adultas e 10 homens jovens. A composição é igual: 10 mulheres e 10 homens na categoria sexo e 10 jovens e 10 adultos na categoria idade. Mas as amostras são completamente diferentes. Poderão, assim, produzir resultados opostos”, diz ao UOL Carlos Alberto de Bragança Pereira, professor do Instituto de Matemática e da USP.

Isso mostra que avaliar respostas eleitorais é muito mais complexo do que muita gente pensa: não basta comparar quantos responderam A com quantos responderam B e ver quem é o preferido. O cálculo, na verdade, depende de quem foi entrevistado (a amostra) e o que foi feito com esse resultado.

Há, portanto, subjetividade dentro das pesquisas eleitorais.

“O método não deixa de ser científico por envolver subjetividades. Elas precisam ficar bem estabelecidas e explícitas para o tomador de decisão”, diz Helio Migon, professor emérito do Instituto de Matemática da UFRJ.

Definindo a amostra Imagine que você pergunte a 10 pessoas no seu bairro em qual candidato elas pretendem votar. O resultado, muito provavelmente, não representará a realidade brasileira. Isso porque há vários fatores a levar em conta. Por exemplo:

Você entrevistou mais homens do que mulheres? Há mais homens do que mulheres no Brasil? Importa ser homem ou ser mulher na hora de definir o voto? Quanto? Você entrevistou gente de outras cidades? De outros Estados? Qual o peso da sua cidade na contagem de votos do Brasil?

Isso remete a um desafio antes de fazer a pesquisa: como tornar a amostra representativa? Quantas pessoas entrevistar? Quais?

“Cada instituto gostaria de selecionar pessoas completamente ao acaso dentro de cada estrato do eleitorado. Por exemplo, dentre todos os homens brasileiros com ensino médio, gostaria de escolher completamente ao acaso alguns”, explica Roberto Imbuzeiro Oliveira, pesquisador do Impa (Instituto de Matemática Pura e Aplicada). Essas amostras em que os participantes são selecionados completamente ao acaso, por sorteio, são chamadas de probabilísticas.

O problema é que seria necessário falar com todas as pessoas sorteadas – se o pesquisador selecionar algumas delas, ou não conseguir falar com algumas delas, já há, aí, um tipo de distorção na amostra. E não há uma lista de todas as pessoas que fazem parte desse grupo, nem maneira de garantir que será possível contatar todas.

Trabalhar com amostrar probabilísticas é, portanto, mais difícil, caro e demorado. O que os institutos fazem? Em uma cidade grande, por exemplo, sorteiam pontos públicos e enviam entrevistadores para falar com gente passando pelo local. “Se a amostra não for muito representativa – por exemplo, aparecerem bem mais homens do que mulheres –, o instituto pode corrigir esse efeito dando pesos diferentes aos entrevistados”, afirma.

Há, dessa forma, uma metodologia mista: cotas baseadas no Censo para definir os grupos que devem ser ouvidos, o que a estatística chama de escolha não probabilística, além de uma seleção probabilística de fatores como as cidades das entrevistas. “Aí é que está a diferença: o universo do eleitorado é o mesmo, mas cada instituto aborda esse universo de modo diferente e coleta dados à sua maneira”.

Impasse acadêmico

A metodologia mista gera discussões entre os estatísticos. Há especialistas que entendem que seria necessária uma amostra completamente probabilística, com sorteios para definir cidades, setores censitários e eleitores, enquanto outros defendem a mescla entre seleções pré-definidas e probabilísticas.

Helio Migon, professor emérito do Instituto de Matemática da UFRJ (Universidade Federal do Rio de Janeiro), também menciona modelos com definição dos locais de entrevista.

“Prefiro um desenho amostral que escolha os locais de entrevista com base em resultados eleitorais passados e que selecione os eleitores, por cotas ou não, mas que faça as inferências com base em um modelo que retrate essas escolhas. A ideia é selecionar aqueles locais mais parecidos, em termos de resultados eleitorais, com os obtidos de uma eleição passada. São ‘miniaturas’ do passado e assume-se que estas sejam estáveis no tempo”, defende.

Interpretando o resultado

Uma vez coletados os resultados (ou seja, as enquetes respondidas: em quem você vai votar), é preciso interpretá-los – o que, como a pesquisa realizada pelo The New York Times mostrou, leva a resultados diferentes dependendo do critério.

Quais variáveis levar em conta? Que tipos de características deve o pesquisador ponderar? Raça, sexo e idade são muito padrão. Mas e que tal região, registro em partido ou escolaridade?

Nos EUA, há ainda a diferença entre institutos que levam em conta o Censo, e outros que levam em conta a lista de eleitores, na hora de espelhar a população que aquela amostra pretende representar.

Em suma: cada instituto escolhe características diferentes para balancear.

Confiabilidade

As escolhas na definição da amostra estão diretamente relacionadas à margem de erro e à confiabilidade. “O número de eleitores a ser entrevistado na rua ou em domicilio, ou seja, o dimensionamento da amostra leva em consideração o erro amostral estipulado, que é a famosa margem de erro, a confiabilidade que desejamos e a população de eleitores”, detalha Migon.

Assim, quando um instituto informa que uma pesquisa tem nível de confiabilidade de 95%, por exemplo, isso quer dizer que, de cada 100 amostras realizadas, em 95 o verdadeiro valor da proporção da intenção de votos em certo candidato estará dentro da margem de erro, e cinco podem indicar intenções de voto inesperadas.

“A margem de erro é uma maneira de quantificar: com este tamanho de amostra, eu posso até errar, mas garanto que a chance de eu errar mais do que a margem é menor do que 5%”, diz Oliveira.

Para ele e Migon, há subjetividade na metodologia usada nas pesquisas, mas isso não as invalida. “O desenho amostral envolve um fator de confiabilidade fixado, que é subjetivo. Por que 90% e não 95% de confiabilidade? É uma escolha”, argumenta o professor da UFRJ.

“A metodologia não é perfeita e pode introduzir um viés, ou seja, pode privilegiar certos grupos em detrimento de outros. Viés aqui é um termo técnico que não indica maldade ou malicia, é simplesmente impossível ter a escolha do jeito ideal. De qualquer forma, cada instituto tenta se aproximar mais daquela situação em que as pessoas seriam escolhidas completamente ao acaso e com chances iguais”, afirma Oliveira.

*Esta reportagem utiliza também informações publicadas na reportagem “Nos EUA, 4 firmas estudaram as mesmas respostas e chegaram a previsões distintas para as eleições”, (http://noticias.uol.com.br/internacional/ultimas-noticias/the-new-yorktimes/2018/10/05/margem-de-erro-nao-demostra-o-real-potencial-de-equivoco-daspesquisas-veja-experimento.htm) publicada no The New York Times.