Neste post, explicaremos o que é a correlação ponto-bisserial. Além disso, mostraremos o passo a passo de como executar a correlação ponto-bisserial no SPSS e de como interpretar e reportar seus resultados.
Se você ainda não está familiarizado com o conceito mais amplo de correlação, então recomendamos que leia nosso post sobre o tema.
Veja também:
O que é correlação ponto-bisserial?
O coeficiente de correlação ponto-bisserial, rpb, mensura a força e a direção da relação entre uma variável dicotômica, isto é, uma variável com apenas dois níveis, e uma variável contínua. Alguns exemplos de questões que poderiam ser respondidas com esse coeficiente incluem:
- Qual é a relação entre status de fumante (fuma, não fuma) e níveis de colesterol?
- Qual é a relação entre a participação em um programa de treinamento (participou, não participou) e o aumento na produtividade?
- Qual é a relação entre ter um animal de estimação (sim, não) e os níveis de estresse?
A primeira variável de cada exemplo é uma variável dicotômica, enquanto a segunda é uma variável contínua. Nesses casos, as correlações ponto-bisserial e de Pearson são matematicamente equivalentes.
Como o coeficiente de correlação ponto-bisserial é calculado?
Em seu banco de dados, é importante que a variável dicotômica esteja codificada com valores numéricos representando cada uma das categorias.
Comumente, atribui-se 1 ao valor que indica “presença” de um atributo (e.g., fumar, ter participado de programa de treinamento, ter animal de estimação), enquanto o valor 0 é atribuído ao valor que indica “ausência” de um atributo (e.g., não fumar, não ter participado de programa de treinamento, não ter animal de estimação).
Contudo, notamos que essa convenção é arbitrária. Além disso, em alguns casos, nenhuma das categorias indica a “presença” ou “ausência” de algo, tais como nas variáveis sexo (feminino, masculino), profissão (administrador, contador) ou regime de trabalho (CLT, PJ).
A Figura 1 apresenta esquematicamente a fórmula do coeficiente de correlação ponto-bisserial.
Podemos interpretar o coeficiente obtido de maneira similar ao coeficiente de correlação de Pearson. Desse modo, seus valores também variam de –1 a +1, sendo que o sinal da correlação indica apenas qual média foi maior.
Se o coeficiente for positivo, então isso significa que a média do grupo codificado com o valor 1 foi maior que a média do grupo codificado com o valor 0. Se o coeficiente for negativo, então o grupo codificado com o valor 0 teve a média mais elevada.
Assim como na correlação de Pearson, a correlação ponto-bisserial tem um teste t associado e um valor de p correspondente. Em resumo, esse valor de p expressa a probabilidade de dados iguais ou mais extremos que os nossos, considerando-se a hipótese nula de ausência de correlação entre variáveis dicotômica e contínua.
Exemplo prático de uso da correlação ponto-bisserial
Vamos retomar um dos exemplos anteriores. Selecionamos uma amostra de 10 participantes. Em seguida, cada participante respondeu se tem (1) ou não (0) animais de estimação e fez uma autoavaliação de seus níveis de estresse, em uma escala de 0 (nenhum estresse) a 10 (muito estresse).
Os dados dessa amostra hipotética são apresentados na Figura 2, tabulados no SPSS.
Nesses dados, temos que MSim = 4,80 e MNão = 7,50, ou seja, os níveis de estresse são quase 3 pontos maiores no grupo que não tem animais de estimação. Além disso, DPGeral = 2,07, nSim = nNão = 5 e N = 10. Assim sendo, aplicamos a fórmula da correlação ponto-bisserial:
O valor sugere uma forte correlação negativa entre ter animais e níveis de estresse, ou seja, indivíduos que não têm animais de estimação apresentam níveis de estresse mais elevados. A Figura 3 sumariza graficamente esse padrão.
Como realizar a correlação ponto-bisserial no SPSS?
Solicitando a análise
O SPSS não possui uma janela específica para a solicitação da correlação ponto-bisserial. Como dissemos anteriormente, essa análise é matematicamente equivalente à correlação de Pearson. Desse modo, solicitamos a análise na mesma janela que a correlação de Pearson.
Para solicitar a correlação ponto-bisserial, siga o caminho Analisar > Correlacionar > Bivariável (Figura 4).
Em seguida, basta inserir as variáveis de interesse em Variáveis e clicar em OK (Figura 5).
Interpretando a saída do SPSS
A Figura 6 apresenta a saída do SPSS, com as informações relevantes destacadas em azul. Note que o valor produzido pelo SPSS foi idêntico ao que obtivemos no cálculo usando a fórmula. Adicionalmente, o SPSS apresenta o valor de p, nas linhas Sig. (2 extremidades).
Além disso, observe que as informações são espelhadas em relação à diagonal principal da matriz (as células com correlações de Pearson iguais a 1). Desse modo, apesar de termos destacado quatro valores na Figura 6, nós efetivamente interpretamos apenas dois deles, já que os outros dois nos fornecem informações redundantes.
Reportando os resultados
No relato dos resultados, devemos apresentar o coeficiente, com subscritos pb, denotando que se trata da correlação ponto-bisserial, rpb, e o valor de p. Além disso, você deve conduzir seu leitor, mostrando como interpretar os resultados numéricos que apresentou no texto.
No parágrafo a seguir, apresentamos uma breve sugestão de como relatar os resultados. Por convenção, adotamos a precisão de duas casas decimais nos relatos de estatísticas.
Uma análise de correlação ponto-bisserial indicou que ter animais de estimação está negativamente correlacionado com os níveis de estresse, rpb = –0,69, p = 0,03. Em outras palavras, participantes que não têm animais de estimação tendem a ter maiores níveis de estresse (M = 7,50) que participantes que têm animais de estimação (M = 4,80).
No entanto, ressaltamos que a correlação ponto-bisserial indica apenas se há relação significativa entre variáveis. Se você quiser avaliar o tamanho da diferença entre grupos, então será necessário relatar estatísticas descritivas (como fizemos no parágrafo anterior) ou, caso prefira, realizar um teste t para amostras independentes, acompanhado do d de Cohen. Se conduzirmos um teste t de Student, então o valor de p por ele gerado será idêntico ao valor de p da correlação ponto-bisserial.
Conclusão
Neste post, você aprendeu o que é e como calcular o coeficiente de correlação ponto-bisserial. Além disso, você viu alguns exemplos de questões que poderiam ser respondidas usando esse coeficiente. Por fim, você aprendeu como solicitar a análise no SPSS, como interpretar e como reportar os resultados dessa análise ao leitor.
Gostou desse conteúdo? Precisa aprender análise de dados? Então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).
Referência
Field, A. (2017). Discovering statistics using IBM SPSS Statistics (5th ed.). Sage.
Como citar este post
Lima, M. (2021, 3 de maio). O que é e como executar a correlação ponto-bisserial no SPSS? Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/o-que-e-correlacao-ponto-bisserial