O seu Blog de Psicometria

Tenha acesso à nossa enciclopédia virtual de conhecimento em Psicometria e Análise de Dados

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Compartilhe nas Redes Sociais

O que é o coeficiente de correlação de Matthews?

Marcos Lima

fev 9, 2026

Neste post, apresentamos o coeficiente de correlação de Matthews, uma métrica de desempenho para modelos de classificação binária em machine learning. Primeiramente, descreveremos para que serve o coeficiente. Em seguida, mostraremos como calculá-lo e como interpretá-lo. Por fim, responderemos se a correlação de Matthews e o coeficiente phi são ou não equivalentes.

Para que serve o coeficiente de correlação de Matthews?

O coeficiente de correlação de Matthews (Matthews correlation coefficient, MCC) é uma medida de desempenho de modelos de classificação binária em machine learning. Em síntese, ele expressa, com um único número, o desempenho do modelo considerando todas as células da matriz de confusão (veremos mais sobre isso adiante).

Em machine learning, uma das vantagens do MCC é que ele é robusto a situações em que temos classes desbalanceadas. Por exemplo, em problemas de classificação, nem sempre temos bancos de dados em que os casos positivos e negativos estão divididos em 50% cada. Nessas situações, outras métricas de desempenho, como a acurácia, podem ser enganosas.

Em contrapartida, o MCC leva em conta esse desbalanceamento e penaliza previsões enviesadas para uma única classe, de modo a fornecer uma medida mais acurada do desempenho do modelo de classificação.

banner do canal da Psicometria Online no YouTube.

Como calcular o coeficiente de correlação de Matthews?

Para calcular o coeficiente de correlação de Matthews, utilizamos uma matriz de confusão, ou seja, uma tabela de contingência 2 × 2 que representa o desempenho do modelo de classificação (Figura 1).

tabela de contingências 2 × 2 genérica.
Figura 1. Matriz de confusão.

Em síntese, a matriz anterior compara os valores observados na variável resposta (aquela que queremos prever) com os valores previstos pelo modelo de classificação. A partir do cruzamento dos valores observados e previstos, temos quatro resultados possíveis:

  • Verdadeiros positivos (VP): observações corretamente previstas como positivas.
  • Falsos positivos (FP): observações incorretamente previstas como positivas.
  • Falsos negativos (FN): observações incorretamente previstas como negativas.
  • Verdadeiros negativos (VN): observações corretamente previstas como negativas.

Com base nas informações contidas na matriz de confusão, podemos calcular o coeficiente de correlação de Matthews (MCC) a partir da seguinte fórmula:

fórmula da correlação de Matthews.

Em seguida, entenderemos essa fórmula por meio de um exemplo de machine learning. Suponha que usamos um algoritmo que buscou classificar, com base no conteúdo de mil e-mails, quais deles continham spam (casos positivos) e quais não continham spam (casos negativos). Dados hipotéticos são apresentados na Figura 2.

matriz de confusão com dados para exemplo do cálculo da correlação de Matthews.
Figura 2. Matriz de confusão com dados hipotéticos.

Substituindo os valores da Figura 2 na fórmula, obtemos o seguinte resultado:

exemplo de cálculo da correlação de Matthews.

    O coeficiente de correlação de Matthews é igual a 0,84. Portanto, o modelo de classificação de e-mails apresenta um bom desempenho global, mesmo considerando erros de ambos os tipos.

    Como interpretar o coeficiente de correlação de Matthews?

    A Figura 3 apresenta, pela última vez, a matriz de confusão usada para o cálculo do coeficiente de correlação de Matthews. Observe que destacamos as células nas cores verde e vermelha, além de inserirmos o numerador da fórmula logo após a matriz de confusão.

    matriz de confusão destrinchando a interpretação da correlação de Matthews.

    Como nosso objetivo é apenas dar uma intuição do MCC, omitimos o denominador da fórmula, cuja função é apenas restringir os valores do MCC entre –1 e +1.

    Note que, no numerador, subtraímos os produtos dos acertos pelo produto dos erros. Desse modo, quanto maiores os acertos em relação aos erros, mais próximo de +1 o modelo de classificação será. Em contrapartida, valores próximos a 0 indicam predições próximas ao acaso, isto é, um modelo ruim. Por fim, valores próximos a –1 indicam que os erros são grandes em relação aos acertos, ou seja, que ele erra sistematicamente.

    Em síntese, assim como ocorre com correlações tradicionais (e.g., correlação de Pearson), quanto maior o valor absoluto do coeficiente, mais forte é a relação entre valores previstos e valores observados. Em nosso exemplo, o MCC = 0,84 indica um bom desempenho global.

    Coeficiente de correlação de Matthews e coeficiente phi são a mesma coisa?

    No Brasil, a depender da região onde você estiver, ouvirá uma mesma fruta ser chamada de nomes distintos: mexerica, tangerina, bergamota ou mimosa. De maneira similar, é comum que diferentes comunidades científicas desenvolvam jargões técnicos que, muitas vezes, adotam termos distintos para o mesmo referente.

    Se você já fez um curso introdutório de estatística, é possível que tenha aprendido sobre o teste qui-quadrado de independência e sobre o coeficiente phi, uma medida de tamanho de efeito da associação entre duas variáveis binárias. Então, uma pergunta que pode emergir é se os coeficientes de Matthews e phi são a mesma coisa.

    Sim, matematicamente, o coeficiente de Matthews e phi são equivalentes, pois ambos utilizam exatamente a mesma fórmula baseada em tabelas 2 × 2. A única diferença entre eles é o contexto de uso. Em estatística, usamos o coeficiente phi para medir associação entre variáveis binárias (e.g., aprovado/reprovado × matutino/noturno). Por esse motivo, os termos VP, FP, FN e VN não fazem sentido, motivo pelo qual a notação da fórmula é distinta, mas equivalente:

    Note que ela é conceitualmente idêntica à fórmula do MCC. Em contraste, em machine learning, usamos a correlação de Matthews para avaliar desempenho preditivo de modelos (i.e., valores observados vs. valores previstos). Portanto, embora o nome do coeficiente mude entre áreas, a lógica matemática e a interpretação permanecem as mesmas.

    banner da Formação em Inteligência Artificial da Psicometria Online.

    Referências

    Chicco, D., & Jurman, G. (2020). The advantages of the Matthews correlation coefficient (MCC) over F1 score and accuracy in binary classification evaluation. BMC Genomics, 21, Article 6. https://doi.org/10.1186/s12864-019-6413-7

    Chicco, D., & Jurman, G. (2023). The Matthews correlation coefficient (MCC) should replace the ROC AUC as the standard metric for assessing binary classification. BioData Mining, 16, Article 4. https://doi.org/10.1186/s13040-023-00322-4

    Como citar este post

    Bruno Figueiredo Damásio

    Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

    Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) e Editor-Associado da Spanish Journal of Psychology, na sub-seção Psicometria e Métodos Quantitativos.

    Tenho mais de 50 artigos publicados e mais de 5000 citações, nas melhores revistas nacionais e internacionais.

    Em 2020, saí da UFRJ para montar a minha formação, a Psicometria Online Academy.

    Meu foco é que você se torne um(a) pesquisador(a) de excelência. Clique aqui para conhecer a Academy.

    Compartilhe sua opinião sobre este post

    0 0 Votos
    Classificação do artigo
    Inscrever-se
    Notificar de
    guest

    0 Comentários
    mais antigos
    mais recentes Mais votado
    Feedbacks embutidos
    Ver todos os comentários

    Posts sugeridos

    AFE não é horóscopo: o fim do “olhômetro” na Análise Fatorial

    O que é o dilema viés-variância?

    Nem simples demais (underfitting), nem complicado demais (overfitting): o caminho para um modelo bem ajustado

    Conteúdo

    Mais lidos

    Análise de moderação: como identificar potenciais variáveis moderadoras?

    Modelagem por equações estruturais no R: conceitos e aplicações

    O que são variáveis ​​independentes e dependentes?

    O que é correlação de Pearson?

    Postados recentemente

    Qual é a diferença entre explicação e predição?

    O que é o teste de esfericidade de Bartlett?

    AFE não é horóscopo: o fim do “olhômetro” na Análise Fatorial

    O que é o teste de Wald-Wolfowitz?

    Deseja se tornar completamente autônomo e independente na análise dos seus dados?

    Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

    Categorias