O seu Blog de Psicometria

Tenha acesso à nossa enciclopédia virtual de conhecimento em Psicometria e Análise de Dados

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Compartilhe nas Redes Sociais

Análise textual: o software IRAMUTEQ

Marcos Lima

jan 5, 2023

A pesquisa qualitativa tem como objetivo descrever e interpretar as experiências e percepções dos participantes, por meio de sínteses verbais. Para isso, os pesquisadores geralmente conduzem entrevistas, grupos focais ou análises documentais de materiais escritos. Como resultado, torna-se essencial usar ferramentas específicas para a análise de dados textuais. Neste post, vamos falar sobre o IRAMUTEQ, um software gratuito que facilita essas análises.

O que são dados textuais?

Os dados textuais consistem em materiais verbais transcritos. Por exemplo, após realizar entrevistas gravadas, os pesquisadores convertem o conteúdo de áudio para texto. Esse formato é mais adequado para análises textuais.

Além disso, existem outros tipos de dados textuais, como textos originalmente escritos, audiodescrições de conteúdo artístico, legendas de filmes e respostas a questionários abertos. Em todos os casos, é necessário aplicar técnicas de análise de dados textuais para transformar o material em informações científicas relevantes.

banner Psicometria Online Academy, que tem o curso de IRAMUTEQ.

O que é o IRAMUTEQ?

O IRAMUTEQ (Interface de R pour les Analyses Multidimensionnelles de Textes et de Questionnaires) é um software livre que permite a análise estatística de corpora textuais. Ele é baseado no software R e utiliza também a linguagem Python.

Você pode baixar o IRAMUTEQ gratuitamente no site oficial (http://www.iramuteq.org/). No entanto, é importante destacar que, para utilizá-lo, você também precisa instalar o R no seu computador. Além disso, até o momento, o IRAMUTEQ não é compatível com a versão 4.2 do R, apenas com a versão 4.1.3.

Quais análises estão disponíveis no IRAMUTEQ?

As análises textuais envolvem técnicas e cálculos estatísticos que ajudam a compreender as relações entre diferentes elementos do corpus textual. Em seguida, descrevemos as análises disponíveis no IRAMUTEQ.

Análises lexicais clássicas

As análises lexicais clássicas quantificam a frequência de palavras no corpus. Por exemplo, o IRAMUTEQ identifica e organiza o texto para calcular a quantidade de palavras, a frequência média e o número de hapax (palavras que aparecem apenas uma vez no corpus textual).

Além disso, o software realiza a lematização, que reduz palavras semelhantes a uma raiz comum, eliminando suas inflexões. Por exemplo, as palavras “correndo”, “correu” e “corre” são convertidas na forma básica “correr”. Desse modo, essa é uma etapa é útil para construir dicionários de formas ativas (como verbos) e suplementares (como pronomes), que são importantes para outras análises, como a Classificação Hierárquica Descendente.

Nuvem de palavras

Como o próprio nome sugere, a nuvem de palavras organiza visualmente as palavras em formato de nuvem, com base em sua frequência. Essa técnica é muito útil, por exemplo, em estudos de representações sociais, onde é possível identificar rapidamente as categorias mais citadas pelos participantes em relação a um tema.

Embora seja uma análise simples, a nuvem de palavras é visualmente eficaz, permitindo que os pesquisadores definam o número mínimo de ocorrências para que uma palavra apareça na visualização.

Análise de similitude

A análise de similitude utiliza a teoria dos grafos para identificar co-ocorrências entre palavras. Com essa análise, os pesquisadores podem verificar se determinadas profissões, por exemplo, estão associadas a adjetivos positivos ou negativos, dependendo do contexto.

Análise de especificidades

A análise de especificidades permite que os pesquisadores explorem a relação entre o conteúdo do corpus e variáveis presentes no próprio texto. Essa análise de contrastes divide o corpus com base em variáveis definidas pelos pesquisadores, como, por exemplo, a posição política de candidatos a cargos eletivos em uma campanha.

Por exemplo, vamos assumir que nosso corpus textual contém os planos de governo de diferentes candidatos durante uma corrida eleitoral. Desse modo, a análise de especificidades investigaria se há diferenças significativas na produção textual presente nos diferentes planos de governo em função da ideologia política dos candidatos.

Classificação Hierárquica Descendente

A Classificação Hierárquica Descendente (CHD) classifica os segmentos de texto com base em seus vocabulários, identificando assim temas comuns ao longo do corpus. Desse modo, a análise considera a proximidade léxica, partindo do princípio de que palavras usadas em contextos semelhantes fazem parte de sistemas de representação específicos.

Por exemplo, ao ler a frase “O criminoso demonstrou um comportamento frio e…”, muitas pessoas completariam a frase com “calculista”, uma palavra que geralmente co-ocorre com “frio” nesse contexto.

A CHD agrupa palavras que co-ocorrem frequentemente, criando classes léxicas com alta similaridade interna e baixa similaridade entre diferentes classes. Os resultados geralmente são apresentados em um dendrograma, que não só exibe as classes identificadas, mas também as palavras mais representativas de cada classe.

Conclusão

Neste post, você conheceu o IRAMUTEQ, um software gratuito para a análise de dados textuais. Além disso, apresentamos as análises disponíveis nessa ferramenta.

A formação da Psicometria Online Academy criou o curso IRAMUTEQ, que ensina cada uma das análises de dados textuais que descrevemos no post. Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

Referências

Camargo, B. V., & Justo, A. M. (2013). IRAMUTEQ: Um software gratuito para análise de dados textuais. Temas em Psicologia21(2), 513–518. https://doi.org/10.9788/TP2013.2-16

Faiad, C., Rodrigues, C. M. L., & Lima, T. J. S. (2021). Análise de dados textuais com a Interface de R pour les Analyses Multidimensionnelles de Textes et de Questionnaires (Iramuteq). In C. Faiad, M. N. Baptista, & R. Primi (Orgs.), Tutoriais em análise de dados aplicados à psicometria (pp. 420–435). Editora Vozes.

Como citar este post

Lima, M. (2023, 5 de janeiro). Análise textual: O software IRAMUTEQ. Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/analise-textual-o-software-iramuteq/

Bruno Figueiredo Damásio

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) e Editor-Associado da Spanish Journal of Psychology, na sub-seção Psicometria e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 5000 citações, nas melhores revistas nacionais e internacionais.

Em 2020, saí da UFRJ para montar a minha formação, a Psicometria Online Academy.

Meu foco é que você se torne um(a) pesquisador(a) de excelência. Clique aqui para conhecer a Academy.

Compartilhe sua opinião sobre este post

Respostas de 2

  1. Olá, boa tarde. É possível se inscrever no curso do IRAMUTEC? Quanto custa o serviço?

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Posts sugeridos

Qual é o papel da matemática na carreira de psicometrista?

O que é correção de Bonferroni?

Qual é a diferença entre aprendizagem supervisionada e não supervisionada?

Conteúdo

Mais lidos

O que é correlação de Pearson?

Teste t de Student

O que é o teste de Shapiro-Wilk?

Qual é a diferença entre R e RStudio?

Postados recentemente

Modelagem por equações estruturais no R: conceitos e aplicações

Compreendendo os índices de validade de conteúdo

Índice de validade de conteúdo

O que são médias marginais?

Deseja se tornar completamente independente na análise dos seus dados?

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Categorias