Receba gratuitamente todos os nossos conteúdos.

Fique por dentro das novidades e oportunidades referentes à Psicometria e Análise Quantitativa de Dados.

Análise textual: O software IRAMUTEQ

A análise textual pode ser definida como um tipo específico de análise de dados, que se trata especificamente da análise de material verbal transcrito. Esses materiais podem ser de diversos tipos, tais como: textos originalmente escritos, entrevistas, documentos, redações, entre outros.

Por se tratar essencialmente de linguagem, tais dados possuem alta relevância para quem pretende investigar pensamentos, crenças e opiniões ou qualquer conteúdo simbólico produzido em relação a determinado fenômeno.

Ponto interessante da análise textual é ir além da dicotomia entre quantitativo e qualitativo na análise de dados. Na análise textual, ao mesmo tempo que pode-se empregar cálculos estatísticos sobre variáveis essencialmente qualitativas – os textos, pode-se ter como objetivo a comparação relacional de produções diferentes em função de variáveis específicas que descrevem quem produziu o texto.

Assim, o uso de softwares específicos para realizar análise textual tem sido imprescindível. Softwares como Ethnograph, o Nudist e o Atlas TI, os quais, ao organizarem os dados, facilitam a realização de análises de conteúdo. Já Evocation e Similitude podem realizar tanto análises estatísticas clássicas, quanto multivariadas, sobre dados textuais, e possibilitam que se relacione as palavras encontradas na produção textual. Além dos softwares citados, destaca-se o IRAMUTEQ (Interface de R pour les Analyses Multidimensionnelles de Textes et de Questionnaires). Software de livre uso que vamos falar nesse post.

O que é o software IRAMUTEQ?

De acordo com a documentação oficial, o IRAMUTEQ é definido como um software licenciado por GNU GPL (v2) que permite fazer análises estatísticas sobre corpus textuais e sobre tabelas indivíduos/palavras. Ele ancora-se no software R (www.r-project.org) e na linguagem python (www.python.org).

Para instalar o software gratuitamente em seu computador, basta fazer o download do software R em www.r-project.org e instalá-lo; e em seguida fazer o download do software IRAMUTEQ em www.iramuteq.org, e instalá-lo também. É necessário que antes de instalar o IRAMUTEQ se instale o R, pois o IRAMUTEQ se utilizará do software R para processar suas análises.

Quais são os tipos de análise feitas pelo Iramuteq?

Este programa informático viabiliza diferentes tipos de análise de dados textuais, desde a lexicografia básica (cálculo de frequência de palavras), até análises multivariadas (classificação hierárquica descendente, análises de similitude). Por meio dele também é possível organizar a distribuição do vocabulário – análise de similitude e nuvem de palavras.

Camargo e Justo (2013) descrevem brevemente cada uma das análises que podem ser realizadas por meio do IRAMUTEQ:

Nas análises lexicais clássicas, o programa identifica e reformata as unidades de texto, transformando Unidades de Contexto Iniciais (UCI) em Unidades de Contexto Elementares (UCE); identifica a quantidade de palavras, frequência média e número de hapax (palavras com frequência um); pesquisa o vocabulário e reduz das palavras com base em suas raízes (lematização); cria dicionário de formas reduzidas, identifica formas ativas e suplementares

Na análise de especificidades, é possível associar diretamente os textos do banco de dados com variáveis descritoras dos seus produtores; é possível analisar a produção textual em função das variáveis de caracterização. Trata-se de uma análise de contrastes, na qual o corpus é dividido em função de uma variável escolhida pelo pesquisador. Por exemplo, é possível comparar a produção textual de homens e mulheres em relação a determinado tema.

método da Classificação Hierárquica Descendente (CHD) proposto por Reinert (1990) e utilizado pelo software ALCESTE classifica os segmentos de texto em função dos seus respectivos vocabulários, e o conjunto deles é repartido com base na frequência das formas reduzidas (palavras já lematizadas). Esta análise visa obter classes de UCE que, ao mesmo tempo, apresentam vocabulário semelhante entre si, e vocabulário diferente das UCE das outras classes. O IRAMUTEQ também fornece outra forma de apresentação dos resultados, por meio de uma análise fatorial de correspondência feita a partir da CHD (Análise Pós-Fatorial) que representa num plano cartesiano as diferentes palavras e variáveis associadas a cada uma das classes da CHD.

análise de similitude se baseia na teoria dos grafos, possibilita identificar as co ocorrências entre as palavras e seu resultado traz indicações da conexidade entre as palavras, auxiliando na identificação da estrutura de um corpus textual, distinguindo também as partes comuns e as especificidades em função das variáveis ilustrativas (descritivas) identificadas na análise (Marchand & Ratinaud, 2012).

A nuvem de palavras as agrupa e as organiza graficamente em função da sua frequência. É uma análise lexical mais simples, porém graficamente bastante interessante, na medida em que possibilita rápida identificação das palavras-chave de um corpus

Estas análises podem ser realizadas tanto a partir de um grupo de textos a respeito de uma determinada temática (corpus) reunidos em um único arquivo de texto; como a partir de tabelas com indivíduos em linha e palavras em coluna, organizadas em planilhas, como é o caso dos bancos de dados construídos a partir de testes de evocações livres.

Vale a pena ressaltar que IRAMUTEQ não é um método de pesquisa e também os relatórios obtidos por meio dele não são em si as análises. A interpretação das saídas obtidas pelo IRAMUTEQ devem ser interpretadas, e assim tiradas as conclusões sobre o significado das análises lexicais e do emprego de análises multivariadas, além de um bom domínio do estado da arte que envolve o tema específico de cada pesquisa.

Referência: Camargo, Brigido Vizeu, & Justo, Ana Maria. (2013). IRAMUTEQ: um software gratuito para análisede dados textuais. Temas em Psicologia21(2), 513-518. https://dx.doi.org/10.9788/TP2013.2-16

Gostou desse conteúdo? Precisa aprender Análise de dados? Faça parte da Psicometria Online Academy: a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

BRUNO FIGUEIREDO DAMÁSIO

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) eEditor-Associado da Spanish Journal of Psychology, na sub-seção Psicometri e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 3000 citações, nas melhores revistas nacionais e internacionais. Atualmente, me dedico a formação de novos pesquisadores, através da Psicometria Online Academy. Minha missão é ampliar a formação em Psicometria no Brasil e lhe auxiliar a conquistar os seus objetivos profissionais.

Deseja se tornar completamente autônomo e independente na análise dos seus dados?

2 respostas

  1. Olá, boa tarde. É possível se inscrever no curso do IRAMUTEC? Quanto custa o serviço?

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Veja mais

Posts relacionados

Covariância e correlação

Covariância e correlação

Se você é estudante, professor ou pesquisador você está no lugar certo. Hoje, vamos mergulhar em um conceito fundamental: covariância e correlação. Na análise de dados, entender a relação entre

Diferenças entre Modelos Lineares e Modelos Lineares Generalizados (GLMs)

Diferenças entre Modelos Lineares e Modelos Lineares Generalizados (GLMs)

Em análise de dados, Modelos Lineares (LMs) e Modelos Lineares Generalizados (GLMs) são duas técnicas fundamentais que desempenham papéis cruciais na modelagem e interpretação de dados. Embora ambos compartilhem o

Explorando as etapas da análise de dados

Explorando as etapas da análise de dados

No vasto universo da análise de dados, encontramos duas vertentes cruciais: as estatísticas descritivas e as estatísticas inferenciais. Cada uma desempenha um papel distintivo na interpretação e compreensão de conjuntos

Breve check list para escrita de artigo acadêmico

Breve check list para escrita de artigo acadêmico

Você está pronto para embarcar em uma jornada de descoberta acadêmica? Seja você um pesquisado experiente ou iniciante, ter um guia para escrever um artigo de pesquisa é essencial para

O que são médias marginais?

O que são médias marginais?

Ao começar com estatísticas descritivas tradicionais, como as médias brutas, reconhecemos a necessidade de ir além, considerando possíveis viéses decorrentes de variações no número de observações e covariâncias. A pergunta-chave

Covariância e correlação

Covariância e correlação

Se você é estudante, professor ou pesquisador você está no lugar certo. Hoje, vamos mergulhar em um conceito fundamental: covariância e correlação. Na análise de dados, entender a relação entre

Diferenças entre Modelos Lineares e Modelos Lineares Generalizados (GLMs)

Diferenças entre Modelos Lineares e Modelos Lineares Generalizados (GLMs)

Em análise de dados, Modelos Lineares (LMs) e Modelos Lineares Generalizados (GLMs) são duas técnicas fundamentais que desempenham papéis cruciais na modelagem e interpretação de dados. Embora ambos compartilhem o

Explorando as etapas da análise de dados

Explorando as etapas da análise de dados

No vasto universo da análise de dados, encontramos duas vertentes cruciais: as estatísticas descritivas e as estatísticas inferenciais. Cada uma desempenha um papel distintivo na interpretação e compreensão de conjuntos

Breve check list para escrita de artigo acadêmico

Breve check list para escrita de artigo acadêmico

Você está pronto para embarcar em uma jornada de descoberta acadêmica? Seja você um pesquisado experiente ou iniciante, ter um guia para escrever um artigo de pesquisa é essencial para

O que são médias marginais?

O que são médias marginais?

Ao começar com estatísticas descritivas tradicionais, como as médias brutas, reconhecemos a necessidade de ir além, considerando possíveis viéses decorrentes de variações no número de observações e covariâncias. A pergunta-chave

Cadastre-se para ser notificado com o link das aulas ao vivo:

Módulo 4: Redes neurais artificiais

• Introdução a Deep Learning

• Avaliando sistemas de Deep Learning

• Redes Neurais feitas (sem programação) no SPSS

• Aula bônus: O futuro da IA na Sociedade

• Aula bônus: Dois Estudos de Caso 

Módulo 3: Interpretar e reportar resultados

• Gerar, interpretar e reportar resultados em Machine Learning

Módulo 2: Criando o seu sistema

• Selecionando algoritmos e métodos 
• Práticas de Machine Learning (Sem programação): Decision Tree (JASP), Linear Discriminant Classification (JASP) e Plataforma ORANGE
• Aula Bônus: Avaliação Psicológica e Machine Learning
• Aula Bônus: Livros e Cursos recomendados  
• Aula Bônus: Entrevista com Cientista de Dados focado na área da Saúde

Módulo 1: O que é Machine Learning

• O que é Machine Learning?
• Como a máquina aprende?
• Machine Learning para Psicometria e Pesquisa Quantitativa (pesquisas comentadas)
• Tipos de Machine Learning (Supervisionado e Não-supervisionado)
• Práticas de Machine Learning (Sem programação): JASP e SPSS
Aula Bônus: Filosofia da Inteligência Artificial
• Aula Bônus: Entrevista com Cientista de Dados graduado em Psicologia
• Aula bônus: Estudo de Caso sobre Redução Dimensional 

Preencha abaixo para
participar gratuitamente

Fique tranquilo, não utilizaremos suas informações de contato para enviar qualquer tipo de SPAM. Os dados coletados são tratados nos termos da Lei Geral de Proteção de Dados e você pode se descadastrar da nossa lista de contatos a qualquer momento.