Inteligência Artificial e Processamento de Linguagem Natural

A Inteligência Artificial (IA) é um ramo da ciência da computação que busca desenvolver sistemas capazes de imitar e aprimorar habilidades humanas, como o raciocínio, aprendizado e percepção. Uma de suas subáreas mais fascinantes é o Processamento de Linguagem Natural (PLN), que se dedica a compreender e interpretar a linguagem humana, permitindo que máquinas e programas interajam com as pessoas de maneira mais eficiente e intuitiva. O PLN engloba desde a análise sintática e semântica das palavras até a geração de texto coerente e significativo, possibilitando a criação de assistentes virtuais, sistemas de tradução automática e outras aplicações que facilitam a comunicação e o acesso à informação em nosso cotidiano.

Sobre o coordenador da área

Prof. Sergio Antônio Andrade de Freitas

Professor e pesquisador na área de Inteligência Artificial (IA) e Processamento de Linguagem Natural (PLN), é professor Titular na Universidade de Brasília - UnB. Algumas de suas contribuições para o campo do PLN são a interpretação automatizada de anáforas, um estudo pioneiro que aprofundou a compreensão de como máquinas podem processar e interpretar texto humano, contribuindo para a resolução de anáforas e avanços na compreensão textual computacional. Além disso, suas pesquisas em IA exploram a integração de métodos computacionais avançados para desenvolver sistemas mais inteligentes e intuitivos, reforçando a interação humana-computador e promovendo inovações tecnológicas no campo. Atualmente, ele é docente do curso de Engenharia de Software e membro ativo do corpo docente do Programa de Pós-graduação em Computação Aplicada (PPCA).
Mais sobre o coordenador

Equipe de pesquisa

Mestrado

Trabalho de conclusão de curso

Pesquisadores anteriores

Mestrado

  1. Edmilson Cosme da Silva, Previsão da evasão acadêmica no ensino superior - o caso dos cursos de graduação presencial da Universidade de Brasília . Dissertação (Mestrado Profissional em Computação Aplicada) - UnB, 2023 Orientador(es): Sergio Freitas . Tags: Análise da Aprendizagem, Aprendizado de Máquina .
    Pesquisadores têm investigado a evasão no ensino superior, identificando duas categorias - alunos que deixam a universidade e aqueles que abandonam o ensino superior, afetando negativamente instituições, estudantes e sociedade. Desde 1995, no Brasil, a criação da ANDIFES intensificou estudos sobre diplomação, retenção e evasão em universidades brasileiras, focando na evasão institucional, caracterizada pela desistência do aluno do curso original. A Universidade de Brasília (UnB) implementou estratégias para aumentar a permanência estudantil. Este trabalho visou desenvolver e testar um modelo de análise para prever a evasão em cursos presenciais, através de uma Revisão Sistemática da Literatura para identificar fatores de impacto e definir indicadores extraídos de sistemas acadêmicos da UnB. O modelo, denominado MAGRA, combina indicadores com algoritmos de aprendizado de máquina, visando identificar alunos em risco de evasão. Testes realizados na Faculdade do Gama (FGA) e na UnB indicaram que a frequência de matrícula em disciplinas pode prever dificuldades de conclusão. A pesquisa sugere que para aprimorar a identificação de alunos em risco, são necessários ajustes nos mecanismos de feedback, inclusão de novos sistemas, melhoria na qualidade dos dados e nos parâmetros dos algoritmos.
  2. Arthur Rocha Temporim de Lacerda, Gamified Chatbot Management Process: A way to build gamified chatbots . Dissertação (Mestrado Profissional em Computação Aplicada) - UnB, 2024 Orientador(es): Sergio Freitas . Tags: Gamificação, Aprendizado de Máquina .
    Estruturas de desenvolvimento de chatbots oferecem métodos de construção diversos, mas processos estabelecidos, como o Processo de Gerenciamento de Chatbots (CMP), carecem de atividades especificamente projetadas para aumentar o engajamento do usuário. Esta tese propõe o Processo de Gerenciamento de Chatbots Gamificado (GCMP), uma extensão do CMP que incorpora e adapta atividades para melhorar o engajamento do usuário com o chatbot. Três versões do GCMP foram desenvolvidas, cada uma incorporando melhorias orientadas pela abordagem Goal-Question-Metric (GQM). Essa abordagem iterativa facilitou a avaliação e evolução do processo. Experimentos com usuários reais demonstraram um engajamento positivo, com 100% dos participantes alcançando os objetivos propostos. Além disso, o tempo médio de implantação diminuiu em 66% entre a primeira e a última versão. As avaliações dos usuários também atribuíram as melhores notas à qualidade das respostas geradas pelo chatbot. Esses resultados destacam a eficácia do GCMP proposto. Os resultados do experimento sugerem uma correlação positiva entre o uso do GCMP e a melhoria no desenvolvimento de chatbots gamificados. As melhorias observadas tanto na funcionalidade do chatbot quanto nas técnicas de gamificação oferecem indicadores promissores para a adoção ampla do GCMP como um processo robusto e eficaz para o desenvolvimento de chatbots gamificados.
  3. Débora Zupeli Bossois, Metodologia de categorização de textos a partir de documentos não rotulados utilizando um processo de resolução de anáforas . Dissertação de Mestrado em Informática - UFES, 2010 Orientador(es): Sergio Freitas . Tags: Processamento de Linguagem Natural, Inteligência Artificial, Aprendizado de Máquina .
    A expansão do conteúdo digital exige métodos eficientes para organizar informações. Neste contexto, o processo de categorização de textos emerge como solução, dividindo informações em categorias temáticas. Enquanto a abordagem supervisionada é tradicional, demandando um conjunto de dados pré-classificados, as abordagens semi e não supervisionadas são alternativas viáveis que não necessitam de dados rotulados para treinamento. Todavia, essas técnicas geralmente ignoram nuances semânticas, como a anáfora - uso de termos variados para a mesma entidade. Este estudo propõe um método de categorização não supervisionado baseado na Estrutura Nominal do Discurso (END) para a resolução de anáforas, aplicando bootstrapping para gerar rotulações iniciais e desenvolver um modelo categorizador. A integração da resolução de anáforas mostrou-se benéfica para a precisão do sistema de categorização não supervisionada, conforme evidenciado pelos resultados das experimentações realizadas.
  4. Luana Vieira Morellato, Metodologia computacional para identificação de sintagmas nominais da língua portuguesa . Dissertação de Mestrado em Informática - UFES, 2010 Orientador(es): Sergio Freitas . Tags: Processamento de Linguagem Natural, Inteligência Artificial .
    Sintagmas, unidades de sentido com funções sintáticas dentro de uma frase, são essenciais para a estruturação do conteúdo expresso nas sentenças, conforme destacado por Nicola (2008). As frases articulam seu conteúdo por meio dos elementos e das combinações que a linguagem disponibiliza, formando assim conjuntos e subconjuntos atuando como unidades sintáticas - os sintagmas, categorizados em nominais e verbais, com os nominais destacando-se pelo seu maior valor semântico. Eles são fundamentais em tarefas de Processamento de Linguagem Natural (PLN), como resolução de anáforas, construção de ontologias automáticas, análises em textos médicos para geração de resumos e vocabulário, ou como etapa preliminar em análises sintáticas. Em Recuperação de Informação (RI), os sintagmas aprimoram a criação de termos em sistemas de indexação e buscas, elevando a eficácia dos resultados. Esta dissertação introduz uma metodologia computacional para identificar sintagmas nominais em documentos digitais em português. Detalha-se a abordagem para identificar e extrair sintagmas nominais através do desenvolvimento do SISNOP - Sistema Identificador de Sintagmas Nominais em Português. O SISNOP, um sistema integrado por módulos e programas, analisa textos em linguagem natural, realizando análises morfológicas e sintáticas para recuperar sintagmas nominais, fornecendo também informações sintáticas, como gênero, número e grau das palavras nos sintagmas. Testado em corpora como CETENFolha e CETEMPúblico, o SISNOP alcançou reconhecimento de 98,12% e 94,59% das frases, identificando mais de 24 milhões de sintagmas. Seus módulos—Etiquetador Morfológico, Identificador de Sintagmas Nominais e Identificador de Gênero, Número e Grau—foram avaliados individualmente com um conjunto de dados menor devido à análise manual dos resultados, atingindo precisão de 82,45% e abrangência de 69,20%.
  5. Francisco Santiago do Carmo Pereira, A methodology for the use of natural language processing in the search for information in digital documents . Dissertação de Mestrado em Informática - UFES, 2009 Orientador(es): Sergio Freitas . Tags: Processamento de Linguagem Natural, Inteligência Artificial, Aprendizado de Máquina .
    Esta dissertação apresenta uma nova metodologia para busca em textos digitais, fundamentada na Estrutura Nominal do Discurso (END), que aprimora a resolução de anáforas conforme proposto por Freitas. Diferentemente dos modelos tradicionais de Recuperação de Informação (RI), como o vetoriano e o LSI, que se baseiam em termos para representar e buscar documentos, esta abordagem considera a estrutura textual e o uso de anáforas, superando limitações dos modelos clássicos ao lidar com referências variadas ou omissões de entidades principais. A metodologia, inspirada no trabalho de Seibel Júnior, utiliza a END para criar a Estrutura Nominal do Discurso para Buscas (ENDB), focando em elementos centrais das frases para a representação de textos. Este processo não só permite uma representação textual mais fiel mas também melhora os resultados das buscas ao incluir todas as entidades textuais identificadas. O documento detalha a implementação da metodologia e os resultados experimentais, oferecendo uma contribuição significativa para a área de RI.
  6. Hilário Seibel Júnior, Recuperação de informações relevantes em documentos digitais baseada na resolução de anáforas . Dissertação de Mestrado em Informática - UFES, 2007 Orientador(es): Sergio Freitas . Tags: Processamento de Linguagem Natural, Inteligência Artificial .
    Os métodos de recuperação de informação (RI) tradicionais se baseiam essencialmente na contagem da freqüência em que as palavras aparecem em um documento; sem apresentar soluções para que o conteúdo semântico do discurso seja interpretado [Van Rijsbergen 1979; Baeza-Yates e Ribeiro-Neto 1999]. Por não interpretarem o documento analisado; tais métodos podem deixar de considerar informações importantes a seu respeito. Uma solução para contornar esse problema; citada em [Salton e McGill 1986]; é utilizar o Processamento de Linguagem Natural (PLN) na recuperação de informação. Uma aplicação do PLN é o processamento de anáforas. Anáfora [Carter 1987; Beaver 2004] é um fenômeno lingüístico no qual uma entidade introduzida a priori é referenciada posteriormente em outra frase através de alguma expressão lingüística; tal como em "Valentina nasceu em São Paulo. A menina é do signo de Peixes.". A resolução das anáforas identifica que o termo menina presente na segunda frase do texto referencia a entidade introduzida no discurso pelo termo Valentina da primeira frase. Isso permite afirmar que Valentina é mais relevante em relação ao texto do que se tal referência não ocorresse. Freitas propõe em [Freitas 2005] um método para resolver as anáforas de um documento através da criação de uma estrutura que permite acompanhar as entidades que se mantêm em evidência ao longo do discurso. Essa estrutura armazena informações que podem ser aproveitadas por um método de recuperação de informação. Esta dissertação propõe uma metodologia computacional para recuperar informações relevantes a partir da resolução das anáforas de um documento; visando aumentar a qualidade dos resultados de uma query. A resolução de anáforas permite identificar exatamente a quantidade de vezes que cada entidade é referenciada em um discurso; expondo entidades e ligações que podiam estar obscuras no discurso original. Essa informação torna possível decidir se certa entidade é mais relevante que outra no documento; dando mais enfoque ao que o autor escreveu. Dessa forma; os documentos relevantes recuperados são classificados pela quantidade de informação que apresentam a respeito dos termos buscados; e não apenas pela localização e/ou quantidade de ocorrências de tais termos. Este trabalho também permite identificar; através da estrutura gerada pelo processamento de anáforas; os termos sinônimos (aqueles que referenciam uma mesma entidade). Se o documento indica que dois termos são sinônimos; a busca por um deles retorna o mesmo resultado que a busca pelo outro; aumentando ainda mais a qualidade dos resultados de uma query. Este trabalho apresenta os detalhes da metodologia proposta - as medidas utilizadas para calcular a relevância de um termo em relação ao documento interpretado pelo processamento de anáforas; os procedimentos necessários para a realização de uma query; o protótipo implementado e a análise de sua complexidade de tempo. Além disso; são avaliadas as características desta abordagem que a diferenciam dos métodos tradicionais em relação à qualidade dos resultados obtidos.
  7. Ayrton Monteiro Cristo Filho, Interpretação computacional do futuro do pretérito simples em narrativas para o Português do Brasil . Dissertação de Mestrado em Informática - UFES, 2004 Orientador(es): Berilhes Borges Garcia, Sergio Freitas . Tags: Processamento de Linguagem Natural, Inteligência Artificial .

Iniciação Científica

Trabalho de conclusão de curso

  1. Ícaro Oliveira Augusto Silva, Extração de informações sobre usabilidade a partir de comentários dos aplicativos feitos na Play Store . Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Software) - UnB, 2023 Orientador(es): Cristiane Ramos . Tags: Processamento de Linguagem Natural, Qualidade de Software .
  2. Luiz Henrique Fernandes Zamprogno, Chatbot gamificado para consulta de informações acadêmicas . Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Software) - UnB, 2022 Orientador(es): Sergio Freitas . Tags: Gamificação, Inteligência Artificial .
  3. Victor Eduardo Araujo Ribeiro, Chatbot gamificado para consulta de informações acadêmicas . Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Software) - UnB, 2022 Orientador(es): Sergio Freitas . Tags: Gamificação, Inteligência Artificial .
  4. Yeltsin Suares Gama, Sistema de apoio ao aprendizado. . Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Software) - UnB, 2017 Orientador(es): Sergio Freitas . Tags: Análise da Aprendizagem, Inteligência Artificial .
  5. Cristóvão de Lima Frinhani, Aplicação de processamento de linguagem natural - uma ferramenta de apoio à correção de questões dissertativas . Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Software) - UnB, 2016 Orientador(es): Sergio Freitas . Tags: Processamento de Linguagem Natural, Inteligência Artificial, Aprendizado de Máquina .
    No contexto da educação a distância (EAD), que tem visto uma expansão global, um dos desafios mais significativos reside na escalabilidade da avaliação de questões dissertativas. Este desafio afeta a eficiência dos tutores e a qualidade do feedback fornecido aos alunos, uma vez que a correção de tais questões demanda considerável tempo. Com o objetivo de enfrentar essa problemática, foi desenvolvido um sistema de apoio à pré-avaliação que utiliza processamento de linguagem natural (PLN) e aprendizado de máquina (AM) para automatizar a atribuição de notas preliminares às respostas dos alunos. O sistema proposto é dividido em duas partes principais - a primeira aplica algoritmos de similaridade semântica para comparar as respostas dos alunos com os gabaritos fornecidos; a segunda parte é uma interface web que facilita o cadastro de questões e gabaritos, a submissão de respostas pelos alunos e permite que o tutor avalie as respostas. A precisão do sistema é continuamente aprimorada através do feedback do tutor, permitindo ao AM ajustar os critérios de avaliação de acordo com as necessidades. O sistema foi testado na disciplina de fundamentos de arquitetura de computadores, onde demonstrou a capacidade de atribuir notas significativas às respostas dos alunos e revelou uma melhoria na precisão das avaliações com base no feedback do tutor. Conclui-se que o sistema de apoio à pré-avaliação apresenta uma solução promissora para os desafios enfrentados na avaliação de questões dissertativas em ambientes de EAD, promovendo uma melhoria na escalabilidade do processo de correção e na qualidade do feedback fornecido, com potencial de aplicação em diversas áreas do conhecimento.
  6. Igor Ramos, Proposta de metodologia para criação de mapas em estudos de mapeamento sistemático baseada em conhecimentos relacionados à ontologias . Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Software) - UnB, 2015 Orientador(es): Fabiana Mendes . Tags: Transformação Digital, Inteligência Artificial .
  7. Greg Ouyama Martins, Avaliação de algoritmos para ordenação de documentos digitais recuperados em busca . Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Software) - UnB, 2013 Orientador(es): Sergio Freitas . Tags: Inteligência Artificial, Processamento de Linguagem Natural .
    A origem da busca por informação remonta às bibliotecas, onde era possível recuperar o necessário por meio de consultas em cartões de catálogos, organizando os livros por título, autor, ano ou editora. Com o progresso tecnológico, esse processo foi automatizado, permitindo a execução dessas tarefas por computadores. No entanto, devido ao vasto volume de informações disponíveis, localizar informações específicas com eficiência pode ser desafiador, tornando a busca uma tarefa exaustiva e complexa. Para resolver esse desafio, há estudos e implementações sobre a ordenação de informações recuperadas. É pertinente também a aplicação de técnicas para consultas customizadas, baseadas em critérios definidos pelos usuários. Este trabalho propõe analisar a eficácia de algoritmos dinâmicos e estáticos na ordenação de informações recuperadas, explorando a personalização de consultas em motores de busca open source. Avaliaremos qual algoritmo oferece maior precisão, utilizando métricas de precisão x recall, quais permitem um grau de personalização nas consultas, incluindo perfis de usuários das quatro engenharias da Universidade de Brasília - Faculdade do Gama, e como a engenharia de software pode aprimorar a ordenação e recuperação de informações.
  8. Luis Bruno Fidelis Gomes, Business Intelligence aplicada à saúde: painéis de monitoramento para profissionais de saúde da Rede de Atenção Psicossocial . Bacharelado em Engenharia de Software - UnB, 2023 Orientador(es): George Marsicano . Tags: Inteligência Artificial .

Projetos em andamento

Publicações e produções

Publicações (30)

  1. Éber Júnio Borges Moreira,Sergio Antônio Andrade Freitas, A CP-SAT Approach for Academic Resource Timetabling in Higher Education Institutions: A Case Study at a Major Public University , in IEEE International Conference on IT in Higher Education and Training (ITHET 2024) , pTo appear, 2024 . Tags: Aprendizado de Máquina, Análise da Aprendizagem .
  2. LACERDA, A. R. T.,FREITAS, S. A. A.,RAMOS, C. S., Gamified Chatbot Management Process: A way to build gamified chatbots , in 10th Intelligent Systems Conference , 2024 . DOI: 10.1007/978-3-031-66428-1_2 . Tags: Gamificação, Aprendizado de Máquina .
    Este artigo propõe a incorporação de gamificação com aprendizado de máquina para o desenvolvimento de chatbots. O Processo de Desenvolvimento de Chatbots Gamificados (GCMP) é um processo para o desenvolvimento de chatbots gamificados, compreendendo oito atividades, organizadas em quatro etapas, com ênfase na implementação da gamificação. Este processo inclui planejamento da gamificação, gestão da gamificação, atualização do conteúdo do chatbot, implementação do comportamento do chatbot, validação do comportamento do chatbot, análise do comportamento do chatbot, entrega do chatbot e análise do uso do chatbot. O GCMP fornece um guia claro e estruturado, permitindo flexibilidade para acomodar os requisitos específicos de cada projeto. Este artigo descreve a metodologia empregada, que inclui a aplicação de um experimento com estudantes de engenharia de software. O experimento é conduzido por meio do fornecimento de documentos, realização de reuniões semanais e coleta de dados pertinentes. A aplicabilidade do GCMP em projetos de chatbots gamificados é examinada, e uma nova versão do processo é proposta para resolver as lacunas encontradas, com conclusões baseadas nos experimentos realizados.
  3. SILVA, E. C.,FREITAS, S. A. A.,RAMOS, C. S.,MENEZES, A. E. M.,ARAUJO, L. K. S. R., A systematic review of the factors that impact the prediction of retention and dropout in higher education , in 56th Hawaii International Conference on System Science , 2023 . Tags: Análise da Aprendizagem, Aprendizado de Máquina .
  4. Edmilson Cosme da Silva, Previsão da evasão acadêmica no ensino superior - o caso dos cursos de graduação presencial da Universidade de Brasília . Dissertação (Mestrado Profissional em Computação Aplicada) - UnB, 2023 Orientador(es): Sergio Freitas . Tags: Análise da Aprendizagem, Aprendizado de Máquina .
    Pesquisadores têm investigado a evasão no ensino superior, identificando duas categorias - alunos que deixam a universidade e aqueles que abandonam o ensino superior, afetando negativamente instituições, estudantes e sociedade. Desde 1995, no Brasil, a criação da ANDIFES intensificou estudos sobre diplomação, retenção e evasão em universidades brasileiras, focando na evasão institucional, caracterizada pela desistência do aluno do curso original. A Universidade de Brasília (UnB) implementou estratégias para aumentar a permanência estudantil. Este trabalho visou desenvolver e testar um modelo de análise para prever a evasão em cursos presenciais, através de uma Revisão Sistemática da Literatura para identificar fatores de impacto e definir indicadores extraídos de sistemas acadêmicos da UnB. O modelo, denominado MAGRA, combina indicadores com algoritmos de aprendizado de máquina, visando identificar alunos em risco de evasão. Testes realizados na Faculdade do Gama (FGA) e na UnB indicaram que a frequência de matrícula em disciplinas pode prever dificuldades de conclusão. A pesquisa sugere que para aprimorar a identificação de alunos em risco, são necessários ajustes nos mecanismos de feedback, inclusão de novos sistemas, melhoria na qualidade dos dados e nos parâmetros dos algoritmos.
  5. Arthur Rocha Temporim de Lacerda, Gamified Chatbot Management Process: A way to build gamified chatbots . Dissertação (Mestrado Profissional em Computação Aplicada) - UnB, 2024 Orientador(es): Sergio Freitas . Tags: Gamificação, Aprendizado de Máquina .
    Estruturas de desenvolvimento de chatbots oferecem métodos de construção diversos, mas processos estabelecidos, como o Processo de Gerenciamento de Chatbots (CMP), carecem de atividades especificamente projetadas para aumentar o engajamento do usuário. Esta tese propõe o Processo de Gerenciamento de Chatbots Gamificado (GCMP), uma extensão do CMP que incorpora e adapta atividades para melhorar o engajamento do usuário com o chatbot. Três versões do GCMP foram desenvolvidas, cada uma incorporando melhorias orientadas pela abordagem Goal-Question-Metric (GQM). Essa abordagem iterativa facilitou a avaliação e evolução do processo. Experimentos com usuários reais demonstraram um engajamento positivo, com 100% dos participantes alcançando os objetivos propostos. Além disso, o tempo médio de implantação diminuiu em 66% entre a primeira e a última versão. As avaliações dos usuários também atribuíram as melhores notas à qualidade das respostas geradas pelo chatbot. Esses resultados destacam a eficácia do GCMP proposto. Os resultados do experimento sugerem uma correlação positiva entre o uso do GCMP e a melhoria no desenvolvimento de chatbots gamificados. As melhorias observadas tanto na funcionalidade do chatbot quanto nas técnicas de gamificação oferecem indicadores promissores para a adoção ampla do GCMP como um processo robusto e eficaz para o desenvolvimento de chatbots gamificados.
  6. Ícaro Oliveira Augusto Silva, Extração de informações sobre usabilidade a partir de comentários dos aplicativos feitos na Play Store . Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Software) - UnB, 2023 Orientador(es): Cristiane Ramos . Tags: Processamento de Linguagem Natural, Qualidade de Software .
  7. Luiz Henrique Fernandes Zamprogno, Chatbot gamificado para consulta de informações acadêmicas . Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Software) - UnB, 2022 Orientador(es): Sergio Freitas . Tags: Gamificação, Inteligência Artificial .
  8. Victor Eduardo Araujo Ribeiro, Chatbot gamificado para consulta de informações acadêmicas . Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Software) - UnB, 2022 Orientador(es): Sergio Freitas . Tags: Gamificação, Inteligência Artificial .
  9. FREITAS, S. A. A.,CANEDO, E. D.,FRINHANI, C. L.,FERNANDES, M. V.,SILVA, M. C., Evaluation of an Automatic Essay Correction System Used as an Assessment Tool , in 19th International Conference on Human-Computer Interaction , 2017 . DOI: 10.1007/978-3-319-58700-4_18 . Tags: Aprendizado de Máquina, Processamento de Linguagem Natural .
  10. Yeltsin Suares Gama, Sistema de apoio ao aprendizado. . Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Software) - UnB, 2017 Orientador(es): Sergio Freitas . Tags: Análise da Aprendizagem, Inteligência Artificial .
  11. FREITAS, S. A. A.,SILVA, RITA DE CASSIA,LUCENA, TIAGO FRANKLIN R.,RIBEIRO, EDUARDO DO N.,LIMA, VICTOR COTRIM DE,SILVA, RODRIGO M. S. DA, Smart Quizzes in the Engineering Education , in 2016 49th Hawaii International Conference on System Sciences (HICSS) , 2016 . DOI: 10.1109/HICSS.2016.17 . Tags: Inteligência Artificial, Educação .
  12. FRINHANI, CRISTOVAO LIMA,FREITAS, S. A. A.,FERNANDES, MAURICIO VIDOTTI,DIAS CANEDO, EDNA, An automatic essay correction for an active learning environment , in 2016 IEEE/ACS 13th International Conference of Computer Systems and Applications (AICCSA) , 2016 . DOI: 10.1109/AICCSA.2016.7945769 . Tags: Inteligência Artificial, Aprendizado de Máquina, Processamento de Linguagem Natural .
  13. Cristóvão de Lima Frinhani, Aplicação de processamento de linguagem natural - uma ferramenta de apoio à correção de questões dissertativas . Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Software) - UnB, 2016 Orientador(es): Sergio Freitas . Tags: Processamento de Linguagem Natural, Inteligência Artificial, Aprendizado de Máquina .
    No contexto da educação a distância (EAD), que tem visto uma expansão global, um dos desafios mais significativos reside na escalabilidade da avaliação de questões dissertativas. Este desafio afeta a eficiência dos tutores e a qualidade do feedback fornecido aos alunos, uma vez que a correção de tais questões demanda considerável tempo. Com o objetivo de enfrentar essa problemática, foi desenvolvido um sistema de apoio à pré-avaliação que utiliza processamento de linguagem natural (PLN) e aprendizado de máquina (AM) para automatizar a atribuição de notas preliminares às respostas dos alunos. O sistema proposto é dividido em duas partes principais - a primeira aplica algoritmos de similaridade semântica para comparar as respostas dos alunos com os gabaritos fornecidos; a segunda parte é uma interface web que facilita o cadastro de questões e gabaritos, a submissão de respostas pelos alunos e permite que o tutor avalie as respostas. A precisão do sistema é continuamente aprimorada através do feedback do tutor, permitindo ao AM ajustar os critérios de avaliação de acordo com as necessidades. O sistema foi testado na disciplina de fundamentos de arquitetura de computadores, onde demonstrou a capacidade de atribuir notas significativas às respostas dos alunos e revelou uma melhoria na precisão das avaliações com base no feedback do tutor. Conclui-se que o sistema de apoio à pré-avaliação apresenta uma solução promissora para os desafios enfrentados na avaliação de questões dissertativas em ambientes de EAD, promovendo uma melhoria na escalabilidade do processo de correção e na qualidade do feedback fornecido, com potencial de aplicação em diversas áreas do conhecimento.
  14. MACIEL, C.,SOUZA, P. C.,VITERBO, J.,MENDES, F. F.,SEGHROUCHNI, A., A Multi-agent Architecture to Support Ubiquitous Applications in Smart Environments , COMMUNICATIONS IN COMPUTER AND INFORMATION SCIENCE (PRINT) , 498(106), 2015 . DOI: 10.1007/978-3-662-46241-6_9 . Tags: Inteligência Artificial .
  15. Igor Ramos, Proposta de metodologia para criação de mapas em estudos de mapeamento sistemático baseada em conhecimentos relacionados à ontologias . Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Software) - UnB, 2015 Orientador(es): Fabiana Mendes . Tags: Transformação Digital, Inteligência Artificial .
  16. MACIEL, CRISTIANO,de Souza, Patricia Cristiane,Viterbo, José,Mendes, Fabiana Freitas,El Fallah Seghrouchni, Amal, A Multi-agent Architecture to Support Ubiquitous Applications in Smart Environments , 2015 . DOI: 10.1007/978-3-662-46241-6_9 . Tags: Inteligência Artificial .
  17. Greg Ouyama Martins, Avaliação de algoritmos para ordenação de documentos digitais recuperados em busca . Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Software) - UnB, 2013 Orientador(es): Sergio Freitas . Tags: Inteligência Artificial, Processamento de Linguagem Natural .
    A origem da busca por informação remonta às bibliotecas, onde era possível recuperar o necessário por meio de consultas em cartões de catálogos, organizando os livros por título, autor, ano ou editora. Com o progresso tecnológico, esse processo foi automatizado, permitindo a execução dessas tarefas por computadores. No entanto, devido ao vasto volume de informações disponíveis, localizar informações específicas com eficiência pode ser desafiador, tornando a busca uma tarefa exaustiva e complexa. Para resolver esse desafio, há estudos e implementações sobre a ordenação de informações recuperadas. É pertinente também a aplicação de técnicas para consultas customizadas, baseadas em critérios definidos pelos usuários. Este trabalho propõe analisar a eficácia de algoritmos dinâmicos e estáticos na ordenação de informações recuperadas, explorando a personalização de consultas em motores de busca open source. Avaliaremos qual algoritmo oferece maior precisão, utilizando métricas de precisão x recall, quais permitem um grau de personalização nas consultas, incluindo perfis de usuários das quatro engenharias da Universidade de Brasília - Faculdade do Gama, e como a engenharia de software pode aprimorar a ordenação e recuperação de informações.
  18. Débora Zupeli Bossois, Metodologia de categorização de textos a partir de documentos não rotulados utilizando um processo de resolução de anáforas . Dissertação de Mestrado em Informática - UFES, 2010 Orientador(es): Sergio Freitas . Tags: Processamento de Linguagem Natural, Inteligência Artificial, Aprendizado de Máquina .
    A expansão do conteúdo digital exige métodos eficientes para organizar informações. Neste contexto, o processo de categorização de textos emerge como solução, dividindo informações em categorias temáticas. Enquanto a abordagem supervisionada é tradicional, demandando um conjunto de dados pré-classificados, as abordagens semi e não supervisionadas são alternativas viáveis que não necessitam de dados rotulados para treinamento. Todavia, essas técnicas geralmente ignoram nuances semânticas, como a anáfora - uso de termos variados para a mesma entidade. Este estudo propõe um método de categorização não supervisionado baseado na Estrutura Nominal do Discurso (END) para a resolução de anáforas, aplicando bootstrapping para gerar rotulações iniciais e desenvolver um modelo categorizador. A integração da resolução de anáforas mostrou-se benéfica para a precisão do sistema de categorização não supervisionada, conforme evidenciado pelos resultados das experimentações realizadas.
  19. Luana Vieira Morellato, Metodologia computacional para identificação de sintagmas nominais da língua portuguesa . Dissertação de Mestrado em Informática - UFES, 2010 Orientador(es): Sergio Freitas . Tags: Processamento de Linguagem Natural, Inteligência Artificial .
    Sintagmas, unidades de sentido com funções sintáticas dentro de uma frase, são essenciais para a estruturação do conteúdo expresso nas sentenças, conforme destacado por Nicola (2008). As frases articulam seu conteúdo por meio dos elementos e das combinações que a linguagem disponibiliza, formando assim conjuntos e subconjuntos atuando como unidades sintáticas - os sintagmas, categorizados em nominais e verbais, com os nominais destacando-se pelo seu maior valor semântico. Eles são fundamentais em tarefas de Processamento de Linguagem Natural (PLN), como resolução de anáforas, construção de ontologias automáticas, análises em textos médicos para geração de resumos e vocabulário, ou como etapa preliminar em análises sintáticas. Em Recuperação de Informação (RI), os sintagmas aprimoram a criação de termos em sistemas de indexação e buscas, elevando a eficácia dos resultados. Esta dissertação introduz uma metodologia computacional para identificar sintagmas nominais em documentos digitais em português. Detalha-se a abordagem para identificar e extrair sintagmas nominais através do desenvolvimento do SISNOP - Sistema Identificador de Sintagmas Nominais em Português. O SISNOP, um sistema integrado por módulos e programas, analisa textos em linguagem natural, realizando análises morfológicas e sintáticas para recuperar sintagmas nominais, fornecendo também informações sintáticas, como gênero, número e grau das palavras nos sintagmas. Testado em corpora como CETENFolha e CETEMPúblico, o SISNOP alcançou reconhecimento de 98,12% e 94,59% das frases, identificando mais de 24 milhões de sintagmas. Seus módulos—Etiquetador Morfológico, Identificador de Sintagmas Nominais e Identificador de Gênero, Número e Grau—foram avaliados individualmente com um conjunto de dados menor devido à análise manual dos resultados, atingindo precisão de 82,45% e abrangência de 69,20%.
  20. Pereira, F. S. C.,Seibel, Hilário,FREITAS, S. A. A., An Anaphora Based Information Retrieval model Extension , in 2009 World Congress on Computer Science and Information Engineering, 2009, Los Angeles , pp. 330-334, 2009 . DOI: 10.1109/CSIE.2009.833 . Tags: Processamento de Linguagem Natural, Inteligência Artificial .
  21. Pereira, F. S. C.,MORELLATO, L.,FREITAS, S. A. A., Evaluation of an information retrieval model based in anaphora resolution , in IADIS International Conference on WWW/Internet, 2009, Roma , pp. 334-339, 2009 . Tags: Processamento de Linguagem Natural, Inteligência Artificial .
  22. Francisco Santiago do Carmo Pereira, A methodology for the use of natural language processing in the search for information in digital documents . Dissertação de Mestrado em Informática - UFES, 2009 Orientador(es): Sergio Freitas . Tags: Processamento de Linguagem Natural, Inteligência Artificial, Aprendizado de Máquina .
    Esta dissertação apresenta uma nova metodologia para busca em textos digitais, fundamentada na Estrutura Nominal do Discurso (END), que aprimora a resolução de anáforas conforme proposto por Freitas. Diferentemente dos modelos tradicionais de Recuperação de Informação (RI), como o vetoriano e o LSI, que se baseiam em termos para representar e buscar documentos, esta abordagem considera a estrutura textual e o uso de anáforas, superando limitações dos modelos clássicos ao lidar com referências variadas ou omissões de entidades principais. A metodologia, inspirada no trabalho de Seibel Júnior, utiliza a END para criar a Estrutura Nominal do Discurso para Buscas (ENDB), focando em elementos centrais das frases para a representação de textos. Este processo não só permite uma representação textual mais fiel mas também melhora os resultados das buscas ao incluir todas as entidades textuais identificadas. O documento detalha a implementação da metodologia e os resultados experimentais, oferecendo uma contribuição significativa para a área de RI.
  23. Seibel, Hilário,FREITAS, S. A. A., Methodology for retrieval of relevant information in digital documents based on anaphora resolution , in XXXIII Latin American Conference on Informatics CLEI 2007, 2007, San José - Costa Rica , 2007 . Tags: Processamento de Linguagem Natural, Inteligência Artificial .
  24. Hilário Seibel Júnior, Recuperação de informações relevantes em documentos digitais baseada na resolução de anáforas . Dissertação de Mestrado em Informática - UFES, 2007 Orientador(es): Sergio Freitas . Tags: Processamento de Linguagem Natural, Inteligência Artificial .
    Os métodos de recuperação de informação (RI) tradicionais se baseiam essencialmente na contagem da freqüência em que as palavras aparecem em um documento; sem apresentar soluções para que o conteúdo semântico do discurso seja interpretado [Van Rijsbergen 1979; Baeza-Yates e Ribeiro-Neto 1999]. Por não interpretarem o documento analisado; tais métodos podem deixar de considerar informações importantes a seu respeito. Uma solução para contornar esse problema; citada em [Salton e McGill 1986]; é utilizar o Processamento de Linguagem Natural (PLN) na recuperação de informação. Uma aplicação do PLN é o processamento de anáforas. Anáfora [Carter 1987; Beaver 2004] é um fenômeno lingüístico no qual uma entidade introduzida a priori é referenciada posteriormente em outra frase através de alguma expressão lingüística; tal como em "Valentina nasceu em São Paulo. A menina é do signo de Peixes.". A resolução das anáforas identifica que o termo menina presente na segunda frase do texto referencia a entidade introduzida no discurso pelo termo Valentina da primeira frase. Isso permite afirmar que Valentina é mais relevante em relação ao texto do que se tal referência não ocorresse. Freitas propõe em [Freitas 2005] um método para resolver as anáforas de um documento através da criação de uma estrutura que permite acompanhar as entidades que se mantêm em evidência ao longo do discurso. Essa estrutura armazena informações que podem ser aproveitadas por um método de recuperação de informação. Esta dissertação propõe uma metodologia computacional para recuperar informações relevantes a partir da resolução das anáforas de um documento; visando aumentar a qualidade dos resultados de uma query. A resolução de anáforas permite identificar exatamente a quantidade de vezes que cada entidade é referenciada em um discurso; expondo entidades e ligações que podiam estar obscuras no discurso original. Essa informação torna possível decidir se certa entidade é mais relevante que outra no documento; dando mais enfoque ao que o autor escreveu. Dessa forma; os documentos relevantes recuperados são classificados pela quantidade de informação que apresentam a respeito dos termos buscados; e não apenas pela localização e/ou quantidade de ocorrências de tais termos. Este trabalho também permite identificar; através da estrutura gerada pelo processamento de anáforas; os termos sinônimos (aqueles que referenciam uma mesma entidade). Se o documento indica que dois termos são sinônimos; a busca por um deles retorna o mesmo resultado que a busca pelo outro; aumentando ainda mais a qualidade dos resultados de uma query. Este trabalho apresenta os detalhes da metodologia proposta - as medidas utilizadas para calcular a relevância de um termo em relação ao documento interpretado pelo processamento de anáforas; os procedimentos necessários para a realização de uma query; o protótipo implementado e a análise de sua complexidade de tempo. Além disso; são avaliadas as características desta abordagem que a diferenciam dos métodos tradicionais em relação à qualidade dos resultados obtidos.
  25. Barbosa, H. A.,FREITAS, S. A. A., Sistemas de Detecção de Invasão em Redes de Automação Industrial , in 6th International Congress on Automation, Systems and Instrumentation, 2006, São Paulo , 2006 . Tags: Inteligência Artificial .
  26. Sergio Antônio Andrade de Freitas, Interpretação automatizada de textos - processamento de anáforas . Tese de Doutorado, Universidade Federal do Espirito Santo, 2005 . Tags: Processamento de Linguagem Natural, Inteligência Artificial .
    Esta tese apresenta uma solução para a interpretação de anáforas nominais definidas.Considere o seguinte texto- (1) a. Mariana comprou um carro novo. b. O motor veio danificado. A frase (1a) apresenta duas entidades- Mariana e um carro novo. Já a frase (1.2b) tem apenas uma entidade o motor. No processo de interpretação, humano ou computacional, a utilização do artigo de nido o é um indicativo de que a entidade já havia sido introduzida no discurso, i.e. apresenta um caráter anafórico. Resolver uma anáfora é, a priori, identicar a quem ou a que se refere esta anáfora. Mas no caso acima é mais do que isto sem dúvida o motor existe no texto por causa da existência de um carro, porém a interpretação do motor deve ir além disto e identi car como este motor está ligado com aquele carro. Isto é uma anáfora nominal de nida. A interpretação das anáforas nominais de nidas ou de qualquer fenômeno anafórico pode ser generalizada como um processo que atribui valores aos itens da seguinte equação- R(A, T ) (2) onde- A denota a entidade introduzida pela interpretação fora de contexto de um pronome, de uma elipse ou de um sintagma nominal de nido, T denota o seu antecedente e R é a relação existente entre A e T . O processo de resolução da equação, que é propriamente o processo de resolução de anáforas, consiste em descobrir T e R dado A. Nesta tese é proposta uma metodologia computacional que interpreta as anáforas nominais de nidas cuja relação R é uma dentre - parte de, membro de, subcategorizado por e coreferência. A obtenção das relações é feita por um conjunto de regras pragmáticas [Freitas, Lopes e Menezes 2004, Filho e Freitas 2003] (cap. 3). Caso seja constatado que A não seja anafórica então ela é acomodada no contexto. A metodologia computacional é construída sobre um ambiente de programação em lógica [Damásio, Nejdl e Pereira 1994] que permite raciocinar abdutivamente [Kakas, Kowalski e Toni 1992] sobre a representação semântica do texto [Kamp e Reyle 1993]. A partir da interpretação das entidades é construída a estrutura nominal do discurso [Lopes e Freitas 1994] (cap. 4), a qual permite - (1) fazer o acompanhamento das entidades mais salientes em cada frase [Freitas e Lopes 1994], (2) limitar o universo de escolha de possíveis antecedentes[Freitas e Lopes 1996] e (3) prover um resumo das entidades do discurso. O resultado é uma metodologia que permite, de forma integrada, resolver anáforas e elipses, sendo que a estrutura nominal do discurso pode ser usada na busca de informações.
  27. Ayrton Monteiro Cristo Filho, Interpretação computacional do futuro do pretérito simples em narrativas para o Português do Brasil . Dissertação de Mestrado em Informática - UFES, 2004 Orientador(es): Berilhes Borges Garcia, Sergio Freitas . Tags: Processamento de Linguagem Natural, Inteligência Artificial .
  28. Cristo Filho, A. M.,FREITAS, S. A. A., Interpretação do Futuro do Pretérito em Narrativas , in 1º Workshop em Tecnologia da Informação e da Linguagem Humana, 2003, São Carlos - SP , 2003 . Tags: Inteligência Artificial, Processamento de Linguagem Natural .
  29. Sergio Antônio Andrade de Freitas, Deíticos e anáforas pronominais em diálogos . Dissertação de Mestrado em Informática - UFRGS, 1993 . Tags: Processamento de Linguagem Natural, Inteligência Artificial .
    A proposta deste trabalho é implementar um conjunto de elementos do diálogo a decorrer entre dois agentes humanos. As anáforas pronominais e certos pronomes déiticos (eu, você, sua, seu, meu, minha), que eventualmente surgirem durante o diálogo, são resolvidas. Basicamente, este trabalho está dividido em quatro partes - 1. Estudo introdutório da Discourse Representation Theory (DRT) [KAM88, KAM90]. A DRT é um formalismo para a representação do discurso que utiliza modelos na avaliação semântica.
  30. Luis Bruno Fidelis Gomes, Business Intelligence aplicada à saúde: painéis de monitoramento para profissionais de saúde da Rede de Atenção Psicossocial . Bacharelado em Engenharia de Software - UnB, 2023 Orientador(es): George Marsicano . Tags: Inteligência Artificial .

Aplicativos e programas

Contato e colaboração

E-mail para informações e contato com a equipe: sergiofreitas@unb.br.

← Metodologias de aprendizagem ativa Gamificação →