Text chunking: um método de shallow parsing para identificação de sintagmas nominais lexicais de textos em português do Brasil segundo o formalismo Universal Dependencies (2023)
- Authors:
- Autor USP: SOUZA, ALEKSANDER TOMAZ DE - FFCLRP
- Unidade: FFCLRP
- Sigla do Departamento: 595
- DOI: 10.11606/D.59.2023.tde-27072023-075811
- Subjects: ANÁLISE SINTÁTICA; RECUPERAÇÃO DA INFORMAÇÃO; PROCESSAMENTO DE LINGUAGEM NATURAL; APRENDIZADO COMPUTACIONAL
- Keywords: Análise sintática parcial; Lexical noun phrase; Shallow parsing; Sintagmas nominais lexicais; Universal Dependencies
- Agências de fomento:
- Language: Português
- Abstract: A análise sintática superficial, também conhecida pelo termo inglês 'shallow parsing', é um método computacional que identifica partes constituintes de uma frase (e.g.: verbos, substantivos e adjetivos) e as relaciona com estruturas gramaticais hierarquicamente superiores, os sintagmas (e.g.: nominais, verbais, preposicionais, entre outros). Este projeto aborda a identificação de um tipo específico de sintagma nominal definido como sintagma nominal lexical (SNL), em textos escritos em português do Brasil, e anotados segundo o formalismo Universal Dependencies (UD). Os SNL, devido a sua natureza discriminatória, assumem tipicamente funções temáticas ou semânticas e compõem um conjunto reservado de segmentos que chamamos de descritores textuais. Os SNL são utilizados em várias tarefas de processamento de língua natural, tais como: extração e recuperação de informações, reconhecimento de entidades nomeadas, categorização de textos, análise de sentimentos, extração de fatos, extração de relacionamentos e sumarização de textos. Diferentemente da gramática de estruturas frasais, ou seja, a gramática de constituintes, a UD estabelece uma sintaxe de dependência entre palavras que pretende representar qualquer língua humana. A UD fundamenta-se na identificação, descrição, atribuição das relações de dependência existentes nos elementos de uma sentença, ou seja, seus termos e palavras. Neste projeto, recorremos a extração de SNL sobre frases anotadas em UD de forma abstrata e inferencial utilizando algoritmos de Aprendizado de Máquina
- Imprenta:
- Publisher place: Ribeirão Preto
- Date published: 2023
- Data da defesa: 02.06.2023
- Este periódico é de acesso aberto
- Este artigo é de acesso aberto
- URL de acesso aberto
- Cor do Acesso Aberto: gold
- Licença: cc-by-nc-sa
-
ABNT
SOUZA, Aleksander Tomaz de. Text chunking: um método de shallow parsing para identificação de sintagmas nominais lexicais de textos em português do Brasil segundo o formalismo Universal Dependencies. 2023. Dissertação (Mestrado) – Universidade de São Paulo, Ribeirão Preto, 2023. Disponível em: https://www.teses.usp.br/teses/disponiveis/59/59143/tde-27072023-075811/. Acesso em: 23 maio 2024. -
APA
Souza, A. T. de. (2023). Text chunking: um método de shallow parsing para identificação de sintagmas nominais lexicais de textos em português do Brasil segundo o formalismo Universal Dependencies (Dissertação (Mestrado). Universidade de São Paulo, Ribeirão Preto. Recuperado de https://www.teses.usp.br/teses/disponiveis/59/59143/tde-27072023-075811/ -
NLM
Souza AT de. Text chunking: um método de shallow parsing para identificação de sintagmas nominais lexicais de textos em português do Brasil segundo o formalismo Universal Dependencies [Internet]. 2023 ;[citado 2024 maio 23 ] Available from: https://www.teses.usp.br/teses/disponiveis/59/59143/tde-27072023-075811/ -
Vancouver
Souza AT de. Text chunking: um método de shallow parsing para identificação de sintagmas nominais lexicais de textos em português do Brasil segundo o formalismo Universal Dependencies [Internet]. 2023 ;[citado 2024 maio 23 ] Available from: https://www.teses.usp.br/teses/disponiveis/59/59143/tde-27072023-075811/
Informações sobre o DOI: 10.11606/D.59.2023.tde-27072023-075811 (Fonte: oaDOI API)
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas