Classificação da utilidade de opiniões em português brasileiro (2023)
- Authors:
- Autor USP: SOUSA, ROGÉRIO FIGUEREDO DE - ICMC
- Unidade: ICMC
- Sigla do Departamento: SCC
- DOI: 10.11606/T.55.2023.tde-29082023-162952
- Subjects: PROCESSAMENTO DE LINGUAGEM NATURAL; LÍNGUA PORTUGUESA; BENCHMARKS; LINGUÍSTICA COMPUTACIONAL
- Keywords: Mineração de opiniões; Natural language processing; Opinion helpfulness; Opinion mining; Utilidade de opiniões
- Agências de fomento:
- Language: Português
- Abstract: A quantidade de dados gerados pelos usuários na Web está aumentando. Entre esses conteúdos, as opiniões são consideradas um caso especial. Esse tipo de texto geralmente inclui coloquialismos, ruídos, erros, gírias, abreviações, etc. Portanto, eles são difíceis de serem processados por máquinas e podem ser difíceis de serem lidos até por seres humanos, em alguns casos. Particularmente, para um consumidor que procura conteúdo útil e de qualidade para ajudar nas suas decisões, como escolher um produto para comprar ou um filme para assistir, esta tarefa está se tornando cada vez mais complicada, devido aos problemas mencionados anteriormente e a grande oferta de opiniões na Web. Nesse contexto, surgiu a tarefa de Modelagem e Predição da Utilidade de Opiniões, cujo principal objetivo é estudar, modelar e processar opiniões geradas por usuários, a fim de selecionar automaticamente as mais úteis e destacá-las para ajudar outros usuários. Prever a utilidade das opiniões não é uma tarefa simples. Muita informação é necessária para caracterizar a utilidade das opiniões e, além disso, a utilidade é considerada um critério subjetivo, dependente de fatores extra-textuais, como a necessidade de informações do próprio leitor e o tempo disponível para leitura e avaliação de opiniões suficientes. Muitos trabalhos foram realizados desde a origem da área, mas, para a língua portuguesa, poucos avanços foram realizados até o momento. Este trabalho de doutorado teve como objetivo investigar epropor métodos para a tarefa de classificação automática da utilidade de opiniões para a língua portuguesa, utilizando informações linguísticas e de metadados disponíveis. Para atingir esse objetivo, um córpus de dois domínios, aplicativos para smartphones e filmes, foi coletado e anotado. Avaliou-se qualitativamente e quantitativamente uma ampla gama de atributos e técnicas que pudessem caracterizar a utilidade das opiniões e, dessa forma, foram descobertos fatores relevantes para a discriminação das opiniões úteis das não úteis. Nesta tese de doutorado, foram discutidos os principais desafios da área de pesquisa, e foi estabelecido um benchmark para a tarefa na língua portuguesa. Além disso, desenvolveu-se um novo método baseado em grafos que pode ser usado como alternativa para classificação da utilidade de opiniões. Por fim, elaboramos um método que pode classificar com excelente acurácia as opiniões de aplicativos e com boa acurácia as opiniões de filmes.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2023
- Data da defesa: 24.04.2023
- Este periódico é de acesso aberto
- Este artigo é de acesso aberto
- URL de acesso aberto
- Cor do Acesso Aberto: gold
- Licença: cc-by-nc-sa
-
ABNT
SOUSA, Rogério Figueredo de. Classificação da utilidade de opiniões em português brasileiro. 2023. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2023. Disponível em: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-29082023-162952/. Acesso em: 23 maio 2024. -
APA
Sousa, R. F. de. (2023). Classificação da utilidade de opiniões em português brasileiro (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/55/55134/tde-29082023-162952/ -
NLM
Sousa RF de. Classificação da utilidade de opiniões em português brasileiro [Internet]. 2023 ;[citado 2024 maio 23 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-29082023-162952/ -
Vancouver
Sousa RF de. Classificação da utilidade de opiniões em português brasileiro [Internet]. 2023 ;[citado 2024 maio 23 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-29082023-162952/ - The challenges of modeling and predicting online review helpfulness
- Evaluating content features and classification methods for helpfulness prediction of online reviews: establishing a benchmark for portuguese
- Um método baseado em grafos para predição da utilidade de opiniões sobre produtos
- A graph-based method for predicting the helpfulness of apps opinions
- A bunch of helpfulness and sentiment corpora in brazilian portuguese
- Modeling the paraphrase detection task over a heterogeneous graph network with data augmentation
- Natural language inference for portuguese using BERT and multilingual information
Informações sobre o DOI: 10.11606/T.55.2023.tde-29082023-162952 (Fonte: oaDOI API)
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas