Repository logo
 
Publication

Avaliação de recursos computacionais para o português

dc.contributor.authorGoncalves, Matilde
dc.contributor.authorCoheur, Luisa
dc.contributor.authorBaptista, Jorge
dc.contributor.authorMineiro, Ana
dc.date.accessioned2021-03-16T12:24:58Z
dc.date.available2021-03-16T12:24:58Z
dc.date.issued2021
dc.description.abstractThere are several tools for the Portuguese language. However, and due to different choices at the basis of these tools' behaviour (different preprocessing, different labels, etc.), it becomes difficult to have an idea of each one's comparative performance. In this work, we propose an evaluation of tools, publicly available and free, that perform the tasks of Part-of-Speech Tagging and Named Entity Recognition, for the Portuguese language. We evaluate twelve different models for the first task and eight for the second. All the resources used in this evaluation (mapping tables between labels, testing corpora, etc.) will be made available, allowing to replicate/fine-tune the results here presented. We also present a qualitative analysis of two dependency parsers. To the best of our knowledge, no recent work that considers the recent available tools, was carried out for the Portuguese language.pt_PT
dc.description.abstractTêm sido desenvolvidas várias ferramentas para o processamento da língua portuguesa. No entanto, devido a escolhas variadas na base dos comportamentos destas ferramentas (diferentes opções de pré-processamento, diferentes conjuntos de etiquetas morfossintáticas e de dependências, etc.), torna-se difícil ter uma ideia do desempenho comparativo de cada uma. Neste trabalho, avaliamos um conjunto de ferramentas gratuitas e publicamente disponíveis, que realizam as tarefas de Etiquetação Morfossintática e de Reconhecimento de Entidades Mencionadas, para a língua portuguesa. São tidos em conta doze modelos diferentes para a primeira tarefa e oito para a segunda. Todos os recursos usados nesta avaliação (tabelas de mapeamento de etiquetas, corpora de referência, etc.) são disponibilizados, permitindo replicar/afinar os resultados. Apresentamos ainda um estudo qualitativo de dois analisadores de dependências. Não temos conhecimento de nenhum trabalho similar recente, isto é, que tenha em conta as ferramentas atuais disponíveis, realizado para a língua portuguesa.
dc.description.versioninfo:eu-repo/semantics/publishedVersionpt_PT
dc.identifier.doi10.21814/LM.12.2.331pt_PT
dc.identifier.eid85100084313
dc.identifier.issn1647-0818
dc.identifier.urihttp://hdl.handle.net/10400.14/32215
dc.identifier.wos000605072700004
dc.language.isoporpt_PT
dc.peerreviewedyespt_PT
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/pt_PT
dc.subjectDependency parsingpt_PT
dc.subjectEvaluation of resourcespt_PT
dc.subjectNamed entity recognitionpt_PT
dc.subjectNatural language processingpt_PT
dc.subjectPart-of-speech taggingpt_PT
dc.subjectPortuguese languagept_PT
dc.subjectProcessamento da linguagem natural
dc.subjectAvaliação de recursos
dc.subjectLíngua portuguesa
dc.subjectAnálise morfosintática
dc.subjectReconhecimento de entidades mencionadas
dc.subjectAnálise de dependências
dc.titleAvaliação de recursos computacionais para o portuguêspt_PT
dc.title.alternativeEvaluating computational resources for Portuguesept_PT
dc.typejournal article
dspace.entity.typePublication
oaire.citation.endPage68pt_PT
oaire.citation.issue2pt_PT
oaire.citation.startPage51pt_PT
oaire.citation.titleLinguamaticapt_PT
oaire.citation.volume12pt_PT
person.familyNameCoheur
person.familyNameBaptista
person.familyNameMineiro
person.givenNameLuisa
person.givenNameJorge
person.givenNameAna
person.identifier494880
person.identifier.ciencia-idE019-3D83-3793
person.identifier.ciencia-id7010-5366-22C5
person.identifier.ciencia-id771D-DE7D-1402
person.identifier.orcid0000-0002-2456-5028
person.identifier.orcid0000-0003-4603-4364
person.identifier.orcid0000-0003-0508-7785
person.identifier.ridA-7554-2012
person.identifier.ridH-7699-2013
person.identifier.scopus-author-id8075360000
person.identifier.scopus-author-id14035269500
person.identifier.scopus-author-id6507361249
rcaap.rightsopenAccesspt_PT
rcaap.typearticlept_PT
relation.isAuthorOfPublication7daccaf0-5595-4846-83d5-8db42ae5d706
relation.isAuthorOfPublicationcc62cd76-6f96-42e9-b531-dcd01b5361e6
relation.isAuthorOfPublication20f144ec-8556-462b-8091-cce4900a9163
relation.isAuthorOfPublication.latestForDiscovery20f144ec-8556-462b-8091-cce4900a9163

Files

Original bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
28058706.pdf
Size:
661.67 KB
Format:
Adobe Portable Document Format