Show simple item record

dc.contributor.authorCosta, Hernani
dc.contributor.authorMuñoz, Isabel Dúran
dc.contributor.authorPastor, Gloria Corpas
dc.contributor.authorMitkov, Ruslan
dc.date.accessioned2019-07-12T14:45:55Z
dc.date.available2019-07-12T14:45:55Z
dc.date.issued2016-07-22
dc.identifier.citationCosta, H., Dúran Muñoz, I., Corpas Pastor, G., & Mitkov, R. (2016) Compilação de Corpos Comparáveis Especializados: Devemos sempre confiar nas Ferramentas de Compilação Semi-automáticas?. Linguamática, 8(1), 3-19.en
dc.identifier.issn1647-0818en
dc.identifier.urihttp://hdl.handle.net/2436/622554
dc.description.abstractDecisões tomadas anteriormente à compilação de um corpo comparável têm um grande impacto na forma em que este será posteriormente construído e analisado. Diversas variáveis e critérios externos são normalmente seguidos na construção de um corpo, mas pouco se tem investigado sobre a sua distribuição de similaridade textual interna ou nas suas vantagens qualitativas para a investigação. Numa tentativa de preencher esta lacuna, este artigo tem como objetivo apresentar uma metodologia simples, contudo eficiente, capaz de medir o grau de similaridade interno de um corpo. Para isso, a metodologia proposta usa diversas técnicas de processamento de linguagem natural e vários métodos estatísticos, numa tentativa bem sucedida de avaliar o grau de similaridade entre documentos. Os nossos resultados demonstram que a utilização de uma lista de entidades comuns e um conjunto de medidas de similaridade distribucional são suficientes, não só para descrever e avaliar o grau de similaridade entre os documentos num corpo comparável, mas também para os classificar de acordo com seu grau de semelhança e, consequentemente, melhorar a qualidade do corpos através da eliminação de documentos irrelevantes.en
dc.formatapplication/PDFen
dc.language.isootheren
dc.publisherUniversidade de Vigo & Universidade do Minhoen
dc.relation.urlhttps://linguamatica.com/index.php/linguamatica/article/view/v8n1-1en
dc.subjectcomparable corporaen
dc.subjectcomputational linguisticsen
dc.subjectdistributional similarity measuresen
dc.subjectmanual and semi-automatic compilationen
dc.titleCompilação de Corpos Comparáveis Especializados: Devemos sempre confiar nas Ferramentas de Compilação Semi-automáticas?en
dc.title.alternativeCompiling Specialised Comparable Corpora. Should we always trust (Semi-)automatic Compilation Tools?en
dc.typeJournal articleen
dc.identifier.journalLinguamáticaen
dc.date.updated2019-06-27T11:47:39Z
dc.date.accepted2016-04-01
rioxxterms.funderUniversity of Wolverhamptonen
rioxxterms.identifier.projectUOW120719GCPen
rioxxterms.versionVoRen
rioxxterms.licenseref.urihttps://creativecommons.org/licenses/by/4.0/en
rioxxterms.licenseref.startdate2019-07-12en
dc.source.volume8
dc.source.beginpage3
dc.source.endpage19
refterms.dateFCD2019-07-12T14:45:44Z
refterms.versionFCDVoR
refterms.dateFOA2019-07-12T14:45:56Z


Files in this item

Thumbnail
Name:
linguamatica_compilaçao.pdf
Size:
1.023Mb
Format:
PDF

This item appears in the following Collection(s)

Show simple item record