Building a DDC Annotated Corpus from OAI Metadata
DOI:
https://doi.org/10.2390/biecoll-OR2010-79Keywords:
OR2010, Posters Sessions, Dewey Decimal Classification, OAI metadata, corpus construction, Library and information sciences, DDC: 020Abstract
A frequently overlooked benefit of open access publications is that they are an easy accessible and cost-effective data source for research disciplines like text mining, natural language processing or computational linguistics. In those fields, linguistic data is usually managed in the form of corpora, i.e. machine readable bodies of texts that represent a particular variety of language.Published
2010-12-31
Issue
Section
OR 2010, Posters Sessions
License
Für Dokumente, die in elektronischer Form über Datennetze angeboten werden, gilt uneingeschränkt das Urheberrechtsgesetz (UrhG). Insbesondere gilt:
Einzelne Vervielfältigungen, z.B. Kopien und Ausdrucke, dürfen nur zum privaten und sonstigen eigenen Gebrauch angefertigt werden (§ 53 Urheberrecht). Die Herstellung und Verbreitung von weiteren Reproduktionen ist nur mit ausdrücklicher Genehmigung des Urhebers gestattet.
Der Benutzer ist für die Einhaltung der Rechtsvorschriften selbst verantwortlich und kann bei Missbrauch haftbar gemacht werden.