Social tagging and blog-scraping as an alternative for updating controlled vocabularies: Practical application to a library and information science thesaurus;
Etiquetado social y blog-scraping como alternativa para la actualización de vocabularios controlados: aplicación práctica a un tesauro de Biblioteconomía y Documentación

Creators:Mochon Bezares, Gonzalo; Universidad Carlos III de Madrid, Rodríguez, Eva Méndez; Universidad Carlos III de Madrid, Rojo, Ángela Sorli; Consejo Superior de Investigación Científicas

Available Downloads

See details

Archivo Size
/journals/3/articles/11963/public/11963-59074-1-PB.pdf
313.48 kB
Descripción

The aim of this paper is to compare the use of free language tags, taken in our case from specialized blogs on information sciences, against the unstructured controlled language of keywords lists, for verifying which of them is the best source of new terminology for the Librarianship Thesaurus and Documentation. To do this, authors’ labels were extracted from 127 blogs on librarianship and information science using web scraping techniques, and were compared with descriptors and identifiers lists of the ISOC library and documentation database (ISOC-BD). The results of the analysis of authors’ tags in blogs contribute with 186 new terms, while the database lists only 130 terms. It is concluded that free language tags could be a better and faster way for contributing new terminology to controlled vocabularies than unstructured controlled language lists.

El objetivo de este artículo es comparar las etiquetas en lenguaje libre, tomadas en nuestro caso de blogs especializados en ciencias de la información (information sciences), frente al lenguaje controlado no estructurado de las listas de palabras clave, con el fin de comprobar cuál de estos dos es una mejor fuente de nueva terminología para el Tesauro de Biblioteconomía y Documentación. Para ello, se extrajeron las etiquetas de autor de 127 blogs sobre biblioteconomía y documentación mediante técnicas de web scraping, y se compararon con los listados de descriptores e identificadores de la base de datos ISOC Biblioteconomía y Documentación (ISOC-BD). El análisis de las etiquetas de autor de blogs ha aportado 186 nuevos términos, mientras que los listados de la base de datos han proporcionado 130términos. Se concluye que las etiquetas en lenguaje libre pueden ser una mejor y más rápida vía de aporte de nueva terminología a los vocabularios controlados que los listados de lenguaje controlado no estructurado.

Metadatos destacados

Colecciones
Información, cultura y sociedad

Editor

Instituto de Investigaciones Bibliotecológicas (FFyL-UBA)

Fuente

Información, cultura y sociedad; No 37; 13-26, Información, cultura y sociedad; No 37; 13-26, Información, cultura y sociedad; No 37; 13-26

Citación

Mochon Bezares, Gonzalo; Universidad Carlos III de Madrid, Rodríguez, Eva Méndez; Universidad Carlos III de Madrid, y Rojo, Ángela Sorli; Consejo Superior de Investigación Científicas, “Social tagging and blog-scraping as an alternative for updating controlled vocabularies: Practical application to a library and information science thesaurus,” Archivo PPCT, consulta 1 de abril de 2026, http://archivoppct.caicyt.gov.ar/items/show/6446.

Dublin Core

Autor

Mochon Bezares, Gonzalo; Universidad Carlos III de Madrid
Rodríguez, Eva Méndez; Universidad Carlos III de Madrid
Rojo, Ángela Sorli; Consejo Superior de Investigación Científicas

Fuente

Información, cultura y sociedad; No 37; 13-26
Información, cultura y sociedad; No 37; 13-26
Información, cultura y sociedad; No 37; 13-26

Editor

Instituto de Investigaciones Bibliotecológicas (FFyL-UBA)

Fecha

2017-12-05

Derechos

Los autores/as conservan los derechos de autor y ceden a la revista el derecho de la primera publicación, con el trabajo registrado con la Licencia Creative Commons Atribución-NoComercial-SinDerivadas 3.0 Unported, que permite a terceros utilizar lo publicado siempre que mencionen la autoría del trabajo y a la primera publicación en esta revista.Los autores/as pueden realizar otros acuerdos contractuales independientes y adicionales para la distribución no exclusiva de la versión del artículo publicado en esta revista (p. ej., incluirlo en un repositorio institucional o publicarlo en un libro) siempre que indiquen claramente que el trabajo se publicó por primera vez en esta revista.Se permite y recomienda a los autores/as a publicar su trabajo en Internet (por ejemplo en páginas institucionales o personales).
Authors publishing in this journal acknowledge the conditions below: Authors retain the copyright of their work while they transfer the right of the first publishing to the journal, under the Creative Commons Attribution-Noncommercial-No Derivative Works 3.0 Unported Licence, which allows third parties to reproduce them under the condition that express mention is given to the author and to its original publication in the journal. Authors may enter into other contractual and independent arrangements for the non-exclusive distribution of the version of the article published in this journal (for instance, it can be published in an institutional repository or in a book). In any case, an express mention should be given to its first publication in the journal. It is permitted and encouraged to publish online the articles (for example, on institutional or personal pages).

Idioma

spa

Tipo

info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion