Palabra Clave (La Plata), octubre 2022 - marzo 2023, vol. 12, núm. 1, e174. ISSN 1853-9912
Universidad Nacional de La Plata
Facultad de Humanidades y Ciencias de la Educación
Departamento de Bibliotecología

Desarrollo e innovaciones

Diseño de tesauros como estrategia didáctica para fortalecer su comprensión

Grisel Tenaglia

Instituto Superior de Formación Docente y Técnica N° 212, Argentina
Cita sugerida: Tenaglia, G. (2022). Diseño de tesauros como estrategia didáctica para fortalecer su comprensión. Palabra Clave (La Plata), 12(1), e174. https://doi.org/10.24215/18539912e174

Resumen: Dentro de las bibliotecas y demás unidades de información, la organización del conocimiento (OC) es un eje central de los procesos. Para llevar a cabo una eficiente OC, se utilizan diversos sistemas de organización del conocimiento (SOC), entre ellas los tesauros. Diversas normativas internacionales reglan el diseño y la construcción de los tesauros. En el presente artículo se analiza el diseño y desarrollo de tesauros por parte de estudiantes de bibliotecología de un instituto superior de educación, tomando como referencia las pautas publicadas en la norma ISO 25.964. La actividad, diseñada para el fortalecimiento de la comprensión de su estructura y uso, se desarrolló en un período de seis semanas y en modalidad virtual y a distancia. Tras la realización de la actividad se analizaron aspectos cualitativos y cuantitativos del producto generado, a saber: temáticas de los tesauros desarrollados, uso de descriptores, no descriptores e identificadores, presencia de las relaciones equivalentes, jerárquicas y asociativas entre los términos y empleo de variantes tipográficas, abreviaturas, calificadores y notas de alcance. El desarrollo de esta actividad expuso una apropiación deficiente de los conceptos relacionados al vocabulario de entrada de un tesauro y de las relaciones de equivalencia. Se demostró la importancia del conocimiento temático del dominio de parte de quien realice esta tarea como un factor que asegura el eficaz desarrollo del trabajo. La actividad es altamente recomendada en las asignaturas que aborden las actividades de análisis.

Palabras clave: Organización del conocimiento, Sistemas de organización del conocimiento, Diseño de tesauros, Didáctica de la bibliotecología, Argentina.

Design of thesauri as a didactic strategy to strengthen comprehension

Abstract: Within libraries and other information units, Knowledge Organization (KO) is a central axis of the processes. In order to carry out an efficient KO, various Knowledge Organization Systems (KOS) are used, including thesauri. Several international standards regulate the design and construction of thesauri. This article analyzes the design and development of thesauri by students of librarianship from a higher education college, taking the guidelines published in ISO 25964 as a reference. After this activity was completed, qualitative and quantitative aspects of the product developed were analyzed, namely: the topics of the thesauri developed, the use of descriptors, non-descriptors and identifiers, the presence of equivalent, hierarchical and associative relationships between the terms and the use of typographical variants, abbreviations, qualifiers and scope notes. Designed to strengthen understanding of its structure and use, this activity was developed over a period of six weeks and in virtual and remote mode. The activity showed a deficient appropriation of the concepts related to the input vocabulary of a thesaurus and equivalence relations. The importance of domain topic knowledge on the part of those performing this task was demonstrated as a factor that ensures the effective development of the work. The activity is highly recommended in the subjects who deal with documentary analysis activities in librarianship courses of study.

Keywords: Knowledge organization, Knowledge organization systems, Thesauri design, Didactics of library science, Argentina.

1. Introducción

La organización del conocimiento (OC), si bien es un concepto ligado a la Bibliotecología desde la aparición de las primeras bibliotecas, tuvo su afianzamiento terminológico en la segunda década del siglo XX cuando fue acuñado por Henry Bliss y posteriormente por Jesse H. Shera en el año 1966 (Martínez Tamayo & Mendes, 2015).

Diversos autores han definido a la OC. Uno de ellos, Dahlberg (2006), expone que esta disciplina es la ciencia de estructurar y ordenar sistemáticamente las unidades de conocimiento (conceptos) de acuerdo con sus elementos de conocimiento inherentes (características). Indica que el objeto de la organización del conocimiento es aprehender conceptos con sus referentes en el mundo real o abstracto y organizarlos, agruparlos, ordenarlos y representarlos verbalmente para permitir una comprensión de las relaciones que existen entre ellos. Por su parte, el profesor Hjørland (2008) define a la OC en dos sentidos. En un sentido amplio, se corresponde con la organización social de producción y diseminación del conocimiento. En uno estricto, abarca las actividades desarrolladas en bibliotecas y demás centros y fuentes de información, tales como la descripción documental, la indización y la clasificación. Con respecto a este último aspecto de la OC, su campo de estudio se ocupará tanto de los procesos como de los sistemas utilizados para organizar los documentos, representaciones documentales, obras y conceptos (Hjørland, 2008). Según estas definiciones, si bien todo aspecto del conocimiento humano es susceptible a ser organizado, dentro de las bibliotecas y demás unidades de información, esta actividad es un eje central de los procesos.

Para llevar a cabo una eficiente OC, se utilizan diversas herramientas o sistemas de organización del conocimiento (SOC). Según Hodge (2000) estos mecanismos abarcan todos los tipos de esquemas para organizar la información y promover la gestión de conocimiento. Suárez Sánchez (2017) los define como instrumentos que facilitan el encuentro y la recuperación de recursos, actuando como mapas semánticos y posibilitando una orientación común para indizadores y futuros usuarios, ya sean humanos o máquinas. De estas definiciones se desprende que los SOC se utilizan en dos momentos claves: en la indización de los documentos y, posteriormente, en la recuperación de la información. Igualmente, son herramientas muy útiles para organizar el acervo documental.

Estos sistemas incluyen clasificaciones, encabezamientos de materias, tesauros, redes semánticas y ontologías. Cada uno de ellos varían en sus características principales, el tipo de estructuración y la información que pueden representar (Sánchez-Cuadrado, Colmenero-Ruiz & Moreiro, 2012). Sucintamente, los esquemas de clasificación organizan los materiales en un nivel general. Los encabezamientos de materia proporcionan un acceso más detallado. Los tesauros exponen vocabularios altamente estructurados, mientras que las redes semánticas y las ontologías se presentan como esquemas menos tradicionales. Sin embargo, debido a su característica inherente de organizar información, los SOC se encuentran presentes en el corazón de cada biblioteca, museo y archivo (Hodge, 2000).

Los tesauros pueden ser definidos como un SOC cuyos términos de indización se estructuran en un sistema de relaciones explícitas.

Maldonado Martínez (2010) conceptualiza los tesauros como una herramienta terminológica compuesta por un conjunto de términos relacionados entre sí sobre un tema o una temática determinada. Los tesauros se utilizan en bases de datos o sistemas de información automatizados para controlar el vocabulario y sugerir nuevos términos tanto en la indización de los documentos como en su recuperación.

Al profundizar esta descripción, y tras recolectar diferentes definiciones de diversos autores, Arano (2005) conceptualiza a los tesauros como un instrumento de control terminológico y un tipo de lenguaje documental. Presenta conceptos estructurados referidos a un determinado campo del conocimiento mediante explicitar las relaciones establecidas entre dichos conceptos y proporcionar un significado restringido de los términos que los representan. Resalta que la unidad fundamental de los tesauros son los conceptos, los cuales son representados por términos seleccionados. La cuidadosa selección de los términos, según este autor, neutraliza la sinonimia y la polisemia, que, si bien son características naturales de la lengua, al momento de la indización y la recuperación de la información, dificultan esta tarea. La autora añade que estas herramientas son construidas, por ende, diseñadas con un objetivo en particular, para auxiliar a los profesionales de la información y a los usuarios finales de los productos de información.

Martínez Tamayo & Mendes (2015) listan las características particulares que esta herramienta presenta, a saber: la cobertura de un dominio temático limitado, un vocabulario controlado o normalizado, relaciones de equivalencia, jerarquía y asociación entre los conceptos, un orden sistemático de conceptos y una sintaxis post-coordinada.

Con respecto a su dominio, el tesauro se limita a cierta especialidad o campo temático. Esto lo diferencia de otros SOC que procuran abarcar la universalidad del conocimiento, como es el caso de algunas clasificaciones (tales como la Clasificación Decimal Universal CDU, la Clasificación Decimal Dewey CDD, etc.). Esta característica radica en el origen de los tesauros, los cuales nacieron con el propósito de resolver problemas de recuperación en áreas específicas de la ciencia y la tecnología. Esta particularidad se mantiene vigente hasta la actualidad, recurriendo a actualizaciones periódicas de los tesauros ya elaborados o tesaurizando listas de epígrafes como medidas para suplir la existencia de un tesauro universal.

El tesauro consta de un vocabulario controlado formado por un conjunto de términos y nombres propios que designan conceptos. En las entradas de un tesauro la sinonimia y homonimia es inexistente, y esto se logra con mecanismos diseñados para aportar consistencia a la recuperación de la información. El elemento esencial del vocabulario de un tesauro (el que urge definir con exactitud) es el concepto; el nombre que lo designa puede variar mientras que el concepto se mantiene inalterable. El vocabulario de entrada de un tesauro se conforma por Descriptores, Identificadores (ambos términos autorizados) y No Descriptores (términos no autorizados que remiten a los autorizados). Usualmente se diferencian mediante una distinción tipográfica.

Los conceptos del tesauro se vinculan entre sí mediante relaciones de equivalencia, jerarquía y asociación. Estas relaciones son tan distintivas de este SOC que, si no están presentes de manera explícita y recíproca, no se considera un tesauro, sino otra herramienta de OC. La relación de equivalencia es la que se establece entre un término normalizado, que ha sido seleccionado para el tesauro (descriptor) y los sinónimos que han sido descartados (no descriptores), o bien entre una forma aceptada o normalizada de un nombre propio (identificador) y las variantes que este pudiera tener. La relación jerárquica se establece entre un concepto que representa el género o el todo (término genérico) y otro que representa una especie, una parte o un ejemplo del anterior (término específico). La relación asociativa es aquella que se establece mentalmente entre dos conceptos, ambos autorizados o descriptores, pero que no se corresponde a una relación de equivalencia ni a una relación jerárquica. Las relaciones entre los conceptos se denotan a partir de una serie de abreviaturas o signos convencionalmente aceptados, de acuerdo al idioma del tesauro.

Los tesauros exponen sus términos en una estructura particular. En general se reconocen tres tipos de presentación: alfabética, sistemática y gráfica. Marzal, Colmenero, Calzada & Cuevas (2006) explican que, mientras la presentación alfabética es obligatoria, suele ir acompañada de una o las dos formas complementarias. La presentación sistemática es similar al esquema de un sistema de clasificación, se caracteriza por dar una notación acompañando los términos, y puede exhibirse por disciplinas o campos temáticos, por facetas y por facetas bajo disciplinas o campos temáticos, de acuerdo a la norma ISO 25.964. La presentación gráfica muestra las relaciones jerárquicas existentes entre descriptores, usualmente en una estructura en forma de árbol.

El tesauro, a diferencia de otras herramientas pre-coordinadas, como algunas clasificaciones y las listas de epígrafes, es un SOC desarrollado especialmente para la indización post-coordinada.

Otros elementos presentes en los tesauros son los calificadores y las notas de alcance. Un calificador es una aclaración entre paréntesis, que permite distinguir un descriptor de sus homónimos o términos polisémicos. El calificador es parte de la entrada, no se separa ni se omite al momento de la indización. Las notas de alcance brindan información adicional sobre el término autorizado. A diferencia del calificador, la nota no es parte del descriptor, y puede utilizarse para definirlo, explicar su alcance, proporcionar una instrucción de uso, o proporcionar una nota o comentario de naturaleza histórica.

Puede darse el caso de que no exista un tesauro sobre el dominio que interesa y/o en la lengua que se lo necesita. En tal caso, se puede optar por realizar el diseño de un tesauro. Para ello existen diversas normas y manuales que regulan la gestión del proyecto.

Sánchez-Cuadrado, Colmenero-Ruiz & Moreiro (2012), recogen en su artículo las diferentes directrices para tesauros que se han publicado desde los años ochenta hasta el estándar ISO 25.964, reflexionando sobre las características más destacadas de esta evolución. De esta revisión se pondera la publicación del estándar ISO 25.964, presentado en dos partes por un grupo de trabajo conformado por miembros de 15 países. La primera parte se publicó en el año 2011, actualiza y reemplaza la ISO 2.788:1986 y la ISO 5.964:1985, las cuales se fusionaron y revisaron técnicamente para la edición de este documento. Dextre Clarke, quien preside el grupo de trabajo del estándar, informa que en esta norma se abordan normativas y guías para la construcción y contenido de tesauros mono y multi lenguajes, para el análisis facetado con tesauros, para la gestión del desarrollo y mantenimiento de los tesauros, entre otros aspectos (Dextre Clarke & Lei Zeng, 2012). La segunda parte de este estándar, publicada en el año 2013, aborda temas sobre la interoperabilidad de los tesauros.

Específicamente, la sección 13 de la norma ISO 25.964-1 se centra en la gestión de la construcción y mantenimiento del tesauro, y esta, a su vez, se divide en seis categorías. En la primera de ellas, se aborda la planificación de un tesauro. En esta primera etapa, es necesario establecer los objetivos para los que se utilizará esta herramienta. El principal propósito de todo tesauro es presentar los términos de una manera clara para que las personas encuentren los conceptos que necesitan. También se debe considerar para qué y por quién será usado, las restricciones del software existente con el que se utilizará, y el nivel de conocimiento del área temática de los usuarios del tesauro. También se deben determinar los formatos y modelos en los que estará disponible, ya sea formato impreso, electrónico, o ambos, y el modelo de presentación de los términos. En esta etapa se tendrán que prever los recursos humanos, esto es: los profesionales de la información con conocimientos en la materia, profesionales de tecnologías de la información y un responsable de la planificación que tenga una buena comprensión de cada uno de los lenguajes naturales implicados, del área temática del vocabulario y de las diferencias entre la traducción; los recursos financieros. Es decir, los gastos generales de comunicación, recursos y software requeridos; y los recursos de vocabulario, los cuales deben ser investigados antes y durante la construcción del tesauro como una guía para la selección de términos y para verificar el significado de los mismos y validar sus estructuras jerárquicas. Estos últimos pueden incluir colecciones de terminología, índices de bases de datos, registros de transacciones de cualquier sitio web relevante, diccionarios, nomenclaturas y enciclopedias. Otro recurso y herramienta importante a tener en cuenta es el software que se utilizará en la construcción de un tesauro.

En la segunda categoría se analizan las etapas iniciales de compilación, en donde se recopilan, organizan y analizan términos para representar adecuadamente los conceptos solicitados. En esta instancia se seleccionarán todos los términos disponibles, teniendo en cuenta la fuente de cada uno y la frecuencia de aparición. En el análisis de términos, la norma indica que estos deberán estar en orden sistemático, para que puedan ser estudiados correctamente y posteriormente introducidos en el tesauro.

En la tercera categoría, la etapa de la construcción, los términos se organizarán en jerarquías, ordenadas de manera descendente (desde arriba) o ascendente (desde abajo). Es eficiente trabajar con términos agrupados de esta manera, para poder insertar y visualizar las relaciones jerárquicas y de equivalencia. Las relaciones asociativas no se incluyen fácilmente, porque los términos suelen estar en otra jerarquía. Por ello, según la norma, estas relaciones generalmente se incluyen en la etapa final de construcción, donde los términos ya están presentes en el sistema.

En la cuarta categoría se aborda la introducción al tesauro. En esta deben especificarse el área o áreas temáticas cubiertas, los idiomas en los que se presenta el tesauro, el estándar nacional y/o internacional que se siguió, el significado de todas las convenciones, abreviaturas y signos de puntuación utilizados de manera no estandarizada y el número total de términos (diferenciando los autorizados de los no autorizados). También se le suman, las reglas que rigen la selección de conceptos, los lineamientos adoptados en la selección de las formas de los términos preferidos, las reglas de registro empleadas, una declaración sobre la actualización del mismo que incluya la frecuencia, fechas y procedimientos, el nombre y dirección de la agencia responsable a la que se deben enviar los comentarios y sugerencias para las actualizaciones de los términos, y referencias y reconocimiento de las fuentes utilizadas en la compilación y revisión del tesauro. Estos aspectos guiarán a quien utilice el tesauro.

Con respecto a la quinta categoría, la difusión del tesauro, la norma establece que se deben considerar las necesidades de las personas, ya sea para indexación o para investigación en cuanto a su publicación en formato impreso y/o electrónico. Una copia del tesauro desarrollado debe entregarse a la biblioteca depositaria nacional designada.

Por último, en la categoría sexta, la norma aborda las necesidades de la actualización de un tesauro. Considerando que es natural que existan cambios, tanto en la evolución de la terminología como en el alcance de las bases de datos u otros recursos a los que sirve el tesauro, la introducción de los cambios debe planificarse. El editor debe controlar la frecuencia con la que se usan los términos y aquellos que se usan con poca frecuencia deben eliminarse o corregirse. El editor también debe revisar las sugerencias de términos recibidas. La norma señala que otros aspectos referidos a la actualización de un tesauro podrían estar relacionados a la inclusión de un nuevo concepto, inclusión de un nuevo término no preferido como entrada cruzada, corrección de un término preferido o no preferido o exclusión de un término preferido. En cuanto a los términos suprimidos, se debe redactar una nota para cada uno. En los tesauros multilingües, estos cambios deben realizarse en todos los idiomas existentes en el tesauro. La norma aconseja que la forma más sencilla de difundir los cambios es distribuir una nueva edición del tesauro, y si se guarda una copia del tesauro en otra computadora, se debe borrar el antiguo y se debe importar el tesauro con los cambios implementados.

La ISO 25.964 efectúa, entre muchos, dos aportes que inciden en el desarrollo de este trabajo. El primero, la rigurosa distinción que realiza entre términos y conceptos. Esto queda demostrado cuando la norma determina que los conceptos están representados por un término preferente y por cualquier número de términos no preferentes, y todos los dispositivos que un tesauro presenta (notación, nota de alcance, relaciones de jerarquía y asociativas) se aplican al concepto como un todo. El segundo aporte es la importancia que asigna en reiteradas oportunidades al conocimiento del campo temático por parte de los recursos humanos que intervengan en el diseño y desarrollo del tesauro.

Martínez Tamayo & Mendes (2015), tomando como base esta normativa, enumeran los procesos de diseño y desarrollo de un tesauro:

  1. 1. Definición y análisis del dominio especializado que comprenderá el tesauro.
  2. 2. Control del vocabulario. Este proceso se compone, a su vez, de diferentes subprocesos, los cuales son:
    • Colecta de términos candidatos a través de algún método bibliográfico de colecta de términos.

    • Selección de los términos que pasarán al tesauro mediante el análisis de cada término candidato a profundidad.

    • Control de homónimos o desambiguación.

    • Control de sinónimos, seleccionando uno como término preferente y estableciendo relaciones de equivalencia con sus sinónimos.

    • Normalización de los términos de acuerdo a las formas gramaticales aceptadas.

  3. 3. Determinación de las relaciones jerárquicas y asociativas.
  4. 4. Construcción del orden sistemático.
  5. 5. Publicación del tesauro.

En el transcurso del año 2020, en la asignatura Análisis Documental III de la carrera Tecnicatura Superior en Bibliotecología del Instituto Superior de Formación Técnica y Docente N° 212 de General Paz, provincia de Buenos Aires (ISFTD N° 212), se procedió a desarrollar la actividad del diseño y la construcción de un tesauro, de acuerdo a las metodologías anteriormente detalladas. La realización de esta actividad se dio en contexto del Aislamiento Social Preventivo y Obligatorio, por lo cual, la misma se llevó a cabo enteramente en modalidad virtual y a distancia, en un período de seis semanas. La metodología de trabajo y los resultados de esta actividad son los que se exponen a continuación.

2. Metodología

El ISFTD N° 212 dictó entre los años 2018 y 2020 la carrera Tecnicatura Superior en Bibliotecología, bajo la Resolución 6.161/03 de la Dirección General de Cultura y Educación de la provincia de Buenos Aires. Como parte de los contenidos abordados dentro de la asignatura Análisis Documental III, correspondiente al tercer y último año de la carrera, se proyectó la actividad de diseño de un tesauro para comprender la estructura y el uso de dicha herramienta de OC. La actividad fue desarrollada por un total de 15 alumnos, en un período de tiempo de seis semanas comprendido entre los meses de septiembre y octubre del año 2020. Cada semana se explicaba un paso diferente de la construcción del tesauro para que los estudiantes fueran poniéndolo en práctica. Se le pidió a cada alumno que eligiera el dominio del tesauro dentro de los siguientes temas: lunfardo, fotografía, repostería, cartografía y básquet. Algunas de estas temáticas se correspondían con los campos de estudio de otras carreras transitadas por los estudiantes, mientras que otras representaban el dominio de especialización de unidades de información de la localidad. De esta manera, se aspiraba a generar un trabajo de extensión con la comunidad inmediata del instituto. Solo un estudiante eligió una materia diferente a las ofrecidas, la cual fue ginecología. Para que pudieran extraer los términos candidatos se les envió entre tres y cinco documentos de consulta sobre la temática elegida. También se alentó a los alumnos a que ellos mismos buscaran bibliografía que les pareciera relevante sobre cada disciplina. La metodología de diseño del tesauro se correspondió con el método sugerido por la norma ISO 25.964, a saber, el método mixto o híbrido.

El cronograma de tareas se diagramó de la siguiente manera:

Semana 1: elección del dominio y de la bibliografía.

Semana 2: colecta y selección de “términos candidatos”, utilizando la bibliografía relativa al tema seleccionado. Se sugirió utilizar la técnica de Settel & Cochrane (1982), la cual había sido estudiada y utilizada en unidades anteriores, para la selección de la terminología, consultando la tabla de contenidos, el índice analítico, el glosario, y otras secciones de los documentos para extraer la mayor cantidad de locuciones posibles. Esta metodología, desarrollada por las bibliotecarias estadounidenses Barbara Settel y Pauline Cochrane de la Syracuse University School of Information Studies y publicada en el año 1982, consiste en elegir las palabras claves de la tabla de contenido o del índice analítico de una monografía.

De estas secciones se extraen solamente los términos significativos que posean más frecuencia de aparición, dejando de lado aquellos que requieran palabras adicionales para su comprensión. Con respecto a la forma gramatical de las palabras claves extraídas, el formato aceptado incluye un sustantivo sin artículo, un sustantivo más uno o dos adjetivos, o uno de las anteriores más una frase preposicional, mientras que aquellos términos unidos por la conjunción “y” deben ser separados. Se invitó a tratar de ser lo más exhaustivos posibles ya que el tesauro a confeccionar serviría (hipotéticamente) para indizar documentos relativos al dominio seleccionado del cual se carece de herramienta de indización. Se pidió incluir expresiones sinónimas, ya que estas serían definidas como descriptores y no descriptores, relacionándose entre sí con una relación de equivalencia en una etapa posterior. Se recordó las formas gramaticales aceptadas para los mismos: una frase nominal compuesta por un sustantivo sin artículo, una frase nominal compuesta por un sustantivo y uno o dos descriptores, una frase proposicional, y, en el caso que fuera necesario, frases aceptadas y de uso común en el ámbito de dominio de la disciplina. Los adjetivos o verbos se dejan de lado, pero sí se aceptan las formas sustantivadas de los mismos. Para la organización de esta etapa y la construcción del tesauro se sugirió el uso de una ficha de dos columnas: en la primera columna se completan los datos de los términos candidatos, y en la segunda columna los datos de los descriptores posteriormente autorizados para la indización.

Semana 3: selección de los descriptores y normalización. En esta semana se pidió a los alumnos que analizaran en profundidad cada término candidato (el concepto y el vocablo que lo designa) y decidieran incluirlo o no en el tesauro. Con respecto a los nombres propios, se dejó a decisión de cada uno incorporarlos o simplificar su inserción en el tesauro mediante una nota de alcance que definiera la herramienta de normalización para confeccionarlos. Si en el listado de términos candidatos aparecían expresiones sinónimas, se instó a elegir una como preferente y establecer una relación de equivalencia con las entradas no autorizadas. El mismo proceder se sugirió seguir en caso de que decidieran incorporar nombres propios al tesauro y existieran dos o más formas variantes para ellos. En el caso de los términos homónimos autorizados, se les mencionó la importancia de diferenciarlos con un calificador. En relación a la normalización gramatical de las entradas, se les reiteró las formas autorizadas para los descriptores de un tesauro. Con respecto al uso de plural o singular, se les recordó que los términos debían redactarse en singular cuando se referían a sustantivos no cuantificables, partes del cuerpo únicas y conceptos abstractos. En plural se redacta cuando son sustantivos cuantificables, partes del cuerpo que aparecen de a pares o más, y cuando el concepto abstracto posee varias especies. Los nombres propios, en caso de que decidieran incluirlos, deben ser normalizados de acuerdo a alguna norma de catalogación.

Semana 4: definición de las relaciones jerárquicas y asociativas. En la cuarta semana se trabajó en las relaciones jerárquicas, es decir, relaciones entre dos conceptos representados por descriptores, de los cuales uno representa el género o el todo (término genérico, TG) y el otro representa la especie, la parte o un ejemplo del anterior (término específico, TE). Se aclaró que un TG puede tener muchos TE, pero un TE solo puede tener un TG. Y esta relación debía ser recíproca en todos los casos. Con respecto a las relaciones asociativas entre los descriptores, se les recordó que era una asociación mental entre dos conceptos que no puede ser considerada como una de equivalencia ni como una jerárquica. Nuevamente, la reciprocidad es obligatoria y la abreviatura que precede a cada descriptor asociado es término relacionado (TR). Las relaciones entre dos términos pueden ser muy diversas: una disciplina o campo de estudio y su objeto o fenómeno estudiados; una operación o proceso y su agente o instrumento; una acción y el producto de esa acción; una acción y su receptor u objetivo; un objeto o material y sus propiedades; un objeto o proceso y su contra-agente; un objeto y su unidad de medida; un organismo o sustancia engendrado o derivado de otro... y cualquier otra relación que creyeran necesario establecer.

Semana 5 y 6: construcción de la sección alfabética. Se les pidió que listaran de manera alfabética todos los términos que conformaban el tesauro, con sus correspondientes relaciones semánticas debajo. Se les recordó que los términos autorizados podían tener todas o algunas de las relaciones semánticas trabajadas. Ese listado alfabético, con sus correspondientes relaciones recíprocas, es el que se debía entregar en la fecha pactada de finalización de la actividad. La presentación sistemática o gráfica de los términos no fue solicitada, como tampoco se pidió una introducción al producto final.

Constantemente se solicitaba a los alumnos que pudieran enviar sus consultas y los avances de su trabajo a través de los canales acostumbrados de comunicación, para obtener una correcta retroalimentación de la realización de la actividad.

3. Resultados

Se analizan a continuación diferentes variables y los datos resultantes arrojados por la actividad desarrollada.

Con respecto al dominio temático (figura 1) elegido por los alumnos para diseñar el tesauro, el 40% eligió la temática de fotografía, mientras que un 33% eligió la temática repostería. El restante 27% se repartió entre las temáticas lunfardo, ginecología, básquet y cartografía.

Figura 1
Temáticas del dominio elegido por los alumnos.
Temáticas del dominio elegido  por los alumnos.
Fuente: elaboración propia.

Otro de los aspectos que se analizó fue el vocabulario desarrollado para representar los conceptos del tesauro. El vocabulario de un tesauro consiste, como ya se ha mencionado, en descriptores (términos autorizados), no descriptores (términos no autorizados) e identificadores (nombres propios). El total de los estudiantes utilizó descriptores. El 80% de los alumnos incorporó no descriptores, mientras que el 20% no los escogió. Esto incidió de manera directa en la creación de relaciones de equivalencia. Con respecto a los identificadores, solo el 33% de los estudiantes los usó en el tesauro (figura 2).

Figura 2
Terminología utilizada para conformar el vocabulario de entrada en los tesauros.
Terminología utilizada para  conformar el vocabulario de entrada en los tesauros.
Fuente: elaboración propia.

Respecto a las relaciones entre los conceptos representados en el tesauro, la totalidad de los alumnos utilizó de manera explícita las relaciones de jerarquía y asociación (figura 3). Un aspecto derivado de los resultados expuestos anteriormente con respecto al empleo de los no descriptores es el uso de la relación de equivalencia. El 80% de los alumnos utilizó las relaciones de equivalencia, mientras que el restante 20% solo contempló las relaciones de jerarquía y asociativas. Por ende, siendo las relaciones de equivalencia inexistentes, el material desarrollado no se corresponde con un tesauro propiamente dicho.

Figura 3
Uso de las relaciones presentes en los tesauros.
Uso de las relaciones presentes  en los tesauros.
Fuente: elaboración propia.

Vinculado a este análisis, se estudió si se respetaba la reciprocidad de las relaciones. Para ello se clasificó esta variable como Alta reciprocidad, Media reciprocidad o Baja reciprocidad, siendo las relaciones presentes recíprocas entre un 75% a 100%, entre un 50% a 75%, o en menos del 50% de los casos, respectivamente. De acuerdo a lo examinado, se pudo observar que el 80% de los tesauros respetaba altamente la reciprocidad en sus relaciones, el 13%, de manera media, y el 7% de forma baja (figura 4).

Figura 4
Grado de reciprocidad en las relaciones presentes en los tesauros.
Grado de reciprocidad en las  relaciones presentes en los tesauros.
Fuente: elaboración propia.

También se analizaron diferentes herramientas que ofrecen los tesauros para la presentación de los términos, como el uso de las abreviaturas y la tipografía.

En cuanto al uso de las abreviaturas se clasificó al tesauro como bueno, regular y malo. Para esta clasificación se tomaron como parámetros que las abreviaturas fueran acordes a las formas utilizadas tradicionalmente en los tesauros, adecuadas y recíprocas. Ningún tesauro recibió como clasificación “malo” en el uso de las abreviaturas; el 20% recibió la clasificación “regular” y el 80% la clasificación “bueno” (figura 5).

Figura 5
Clasificación del uso de las abreviaturas.
Clasificación del uso de las  abreviaturas.
Fuente: elaboración propia.

Con relación al uso de algún dispositivo de diferenciación tipográfica para los términos listados en el tesauro, podemos observar que el 67% de los alumnos sí se valió de este recurso, mientras que el 33% lo omitió (figura 6). Esto está influido por la ausencia de los no descriptores y la carencia de relaciones de equivalencia, ya que, al no existir términos no autorizados, la necesidad de diferenciarlos con algún elemento tipográfico especial era inexistente.

Figura 6
Uso de elementos tipográficos para la diferenciación de los términos.
Uso de elementos tipográficos  para la diferenciación de los términos.
Fuente: elaboración propia.

Por último, se analizó la presencia de calificadores para desambiguar términos y el uso de las notas de alcance. Solo el 13% de los alumnos utilizó calificadores para diferenciar términos homónimos (figura 7). Esto podría deberse a la inexistencia de este tipo de términos en los dominios temáticos elegidos, y, por lo tanto, la carencia de la necesidad de desambiguar dichos términos.

Figura 7
Uso de calificadores en los tesauros
Uso de calificadores en los  tesauros
Fuente: elaboración propia.

Tocante al uso de las notas de alcance, solamente un 27% de los alumnos decidió utilizarlas. Nuevamente, esto podría explicarse debido a la ausencia de la necesidad de proporcionar una definición o explicación del descriptor, o una instrucción para su utilización.

Conclusiones

Una de las conclusiones extraídas de este análisis se relaciona con la elección del dominio de los tesauros desarrollados. Esta selección se vio condicionada a la familiaridad de las temáticas sugeridas con la cotidianeidad de los alumnos. La preferencia por una temática que representa, o se imagina como conocida por los alumnos, implica que la extracción y el arreglo de los términos para la representación de los conceptos será una tarea más sencilla, hasta intuitiva. Esto indicaría que, al momento de diseñar y confeccionar un tesauro, el conocimiento temático del dominio de parte de quién realice esta tarea es un factor que puede asegurar la eficaz realización del trabajo.

Otra de las conclusiones a las que se arriba luego de transitar esta actividad es que, si bien los alumnos ya habían tenido un contacto primario con los tesauros, conociendo teóricamente su estructura y características, y utilizándolos de manera práctica para indizar diversos documentos, la construcción de un tesauro consolidó los conocimientos previamente adquiridos y reveló debilidades en algunos conceptos anteriormente incorporados. Un ejemplo claro de esto se observa en la negativa de uso de los términos no autorizados o no descriptores, situación expuesta en varios ejemplares. Esto repercutió de manera directa en la ausencia de relaciones de equivalencia. Por lo tanto, se deduce que los conceptos relacionados al vocabulario de entrada de los tesauros, así como la importancia de las relaciones entre los conceptos que este presenta, no se encontraba aprehendida en un porcentaje del alumnado.

La actividad de diseñar y construir un tesauro puede ser considerada como el camino inverso para el conocimiento del uso de esta herramienta. Así, se torna en una práctica altamente recomendada en las asignaturas que aborden las actividades de análisis documental de las carreras de bibliotecología de instituciones de similares características.

Referencias

Arano, S. (2005). Los tesauros y las ontologías en la Biblioteconomía y la Documentación. Hipertext.net, 3.

Dahlberg, I. (2006). Knowledge Organization: A New Science?. Knowledge Organization, 33(1), 11-19.

Dextre Clarke, S. G. & Lei Zeng, M. (2012). From ISO 2788 to ISO 25964: the evolution of thesaurus standards towards interoperability and data modeling. Information standards quarterly, 24(1), 20-26. Recuperado de https://www.niso.org/sites/default/files/2017-11/isqv24no1.pdf

Hjørland, B. (2008). What is knowledge organization (KO)? Knowledge organization, 35(2/3), 86-102. Recuperado de https://repository.arizona.edu/handle/10150/106183

Hodge, G. (2000). Systems of knowledge organization for digital libraries: beyond traditional authority files. Washington DC: Digital Library Federation, Council on Library and Information Resources. Recuperado de https://www.clir.org/pubs/reports/pub91/contents/

ISO. (2011). ISO 25.964-1:2011. Thesauri and interoperability with other vocabularies. Part 1: Thesauri for information retrieval. International Organization for Standardization.

ISO. (2013). ISO 25.964-2:2013. Thesauri and interoperability with other vocabularies. Part 2: Interoperability with other vocabularies. International Organization for Standardization.

Maldonado Martínez, A. (2010). Los tesauros como herramienta fundamental en la descripción y recuperación de documentos electrónicos. En XVIII Jornadas de Archivos Municipales. Comunidad de Madrid, Madrid, España. Recuperado de http://digital.csic.es/handle/10261/33890

Martínez Tamayo, A. M. & Mendes. P. V. (2015). Diseño y desarrollo de tesauros. La Plata: Universidad Nacional de La Plata. Facultad de Humanidades y Ciencias de la Educación. Recuperado de https://www.libros.fahce.unlp.edu.ar/index.php/libros/catalog/book/68

Marzal M. A., Colmenero M. J., Calzada, J. & Cuevas, A. (2006). Mapas conceptuales y presentación gráfica del tesauro: aplicación a las bibliotecas educativas. En Segundo Congreso Internacional sobre Mapas Conceptuales. Universidad de Costa Rica. San José de Costa Rica, Costa Rica. Recuperado de http://cmc.ihmc.us/cmc2006Papers/cmc2006-p70.pdf

Sánchez-Cuadrado, S., Colmenero-Ruiz, M. J. & Moreiro, J. A. (2012). Tesauros: estándares y recomendaciones. El profesional de la información, 21(3), 229-235. https://doi.org/10.3145/epi.2012.may.02

Settel, B. & Cochrane, P. A. (1982). Augmenting subject descriptions for books in online catalogs. Database, 5(4), 29-37.

Suárez Sánchez, A. (2017). Sistemas para la organización del conocimiento: definición y evolución histórica. e-Ciencias de la información, 7(2). Recuperado de https://revistas.ucr.ac.cr/index.php/eciencias/article/view/26878

Recepción: 13 Junio 2021

Aprobación: 28 Marzo 2022

Publicación: 03 Octubre 2022

ediciones_fahce
Ediciones de la FaHCE utiliza Marcalyc Sistema de Marcación, herramienta desarrollada con tecnología XML-JATS4R por Redalyc
Proyecto académico sin fines de lucro desarrollado bajo la iniciativa Open Access