Como hemos visto en el capítulo anterior, el término metadatos tiene varios usos. Sin embargo, un uso muy común es el de afinar las consultas en los motores de búsqueda. De este modo, el usuario puede encontrar resultados más precisos y no perder tiempo en búsquedas manuales.
Los metadatos también proporcionan el soporte necesario para categorizar la información disponible y facilitar la comunicación entre el usuario y el ordenador. De este modo, los metadatos facilitan el trabajo al clasificar y estructurar los datos disponibles.
Ya hemos hablado de cómo se clasifican los metadatos según los datos o la información que contienen, pero hay otras cuestiones, como dónde almacenar los metadatos para que estén seguros y bien organizados.
En este caso, hay dos formas de almacenar los metadatos de forma segura:
Almacenamiento interno: es decir, los metadatos se almacenan internamente en el mismo archivo que los datos.
Almacenamiento externo: es decir, los metadatos se almacenan externamente en la misma fuente que los datos.
Originalmente, los metadatos se almacenaban en el mismo documento o archivo que los propios datos para facilitar su gestión. Sin embargo, hoy en día se considera que un repositorio externo es la mejor solución para almacenar los datos.
Los metadatos pueden agruparse para simplificar las operaciones de búsqueda. Sin embargo, aquí surge un problema. Es la forma de vincular un recurso con sus metadatos.
En este contexto, la técnica URI es la más utilizada para buscar documentos en la World Wide Web, pero esto conlleva otro problema, y es que no todos los documentos tienen una URL. Se trata, por tanto, de una cuestión un tanto complicada que hay que estudiar detenidamente para encontrar la mejor solución posible.
Sin embargo, hay un aspecto del almacenamiento de metadatos que merece atención: el cifrado. Originalmente, los metadatos se almacenaban como texto plano o incluso en codificación binaria para almacenar los metadatos en archivos específicos. Sin embargo, hoy en día se utiliza ampliamente el Lenguaje de Marcas Extensible (XML), una definición de lenguaje de marcas desarrollada por el World Wide Web Consortium, para almacenar datos en forma legible.
Esto se aplica tanto a los usuarios como a los propios ordenadores, ya que el lenguaje tiene muchas características que lo hacen adecuado para ambos. Sin embargo, a pesar de sus ventajas, también tiene algunos inconvenientes, como el espacio en disco, ya que los datos requieren más espacio del que ofrece el formato binario. Por ello, en muchos casos, se combinan las dos fuentes (XML y codificación binaria) para combinar las ventajas de ambos sistemas y lograr un mejor rendimiento de almacenamiento.