MetadadesLes metadades (de la grec μετα, meta, 'després de, més enllà de'[1] y llatí datum, 'el que es dona', «dada»[2]), literalment «sobre dades», son dades que descriuen altres dades. Les metadades són la via per a comunicar informació sobre un document o sobre els recursos que directament es relacionen amb la seva accessibilitat. Són, a més, una eina bàsica en l'organització, classificació i descripció de la informació, tasques pròpies de l'arquitectura de la Informació. DefinicióMetadada és tota aquella informació descriptiva sobre el context, qualitat, condició o característiques d'un recurs, dada o objecte amb la finalitat de facilitar-ne la recuperació, autentificació, avaluació, preservació i/o interoperabilitat.La definició genèrica de ‘metadada’, segons figura en l'Esquema Nacional d'Interoperabilitat(ENI), és “dada que defineix i descriu altres dades". Existeixen diferents tipus de metadades segons la seva aplicació. Així, en definir un grup de metadades per a un objecte l'estem descrivint de manera que aquesta informació ajuda els usuaris a identificar si l'objecte els és útil i a localitzar-lo ràpidament. Són exemples de metadades:
A més, a Internet també es poden trobar en altres formats:
Distinció entre dades i metadadesLa majoria de les vegades no és possible diferenciar entre dades i metadades. Per exemple, un poema és un grup de dades, però també pot ser un grup de metadades si està adjuntat a una cançó que el fa servir com a text. Moltes vegades, les dades són tant "dades" com "metadades". Per exemple, el títol d'un text és part del text com alhora és una dada referent al text (dada com a metadada). Metadades sobre metadadesCom que les metadades són dades en si mateixes, és possible crear metadades sobre metadades. Encara que, a primera vista, sembla absurd, les metadades sobre metadades poden ser molt útils. Per exemple, fusionant dues imatges i les seves metadades diferents pot ser molt important deduir quin és l'origen de cada grup de metadades, registrant això en metadades sobre les metadades. Metadada de gestió de documentsInformació estructurada o semiestructurada que fa possible la creació, gestió i ús de documents al llarg del temps en el context de la seva creació. Les metadades de gestió de documents serveixen per identificar, autenticar i contextualitzar documents, i de la mateixa manera les persones, els processos i els sistemes que els creen, gestionen, mantenen i utilitzen. OrigenLes metadades tenen el seu origen en els catàlegs, probablement inventats pels Sumeris. Al llarg dels segles les taules de fang que aleshores s'utilitzaven van anar evolucionant fins a esdevenir llistes manuscrites i, posteriorment, es van convertir, gràcies a l'aparició de la impremta, en catàlegs de llibres. Aquests primers catàlegs eren impresos que, simplement, ordenaven alfabèticament els elements sense cap altra mena de classificació més sofisticada. Un gran avenç va ser, pels volts de l'any 1900, l'aparició de les targetes, les quals, entre altres avantatges, podien ser actualitzades. D'aquesta manera els catàlegs es van convertir en un conjunt de targetes, una per a cada llibre, amb les seves corresponents entrades que podien ser, per exemple: títol, autor i tema. Així, la targeta indicava la localització de l'element en la biblioteca i, a més, en proporcionava informació addicional. És a dir, donava la informació mínima per a identificar el recurs. En la dècada dels 60 els mètodes de producció en massa, juntament amb la irrupció dels ordinadors, van fer necessari disposar de més d'una còpia dels catàlegs que ja existien, però els catàlegs de targetes no podien absorbir aquests nous requeriments. Va ser aleshores quan es va fer palesa la necessitat de desenvolupar estàndards de codificació, les avui en dia anomenades "metadades". L'ús de metadades ha estat recomanat pel W3C o World Wide Web Consortium, com a punt de control amb nivell de Prioritat 2 per a l'accessibilitat a la Web. Evolució de les metadades a la WebA la Web, les metadades no estan governades per autoritats centrals (com una biblioteca nacional), sinó que consisteixen en múltiples grups, organitzacions i persones treballant independentment. Des que va sorgir internet s'han anat desenvolupant diferents estàndards dirigits a diferents objectius:
MARC va ser concebut per a transmetre dades d'un sistema a un altre i va ser revolucionari perquè va incorporar camps de llargada variable. Conté diversos camps:
Té el seu origen l'any 1988 als Estats Units, moment en què fou aprovat per la NISO (National Information Standards Organization). És un protocol per a la generació de consultes de múltiples catàlegs "on line". El seu punt més fort és que permet a un usuari d'un sistema buscar i recuperar la informació sense saber la sintaxi utilitzada pels altres sistemes. Posseeix un protocol XML anomenat XER i és portable a SQL. Tant MARC com Z39.50 són emprats àmpliament per les entitats bibliotecàries tradicionals i és probable que ho continuïn sent per un temps a causa de l'alt cost en què han d'incórrer aquestes entitats per a mutar de format, a més del poc finançament amb el qual compten per a dur a terme aquestes tasques. 3. Standard Generalized Markup Language (SGML) Les seves arrels es remunten al 1969, quan als laboratoris IBM es desenvolupà Generalized Markup Language (GML), llenguatge que evolucionà fins al 1974, moment en el qual es va passar a dir SGML. La International Organization for Standardization (ISO) el va aprovar i va publicar el llenguatge el 1984 amb el nom d'estàndard ISO 8879. Aquest estàndard internacional consta d'un conjunt de regles per a descriure l'estructura d'un document, de tal manera que poden ser intercanviats a través de plataformes computacionals. SGML, doncs, és un llenguatge de marcatge de documents extremadament flexible i és, avui en dia, la base dels llenguatges de marcatge més emprats. En SGML un document està definit en funció de l'estructura de les entitats que el conformen. Aquestes entitats s'organitzen en una estructura lògica jeràrquicament, determinant l'estructura dels elements del document. Les entitats, a més, poden ser compartides per diferents documents. El marcatge que efectua es porta a terme mitjançant delimitadors i etiquetes de la forma: <etiqueta> element </etiqueta>. Aquestes etiquetes poden estar aniuades i es representen mitjançant el conjunt de caràcters bàsics d'acord amb l'estàndard ISO 8879. En el context històric de les metadades la introducció de SGML va tenir un paper fonamental, ja que va aconseguir establir un nou paradigma en el qual les dades deixen de ser només dades: els documents SGML contenen per separat (en el sentit lògic) els continguts, l'estructura i el format.
Els seus orígens es remunten al 1978 quan, també als laboratoris IBM, es van publicar els primers DTD com a part del ja explicat desenvolupament SGML. Així doncs, DTD són aplicacions d'SGML utilitzades per a definir les estructures o bé de múltiples documents o bé d'un tipus en especial. Aquestes estructures es defineixen indicant regles tals com noms dels elements permesos, el contingut de cada tipus d'element i l'ordre en el qual els elements poden aparèixer. Un dels més coneguts és el DTD d'HTML (HyperText Markup Language), que explicarem amb més detall més endavant, que defineix les regles que donen llum a aquest massiu llenguatge de marcatge de pàgines Web. Un altre exemple d'ús dels DTD el trobem a les biblioteques, on se n'utilitzen de diversos tipus, com ara EAD (Encoded Archival Description) per a la descripció bibliogràfica, i TEI (Text Encoding Initiative) per al marcat de les versions electròniques de textos culturals.
Aquesta iniciativa va néixer l'abril del 1996, moment en el qual es va portar a terme un workshop a la Universitat de Warwick. Aquesta trobada va comptar amb més de cinquanta representants de bibliotecologia, estàndards d'Internet, marcat de text i projectes de biblioteques digitals. El concepte que s'amaga darrere d'aquesta iniciativa és mantenir múltiples conjunts de metadades independents uns dels altres en un sol lloc o .framework., amb l'objectiu de proveir de mitjans per a administrar i accedir a conjunts de metadades per separat. Aquest marc permet l'existència de diferents sintaxis en cada conjunt de metadades d'acord amb els requerimetns semàntics, promovent la interoperatibilitat i extensibilitat en el moment de manipular (de forma selectiva) aquests paquets per part dels agents o sistemes que l'utilitzen. Els framework poden tenir dos tipus d'objectes:
El contenidor pot tenir dos tipus d'estats:
Aquest framework va ser resultat d'una anàlisi de Dublin Core i va influenciar molt en la creació de Resource Description Framework (RDF). Així doncs, un cop vista l'evolució de les metadades a la web, en podem extreure, entre d'altres, una conclusió clara: per tal que les metadades es puguin implementar, és necessari un llenguatge. De llenguatges n'existeixen molts, que acostumen a ser derivacions i perfeccionaments dels seus precedents, tal com es pot veure a la figura de la dreta. Necessitat de les metadadesQualsevol recurs, quan està emmagatzemat amb d'altres, té la necessitat de ser descrit per a facilitar les cerques que mirin de trobar-lo a partir de les característiques distintives que té. Això és cert per a qualsevol tipus de recurs, tant per a un vídeo com per a un llibre en una biblioteca, però també per a un iogurt a la prestatgeria d'un supermercat o per a un os a l'armari d'un paleontòleg.En el cas dels llibres d'una biblioteca, normalment les metadades tenen forma de targeta amb informació sobre la secció en què hi ha el llibre, l'autor, l'editorial, la col·lecció a què pertany o el nombre de pàgines. Si es tracta d'un iogurt, les metadades són les que hi ha a l'etiqueta, com ara el gust, si és ensucrat o no, la data de caducitat o la llista d'ingredients. Com es veu, tot això ajuda a triar un recurs en comptes d'un altre segons la característica que ens interessa més i sense haver-hi de fer un examen més a fons. En l'exemple del iogurt, si en volem comprar un de maduixa sempre serà més senzill llegir l'etiqueta que no pas obrir cada iogurt fins a trobar-ne un del gust que volem, i per a això és imprescindible tenir metadades fiables. La imatge que hi ha a la dreta mostra ressaltats de groc tots els elements d'informació de metadades d'un vídeo emmagatzemat en el portal YouTube, com ara el títol, la longitud en minuts, la data de publicació, el nombre de vegades que l'han vist, les etiquetes, els comentaris i l'usuari que el va publicar. El concepte de metadades és anterior a Internet i al Web, si bé és cert que les noves necessitats de cerca d'informació han suscitat un interès que no hi havia hagut fins llavors per les normes i pràctiques de metadades. Registres de metadadesLa informació de metadades està estructurada en registres (o fitxes) i en general compleix un cert estàndard o normativa que en regula l'estructura. Un registre de metadades està format per un conjunt d'atributs o elements que permeten descriure completament el recurs al qual acompanyen. És important ressenyar que, si bé el registre de metadades i el recurs que descriu es poden emmagatzemar plegats (metadades internes), és més freqüent emmagatzemar-los tots dos de manera separada (metadades externes), cosa que permet (com en el cas dels catàlegs de les biblioteques) que coexisteixin diverses descripcions d'un mateix recurs fetes per diferents entitats o segons diferents necessitats o interessos. Així, si parlem d'objectes d'aprenentatge, un repositori que compleixi l'estàndard Dublin Core de metadades farà registres diferents dels que en podria generar un que compleixi l'estàndard IEEE LOM. Metadades i objectes d'aprenentatgeEn l'aprenentatge electrònic (e-learning), les metadades s'empren per a descriure els objectes i recursos d'aprenentatge amb l'objectiu de facilitar les cerques en els repositoris. Sovint, la informació de metadades dels repositoris d'objectes d'aprenentatge compleix l'estàndard IEEE LOM, que defineix un conjunt de nou categories d'informació, que permeten descriure els recursos tant des del punt de vista didàctic com tècnic, cosa que permet fer cerques molt més ajustades que permetran als usuaris (professors que componen un nou curs amb materials existents, o alumnes interessats a aprendre d'un cert tema) obtenir resultats més ajustats als criteris de cerca que s'hi han introduït. Les metadades són una part essencial del paradigma dels objectes d'aprenentatge, ja que:
Per tant, les metadades són un element de valor fonamental. Un recurs digital amb un disseny pedagògic excel·lent no és per se un bon objecte d'aprenentatge, sinó que ho és en la mesura que les metadades que el descriuen són també de qualitat. Problemes associats a l'ús de les metadadesSi bé la inclusió de metadades és necessària, com hem vist, per a facilitar i potenciar un bon nombre de tasques importants, també hi ha problemes que estan associats a l'ús d'aquestes metadades. Alguns dels problemes més esmentats en la literatura científica es resumeixen en els punts següents:
ParadadesEs coneixen com a paradades[3] el conjunt de dades que es generen durant la interacció entre un usuari i un recurs o servei d'un escenari educatiu (un entorn virtual d'aprenentatge, un repositori, una xarxa social, etc.). Segons el recurs o servei a què s'ha accedit i les operacions que s'han fet amb aquest servei, les paradades generades contindran més o menys informació. Aquesta informació es pot emmagatzemar per a analitzar-la més endavant, amb l'objectiu de comprendre més bé com interactuen en aquest escenari educatiu els usuaris, i detectar així possibles problemes i oportunitats de millora tant de l'escenari educatiu mateix i de les eines utilitzades com de l'enteniment del procés que hi segueixen els usuaris. A partir d'aquesta l'anàlisi, es poden construir, entre d'altres, sistemes de recomanació, esquemes de reputació, o visualitzacions de la interacció. Per exemple, si un usuari baixa un document d'un repositori d'objectes d'aprenentatge, es podrà saber que l'usuari U ha baixat el document D en el moment T. Aquesta informació es pot usar per a detectar els recursos més baixats o, per contra, aquells a què no accedeixen mai els usuaris, però també per a saber en quines èpoques del semestre acadèmic es produeix un ús més gran del repositori. Una altra possibilitat és si un usuari U avalua un recurs R amb una valoració X en el moment T, com ara un comentari en un grup de Facebook. Això permet conèixer els comentaris més ben valorats o més mal valorats pels usuaris, i també els usuaris més actius. En general, l'objectiu és guardar la interacció dels usuaris amb el sistema en forma de tuples (U, T, S, R, X): un usuari U en el moment T utilitza un servei S sobre un recurs R amb un resultat X. Aquesta és la mínima informació que s'ha d'emmagatzemar per a analitzar-la més endavant. Emmagatzemament de paradadesCom que la interacció en un entorn virtual d'aprenentatge se sol fer amb l'ús d'un navegador web, un usuari que visita els espais que ofereix aquest navegador deixa un rastre en forma d'accessos a pàgines web que queden recollits en els fitxers de registre dels servidors web que funcionen amb el sistema. Per tant, sembla factible analitzar els fitxers de registre per a extreure la informació relativa a la interacció. El problema, però, és que aquests fitxers contenen moltes més entrades relatives a la disposició dels elements que formen una pàgina web que no pas de realment relacionades amb el mateix resultat de la interacció dels usuaris, la qual s'ha de calcular a partir de la seqüència de salts capturada en els fitxers de registre. El cost computacional d'analitzar fitxers de registre és molt elevat (contenen milions de línies de registre) i no és senzill quan es tracta de sistemes complexos amb molts servidors en què el rastre que deixa un usuari pot estar fragmentat en diferents fitxers. Per tant, si cal recollir paradades per a analitzar-les més endavant, val més que el sistema sigui dissenyat específicament amb un servei de recollida enfocat a emmagatzemar només la informació requerida per a l'anàlisi, i reduir així la mida necessària i el temps de procés. Segons l'objectiu de l'anàlisi, les paradades es poden emmagatzemar dins de les metadades d'un recurs, dins del perfil de l'usuari o bé, el més habitual, en una taula (o base de dades, segons la complexitat que tingui) separada. Característiques ImportantsEs poden distingir tres aspectes fonamentals en relació a les metadades a la Web:
Un aspecte molt important en la descripció d'objectes informatius a la Web és la necessitat d'identificar-los i de tenir un mètode per a accedir a ells i a descripcions d'ells segons sigui necessari. Per a obtenir el màxim benefici en l'ús de metadades és necessari que els identificadors tinguin quatre característiques:
La forma en què es generen els sistemes de metadades a la Web difereix dels utilitzats a les biblioteques tradicionals. Les metadades a la Web no apunten a realitzar descripcions exhaustives dels recursos, sinó a crear sistemes que utilitzen en conjunt els diferents marcs. Les metadades han de ser granulars, essent aquesta una característica necessària per a la subsistència d'aquestes. És per això que és comú trobar descripcions realitzades mitjançant camps Dublin Core i identificades mitjançant DOI.
Les descripcions de metadades estan estretament lligades a les característiques rellevants dels objectes, generant noves dificultats tècniques, ja que es fa necessari enfrontar-se als canvis que experimenten els objectes al llarg del temps. A la Web els objectes es poden crear dinàmicament, establint dificultats que fins avui en dia, tot i existir la tecnologia necessària, no han estat solucionades. Forma i LlenguatgeTal com ja hem explicat, el mètode més comú per a crear metadades és en forma d'etiquetes Meta.
<HEAD> <Meta name="Author" content="Myself"> </HEAD> A aquesta estructura se li poden col·locar altres etiquetes. Algunes de les més comunes són:
Hi ha webs que a través d'una plantilla et genera les etiquetes html corresponents, tal com es mostra a les figures de la dreta. Alguns exemples en són:
Hi ha webs com DC-DOT que et permeten tant extreure informació de metadades del web com generar-ne. Podem investigar part del codi de qualsevol pàgina Web. Depenent del format en què volem que ens surti la informació, veurem una plantilla o una altra. Classificació i aplicacióLes metadades s'apliquen en molts camps diferents i es presten a molts tipus de classificacions, com per exemple la següent: Analitzant-los més a fons:
Es troben dades com:
Exemple de metadades d'aquest caire: metadades per a la preservació a llarg termini d'objectes digitals i, depenent del context, a la seva reconstrucció en cas de pèrdua.
L'exemple més clar el trobem a Dublin Core. També hi tenen cabuda metadades per a descriure recursos de dominis específics del coneixement. Un exemple serien les metadades Darwin Core que donen representació a la cerca i recuperació de col·leccions d'història natural, i també els pertinents al Data Documentation Initiative (DDI), un estàndard que serveix per a descriure conjunts de dades per al seu ús en ciències socials.
Un exemple serien les metadades que descriuen el format d'alguna imatge digital.
Dona termes sobre com s'interrelacionen cadascun dels seus components. Per exemple, una metadada pot descriure que, en el context d'un llibre, arribarem a un tema en concret si es donen dos factors: seguint el número de pàgina i que, a més, les pàgines estiguin ordenades. Cal tenir en compte, però, que els límits entre categories són molt difusos, de manera que la majoria de metadades tenen cabuda en més d'una d'aquestes categories. Una classificació formal on s'agrupen metadades només en aquests grups no representa adequadament la realitat. Per tal que s'adeqüi més al món real, utilitzem un diagrama triangular per a visualitzar la classificació. A la imatge de la dreta hi ha situats uns quants estàndards:
I així successivament. Selecció de MetaformatsA l'hora de seleccionar un esquema de metadades (Dublin Core, EAD, TEIHeader, LOM, etc.) per a implementar un sistema d'informació digital o en qualsevol projecte d'organització i recuperació d'informació (per exemple, una biblioteca digital) tenim fonamentalment tres opcions: a. Utilitzar un esquema o vocabulari existent. b. Crear el nostre propi esquema d'informació. c. Seleccionar un estàndard i adaptar-lo a les nostres necessitats. És recomanable que, si ja existeix un esquema apropiat per a descriure la informació que volem organitzar, s'utilitzi l'esquema existent. Tot i això, hem de tenir en compte els següents punts:
- Una col·lecció digital formada bé per documents tradicionals digitalitzats, o documents originalment digitals que tenen un fi comú (per exemple un portal, un weblog o qualsevol altre sistema de gestió de continguts). - Una col·lecció virtual constituïda per un conjunt de metadades que descriuen i qualifiquen l'accés a documents distribuïts d'índole diversa.
"Pros"Els beneficis d'utilitzar metadades són diversos i depenen de l'àrea en què s'emprin. En termes generals, però:
"Contres"La barrera principal en l'ús de metadades no és tecnològica, ja que es disposa dels elements necessaris per a crear-les. La vertadera barrera és el seu ús social, essent necessari crear una cultura de metadades. Sota certs punts de vista és possible, igual que ho va ser la creació dels catàlegs, però requereix molt de temps per tal de crear l'hàbit en el consumidor. La seva introducció en el seu ús social és difícil també perquè les metadades es veuen com:
A més, hi ha el perill que es faci un mal ús de les metadades: la qüestió més important en utilitzar-les és aplicar-les uniformement a la col·lecció de documents i utilitzar-les amb precisió. Quan s'utilitzen les metadades inapropiadament, amb la intenció de guanyar major visibilitat a Internet, es corre el risc de comprometre el rànquing en els motors de cerca. A més, des del punt de vista de l'accessibilitat, s'estaria proporcionant informació enganyosa o inexacta sobre un recurs. Referències
Enllaços externs |