www.e-fad.it
repositories
Chiunque si occupa di didattica si occupa di
informazione, condividendo e diffondendo informazioni tra docente e
discente. Le nuove tecnologie dell'informatica, come informazione
automatica, non possono che interagire con le modalita' con cui la
didattica si esprime.
Per questo la diffusione delle tecnologie
dell'informazione ha fatto si' che molti docenti ed editori
organizzassero contenuti didattici in forma informatica; a volte per
una semplice memorizzazione del dato, a volte per una organizzazione
piu' complessa che ne facilitasse la fruizione.
Le istituzioni e
le imprese che hanno prodotto materiali didattici si trovano ora
nella necessita' di organizzare e rendere disponibili in modo
sistematico i materiali creati. Il paradigma dei learning objects con
la relativa granularita' che prospetta fa si' che si possa avere un
approccio sistematico per la catalogazione di questi (piccoli)
oggetti didattici, la loro aggregazione e distribuzione.
La
delocalizzazione delle risorse consentita dalla diffusione della rete
costringe ad ipotizzare architetture distribuitte piuttosto che ad
applicazioni stand-alone. Le tecnologie relative alla raccolta
dei dati non sono cambiate concettualmente molto rispetto a qualche
lustro or sono; co' che e' fortemente cambiato sono le modalita' di
veicolazione e di trasmissione dei contenuti. Per questo, accanto a
sistemi di catalogazione ormai consolidati e ampiamente adottati (es.
ISBN, Dublin Core) si devono porre sistemi di scambio di informazioni
e pubblicazione di materiali che rispondono a tecnologie e metodi
relativamente giovani (SOAP, XML).
Il progetto di 'depositi'
di oggetti didattici diventa cosi' esercizio di unione sinergica di
sistemi di organizzazione di dati e di trasporto di informazioni.
In questo documento viene delineato un
possibile percorso che, partendo da materiali disomogenei digitali e
non digitali creati da autori diversi localizzati in sedi fisiche
diverse, porti alla creazione di una repository o deposito di
materiali didattici accessibili secondo diverse forme di utilizzo.
Parte della ' ricchezza' di un ente o impresa
che si occupi di formazione risiede nei materiali utilizzati come
supporto alla didattica. A volte la creazione e' demandata alla buona
volonta' dell'insegnante, altre volte sono presenti strutture di
creazione dei materiali didattici che producono oggetti ad un piu'
approfondito livello di definizione tecnica, metodologica e di
autonomia didattica. La diversita' delle situazioni di partenza
provoca la conseguente disparita' degli oggetti prodotti; volendo
ricordare solo alcune delle disparita' macroscopiche:
per quanto riguarda i supporti o materiali digitali o materiali non digitali
per quanto riguarda la finalita', o materiali creati per il supporto alla didattica, che necessitano della guida del docente o materiali per l'autoistruzione
per quanto riguarda la tecnologia o materiali che devono essere fruiti con un apposito 'player' o materiali fruibili attraverso il web
Tutti questi materiali devono essere
indicizzati in maniera univoca; vanno perciò cercati metodi
che omogeneizzino il modo con cui vengono descritti così da
utilizzare l'uniformità descrittiva per poter costruire
sistemi di catalogazione e ricerca efficienti.
Condividere i materiali prodotti
equivale ad una capitalizzazione degli investimenti in tempo e
risorse necessari per creare i singoli materiali. Soprattutto in
ambienti scolastici si assiste alla proliferazione di materiali su
argomenti simili costruiti da docenti diversi che vanno a sovrapporsi
moltiplicando gli sforzi e impoverendo i risultati. Gli stessi tempi,
organizzati sullo stesso materiale da parte di più persone in
modo collaborativo, genererebbero un risultato più completo ed
efficace a parità di risorse investite.
La condivisione delle risorse consente
inoltre di non iniziare da zero; quando un docente/editor vuole
creare un nuovo materiale parte da uno già realizzato (se
presente) adattandolo e/o migliorandolo massimizzando così le
risorse dedicate.
Non sono poche le resistenze che vengono
poste a questo approccio; permangono forti rapporti di dipendenza tra
un autore ed i propri materiali, giudicati sempre migliori di quelli
prodotti da altri sullo stesso argomento. Inoltre una certa 'gelosia'
nel condividere quanto creato (sia a livello di persone che di
istituzioni) e' spesso freno ai sistemi di condivisione dei
materiali. Mentre i vertici dell'organizzazione possono vedere da
subito i frutti della condivisione dei materiali in un'unica banca
dati, gli autori dei materiali ne vedono i vantaggi solo a
posteriori, quando possono adattare ai propri scopi i materiali
altrui o partire da essi per costruirne nuovi.
C'e' inoltre un passaggio obbligatorio che
a volte e' cosi' stretto da impedire il passaggio alla organizzazione
in unica banca dati: la standardizzazione.
Nel catalogare
ogni materiale in modo che sia classificabile e' necessario passare
attraverso un utilizzo condiviso della metodologia di catalogazione
che deve essere unica e condivisa, pena l'insuccesso dell'operazione.
Cio' comporta la accettazione e condivisione di vocabolari comuni e
di metodi condivisi.
Nel creare le modalita' di
standardizzazione si possono inventare sistemi ex-novo che si
adattino all'organizzazione in cui vengono calati; e' sempre meglio
analizzare prima cio' che esiste a livello internazionale, quindi
cercare di adattare una delle metodologie diffuse; se non si incontra
quella 'ottimale' si puo' adattare una esistente con i meccanismi di
espansione quasi sempre presenti e, solo in ultima analisi,
verificata l'impossibilita' di utilizzare uno dei punti precedenti,
creare una propria metodologia di catalogazione.
Uno degli indicatori di qualita' dei
materiali creati piu' diffuso nelle maggiori repository e' il peer
review che consiste nel raccogliere giudizi di qualita' da parte
degli utenti (selezionati o meno) sui materiali didattici. Piu' si
allarga il numero di utenti interessati e piu' diventa un criterio
accettabile anche se 'punitivo' verso alcuni materiali. Si puo' fare
un facile parallelo con il peer review del sito di aste e-bay, dove
il giudizio degli utenti dato su un venditore (editor) e' la cartina
di tornasole per comprare (fruire) l'oggetto (materiale).
In ogni caso il processo di
organizzazione e condivisione dei materiali richiede una forte
motivazione da parte degli attori coinvolti e un forte coaching da
parte degli organizzatori, puo' difficilmente essere applicato in
maniera forzosa e mostra i migliori risultati sul lungo termine,
mentre i difetti collegati alla mancata introduzione sono
immediatamente visibili.
Una volta stabilita la volonta' di organizzare
le risorse in una (o piu') repository di materiali si procede a
definire i criteri di classificazione dei materiali.
Gli standard organizzativi vanno definiti a
vari livelli:
a livello di catalogazione del singolo materiale didattico
a livello di servizi forniti da un singolo deposito di materiali didattici
a livello di metadeposito di materiali didattici
La pratica di classificazione dei materiali
didattici passa attraverso il concetto di metadati (dati di dati)
cioè descrittori del materiale didattico che ne definiscono
alcuni aspetti; sono paragonabili alla classica 'scheda' cartacea una
volta presente nelle biblioteche utilizzata per descrivere un volume;
lo schedario definiva l'insieme dei volumi presenti.
La scheda non e' il volume, e' una entità
separata che ne descrive il contenuto ed alcune caratteristiche
salienti (editore, data, etc). Allo stesso modo i metadati sono
entita' separate dal materiale didattico, utilizzati per descriverlo.
Nello scegliere quali dati registrare entrano in campo gli standard.
Come prima accennato si puo' scegliere di non
aderire ad alcuno standard, utilizzarne uno presente o adattarne uno
tramite modifiche. La scelta di non adottare alcuno standard va fatta
con estrema cautela in quanto potrebbe vanificare tutto il progetto
una volta che si deve 'aprire' verso altre realta'.
L'adozione di uno standard così
com'e' e' la soluzione che garantisce la massima apertura del sistema
e da' garanzie di stabilita'. L'adattamento diventa indispensabile
quando e' necessario inserire descrittori non previsti direttamente
dallo standard.
Nella descrizione dei materiali
didattici quelli piu' utilizzati sono il Dublin Core e IEEE LOM. Va
qui appena ricordato che la classificazione attraverso metadati
fornisce un approccio tecnologico che permette una efficiente
catalogazione. Cio' non implica una catalogazione di qualita'.
L'affidamento della redazione dei metadati a persone qualificate e'
elemento di importanza fondamentale per la buona organizzazione dei
metadati.
Pochi anni dopo l'introduzione del world wide
web (1994) sembra enorme il numero di pagine presenti, circa 500000;
viene promosso un sistema di metadati per cercare di dare una
catagorizzazione semantica alle pagine web; tenendosi a Dublin,
nell'Ohio, le specifiche definite verranno chiamate Dublin Core1
(DCMI, Dublin Core Metadata Initiative).
Il sistema prevede di
indicizzare risorse ovunque localizzate nella rete, identificando
come risorsa 'qualsiasi cosa che ha una identita'', senza alcun tipo
di restrizione. Non prevede l'applicazione alle sole risorse web, ma
puo' indicizzare qualsiasi tipo di oggetto.
I campi previsti
sono2:
Title: Il titolo o il nome della risorsa attribuito ad essa dall'autore o dall'editore.
Creator La persona o l'organizzazione primariamente responsabile per la creazione del contenuto intellettuale della risorsa.
Subject L'oggetto trattato nella risorsa. Tipicamente questo campo e' utilizzato anche per contenere le parole chiave (keyword). L'uso di vocabolari controllati e schemi di classificazione e' incoraggiato.
Description Una descrizione testuale della risorsa, ad esempio l'abstract nel caso di un articolo.
Publisher L'ente responsabile per rendere la risorsa disponibile nella sua forma attuale.
Contributor La persona o l'organizzazione, non specificata nell'elemento Creator, che ha realizzato una parte significativa nel contenuto intellettivo della risorsa.
Date Data di creazione o della pubblicazione della risorsa. Per il formato da utilizzare si veda ISO 8601 ( http://www.w3.org/TR/NOTE-datetime)
Type La categoria della risorsa, ad esempio: "Home Page", "Racconto", "Report Tecnico", etc... Per problemi di interoperabilita' dovrebbe essere espresso sempre in inglese e scelto da una lista limitata di possibilita'.
Format Il formato dei dati contenenti la risorsa ed opzionalmente le sue dimensioni. Anche questo campo dovrebbe essere scelto da una lista limitata standard.
Identifier Un identificatore univoco della risorsa. Ad esempio la sua URI (Uniform Resource Identifier) oppure l'International Standard Book Number (ISBN).
Source Eventuali informazioni su un'altra risorsa dalla quale la presente e' stata derivata.
Language La lingua utilizzata, espressa come definito nel RFC1766.
Relation Contiene l'identificatore di un'altra risorsa correlata. Questo elemento %uFFFD ancora in sviluppo.
Coverage Le caratteristiche spaziali e temporali del contenuto descritto nella risorsa. Ad esempio per un libro di storia sull'Europa nel medioevo.
Rights Un identificatore di una risorsa che definisce la licenza d'uso della risorsa in questione.
'
Ad esempio:
< META NAME="DC.Creator"
CONTENT="..............." >
indica lautore del documento
< META NAME="DC.Contributor"
CONTENT="..............." >
indica eventuali soggetti che hanno
contribuito alla realizzazione del documento
Il Dublin Core non indica alcun campo come
obbligatorio, sara' la specifica implementazione a definire quali
campi devono essere obbligatoriamente compilati. La tipica
implementazione del Dublin Core e' all'interno delle pagine HTML,
dove in una zona non visibile all'utente sono immagazzinati i dati
secondo Dc. Tuttavia i maggiori motori di ricerca tendono a non
utilizzare questi dati per indicizzare le pagine, in quanto spesso
utilizzati da creatori di contenuti 'poco scrupolosi' che pur di far
salire l'importanza delle pagine scrivono qualsiasi cosa.
L'importanza di questo standard e' stata definitivamente siglata dal
fatto che sotto la guida del National Information Standards
Organization (NISO) lo standard di metadata Dublin Core e' stato
recentemente recepito come norma ISO 15836:20034. IEEE LOM (SCORM)
Tools
Si parla di binding dei metadati quando si passa dal
concetto teorico di metadato con un valore assegnato alla sua
scrittura permanente, tipicamente su un file. Il tipico binding del
Dublin Core e' come file HTML all'interno (nel codice) di ogni pagina
web, dove all'interno dei tag esistono coppie nome-valore che
descrivono gli elementi del Dublin Core. Ma nulla vieta di scrivere i
valori all'interno di un qualsiasi database; i dati molto spesso
vengono scritti in file XML che sono per loro natura adatti a
ricevere questi tipi di informazioni, a livello di servizi forniti da
un singolo deposito di materiali didattici
Una volta creato il 'deposito' di
materiali didattici su di esso vanno montati i servizi necessari al
suo utilizzo.
Da una parte saranno presenti i servizi
che riguardano l'immissione e la catalogazione dei materiali,
dall'altra parte i servizi di consultazione della repository.
Non si tratta del semplice caricamento di
materiali didattici, ma dell'inserimento ragionato di oggetti
didattici finalizzato al successivo recupero e utilizzo. Vanno
implementati meccanismi che vedono solo come ultimo passo il
caricamento fisico dei files (quando presenti), mentre devono essere
definite con precisione le politiche di catalogazione ed accettazione
dei materiali.
La marcatura con metadati del materiale
caricato e' la procedura principale per la catalogazione. A seconda
dello schema utilizzato vanno distinti i campi di obbligatoria
compilazione rispetto a quelli facoltativi; alcuni possono essere
definiti come indispensabili per una prima immissione del materiale,
altri possono essere considerati di indispensabile compilazione solo
dopo il caricamento del materiale nella repository, subordinandone la
pubblicazione al completamento della procedura. Il sistema di
marcatura dei metadati deve essere per quanto possibile sequenziale,
suggerendo all'utente un percorso preferenziale di compilazione,
facilitante utilizzando vocabolari di voci dove questo e' possibile
(o obbligatorio), autocorrettivo impedendo di inserire voci in aperto
contrasto tra loro. Il processo assume particolare importanza in
quanto e' attraverso ai metadati che i materiali verranno
cercati/trovati; la corretta compilazione e' prerequisito essenziale
al funzionamento del sistema.
Per questo possono prevedersi linee-guida per
la compilazione, sistemi di help interattivo, corsi di formazione
ad-hoc per il personale addetto all'immissione dei dati.
Quando il materiale catalogato e' di
tipo digitale puo' avvenire il caricamento del materiale nella
repository, o tramite upload da pagina web o con meccanismo piu'
complesso (ftp, trasferimento manuale, etc.); in questo caso la
repository diventa anche il luogo fisico nel quale sono depositati i
materiali.
Altre volte si preferisce lasciare i materiali in
altro luogo, peraltro raggiungibile in rete, pur inserendo i metadati
nella repository; molti dei cataloghi di materiali didattici presenti
in rete fanno riferimento a materiali , siti o parte di siti che sono
raggiungibili via web.
Un particolare servizio di immissione dati
riguarda il peer review, ovvero la possibilita' di esprimere giudizi
sui materiali terzi da parte di persone diverse dall'autore che siano
disponibili per gli utenti della repository
In questo servizio risiede la maggiore
evidenza dell'utilita' delle repository. Si deve dare l'opportunita'
agli utenti di trovare e utilizzare il materiale depositato. La
ricerca avverra' secondo diverse tipologie:
una ricerca semplice consente la ricerca di un materiale semplicemente digitando una o piu' keyword. Pur essendo la ricerca piu' semplice per quanto riguarda l'utente, e' la piu' complessa dal punto di vista tecnico. Si tratta di definire in quali metadati viene eseguita la ricerca, con quali modalita' confrontare le keyword con i dati, quale peso dare ai diversi metadati.
La ricerca complessa potrebbe consentire la ricerca differenziata in tutti i campi dei metadati disponibili, o in un sottoinsieme che si ritiene significativo. I risultati della ricerca possono essere direttamente fruiti se si tratta di risorse digitali (visualizzati o scaricati), oppure immagazzinati in una zona dedicata all'utente per un successivo riutilizzo. Piu' materiali didattici, opportunamente collocati in sequenza, possono costruire una unita' formativa; alcune repository consentono di legare in un corso i materiali ed in alcuni casi ne consentono il download come corso SCORM per l'utilizzo in una piattaforma compatibile con lo standard.
Nel modello visto finora, ad un unico
deposito nel quale vengono depositati i metadati possono
corrispondere piu' luoghi nei quali le risorse sono fisicamente
presenti, siano esse digitali o non digitali. In uno scenario piu'
complesso, piu' repository possono scambiarsi i metadati per
aumentare di volume l'archivio e consentire agli utenti la ricerca su
un numero piu' grande di dati a disposizione.
L'aggiornamento e il mantenimento di queste
larghe basi di dati condivisi e' stato applicato in diverse
applicazioni telematiche tra quelle che piu' hanno stravolto il
panorama della rete e che ne hanno consentito l'espansione e la
potenza d'uso; tra queste si possono citare in ordine cronologico di
applicazione i motori di ricerca, la diffusione dei software di
download peer-to-peer, il formato di scambio news RSS.
I motori di ricerca fanno riferimento a 'oggetti' telematici (i siti) che sono fisicamente presenti in una location unica. Il motore di ricerca ne analizza i metadati, mantiene un database aggiornato che mette in relazione i metadati con la posizione dei siti e mette a disposizione degli utenti la ricerca tra i dati. Non contiene i siti stessi (a parte la copia di alcune pagine che a volte e' trattenuta) ma solo i metadati che li descrivono.
I software peer-to-peer, da napster in poi, funzionano in modo molto simile. Questa volta i 'materiali' sono presenti sui pc degli utenti stessi, che funzionano sia da server; i metadati sui contenuti vengono trasferiti aun database sul quale viene costruita l'interfaccia di riceerca dei brani (o del software). Anche in questo caso non e' la repository che contiene i materiali, ma svolge una funzione di ricerca per conto degli utenti; una volta ottenuto il risultato lo si puo' prelevare dal computer sul quale risiede.
Il formato RSS (Really Simple Syndication) e' un altro esempio del paradigma citato. E' finalizzato alla ricerca/presentazione di notizie, cioe' di pagine web comunque complesse relative a notizie. Anche in questo caso la pagina web risiede unicamente su un server, ma i metadati vengono distribuiti verso un database centrale che ne consente la ricerca e indicizzazione; una volta trovata la notizia ricercata questa viene 'scaricata' direttamente dal server nel quale risiede. Rispetto ai casi precedenti questa volta abbiamo una codifica della modalit%uFFFD con la quale i metadati vengono trasferiti, alla quale fa riferimento il protocollo RSS.
Nel creare un sistema di repository tra loro
collegate riveste particolare importanza la modalita' con la quale le
repository scambiano i dati tra loro. Nel caso dei motori di ricerca
esistono particolari agenti software (spider, crawler, etc.) che con
una certa frequenza visitano i siti, estraggono informazioni
(metadati) e compilano il database centrale. Nel caso dei software
peer-to-peer e' il programma utilizzato che scandaglia i metadati
dell'utente (essenzialmente i nomi dei files da condividere) e li
sposta verso un database centrale. Nel caso di RSS esistono agenti
software che scandagliano i siti che offrono questo servizio ad
intervalli regolari e portano i risultati al database centrale.
Nel caso delle repository di materiali
didattici si deve pensare ad un meccanismo di scambio dati che
consenta ad una repository di avere i dati di altre repository alle
quali e' collegata; questo meccanismo puo' funzionare a tempo o per
notifica.
Con i meccanismi a tempo, similmente ai
motori di ricerca, esiste un software che funziona ad intervalli
regolare ed interroga le repository con cui si e' collegati.
Con i meccanismi di notifica la
repository sulla quale sono avvenuti cambiamenti e/o modifiche
notifica le altre repository con cui e' collegata dell'avvenuto
cambiamento, invitando rispettivi agenti a scandagliarli, o
trasmettendoli insieme al messaggio di notifica. Questo meccanismo di
raccolta dei dati viene chiamato data harvesting, per quanto riguarda
le modalita' con le quali queste 'interrogazioni' avvengono esistono
alcuni standard definiti; si rimanda alle specifiche IMS sulle
repository e a OAI-MPH per gli approfondimenti.
http://dublincore.org/about/history/
Da
http://giosue.home.cern.ch/giosue/tesi/tesi/node48.html http://archivi.beniculturali.it/Biblioteca/DCbiblioteca.html
http://www.iso.ch/iso/en/CatalogueDetailPage.CatalogueDetail?CSNUMBER=37629&ICS1=35&ICS2=240&ICS3=30 SESDL