Nel 2006 dopo una laurea in informatica e un’esperienza lavorativa tra interaction design e grafica, il primo lavoro utile che trovo mi porta sulle rive del Lago Maggiore. Qui è situata una delle sedi della Commissione Europea, nello specifico il Joint Research Centre. Il centro nacque negli anni ’50 atto alla ricerca nucleare, mentre ora svolge un più generico ruolo di supporto tecnico al processo di creazione della legislazione europea.
Il progetto, sul quale a distanza di tre anni sto ancora lavorando, consiste nella realizzazione di un sistema di information retrieval atto a integrare le differenti risorse che descrivono l’ambiente lavorativo del JRC. Nello specifico 1) la legislazione europea, 2) i documenti scientifici prodotti all’interno del centro e 3) il posseduto della biblioteca del sito. I tre insiemi di documenti sono indicizzati attraverso tre diversi vocabolari controllati, oggetti che all’inizio del lavoro mi erano totalmente sconosciuti.
Sono stato fortunato, dopo MILK per me questo è il secondo progetto a lungo termine dove è realmente possibile sviluppare un software seguendo un processo completo di design, senza prototipazioni veloci o rigidi vincoli di tempo. La prima parte del processo di design è sempre affascinante e affrontarla con la dovuta calma è un lusso. Questa parte consiste nell’immedesimarsi nell’ambiente, studiarlo assieme alle persone che lo popolano, informarsi e approfondire.
Come scritto poco prima, dato che non sapevo cosa fosse un vocabolario controllato, la prima cosa che mi misero tra le mani fu Documentazione e Biblioteconomia¹, un manuale a cura di M. P. Carosella e M. Valenti che tratta con chiarezza svariati argomenti che gravitano attorno al mondo delle biblioteche. La quarta di copertina recita: “locali e attrezzature, acquisizione, ordinamento, ricerca, diffusione e utilizzazione dei documenti e delle informazioni, automazione e micrografia [...]”.
Questo articolo è lontano dall’essere un’introduzione alla Library and Information Science, non vuole nemmeno essere una panoramica del progetto su cui sto lavorando con tanta passione². Piuttosto l’obiettivo che mi sono prefissato è quello di scrivere una piacevole digressione nella quale concetti di diverse discipline si mischiano per diventare meticci³. Inanellare termini, discorsi, riflessioni che nascono da approfondimenti legati alla biblioteconomia, ma si riflettono nitidamente alle tematiche legate a Internet.
Infine mi piacerebbe trasmettere anche le impressioni dell’ambiente della biblioteconomia, un mondo che mi ha stupito per la limpidezza, la passione, la storia. Senza dimenticare le persone che ho conosciuto e che fanno di questo mondo una piccola isola preziosa ora che tutto è un caos.
Carlo è la persona che mi ha coinvolto nella realizzazione di questo progetto. Abbiamo avuto gli stessi professori, abbiamo lavorato con le stesse persone ed entrambi ci siamo laureati in informatica con un condiviso scetticismo. Nonostante questo continuiamo ad amare i libri nella forma di oggetti cartacei.
Agli inizi del progetto, Carlo mi ha lasciato una pila di libri ed è scappato. La settimana seguente è tornato per rispondere ai miei dubbi ed è scappato di nuovo. Spesso le discussioni che si innescano fra noi durano manciate di minuti, poi Carlo scappa. Potrei definirlo come un uomo ricco di spunti spesso in fuga. La digressione inizia con l’argomento che ha portato alla prima fuga di Carlo, il senso di concetto.
I coniugi Leonard e Sheena Will sono due graziosi vecchietti inglesi che si occupano di gestione dell’informazione e gesticono un sito ricco di informazioni. Willpower Information è una preziosa perla nel mondo della biblioteconomia e sebbene non si presenti con uno stile grafico seducente, la qualità dei contenuti è elevata.
Il sito fornisce anche un aggiornato glossario di termini, dal quale riportiamo la definizione di concetto.
“Il concetto è un’unità di pensiero. [...]”
Per aiutare l’utente nella ricerca, nelle biblioteche è stato introdotto l’uso dei termini, delle parole o delle frasi che vengono associate a un libro. Per esempio il libro di Donald Norman La caffettiera del masochista⁴ può essere associato al termine ergonomia cosicché un utente che cerca materiale legato all’ergonomia possa trovare il libro di Norman.
Un punto interessante della biblioteconomia è che il termine ergonomia non porta in sé nessun significato, può essere considerato semanticamente vuoto. Tuttavia il termine assume significato quando viene associato a un libro. Nell’esempio che abbiamo fatto il termine ergonomia assume il suo significato quando viene associato al libro di Norman, ovvero quando l’associazione tra termine e libro dà vita a un concetto. L’associazione fra termini e libri viene chiamata indicizzazione.
L’indicizzazione è un’attività che spetta al bibliotecario, a lui va la responsabilità della creazione dei concetti. Più legami termine-libro verranno creati, più nasceranno concetti. Inoltre un unico libro può essere associato a più termini a seconda della sua transdisciplinarità.
Attraverso l’indicizzazione, una biblioteca con molto materiale porterà alla formazione di una lista con molti termini che verrà usata come strumento nella ricerca.
In maniera analoga, un motore di ricerca come Google si comporta quasi come un bibliotecario: Google cerca le pagine web, le indicizza e le mette a disposizione degli utenti attraverso una ricerca testuale. Usando degli automatismi, Google crea dei concetti che saranno accessibili attraverso un’interfaccia di ricerca testuale.
Ma cosa cambia tra un bibliotecario e Google? Molto direi.
Prima di tutto il bibliotecario è una persona. Può essere banale, ma con una persona riusciamo ad avere un dialogo mentre con un motore di ricerca no, e se parliamo con un bibliotecario lui ne terrà conto mentre per Google saremo un’e-mail.
Parto da questo perché la figura del biblotecario è protesa verso i suoi utenti, un bibliotecario senza utenti non ha senso di esistere. Se l’utente non trova materiale nella biblioteca, ammesso che questo esista, la colpa è solamente del bibliotecario. E dato che il successo della ricerca dei libri è strettamente legato all’indicizzazione, il bibliotecario si deve adoperare a manipolare la lista dei termini in modo che sia comprensibile all’utente. Questa manipolazione porta alla nascita dei vocabolari controllati.
I vocabolari controllati sono delle liste di termini usate per indicizzare libri e successivamente per trovarli. Una buona gestione di vocabolari controllati porta a un diffuso successo nella ricerca dei libri.
Partendo dall’assunto che i vocabolari controllati sono lo specchio delle biblioteche, si può dire che essi siano variegati quanto le biblioteche stesse: semplici o sofisticati, piccoli o sconfinati, in una o più lingue, soli o la somma di più vocabolari. Per esaminare le norme che ne regolano la forma e la gestione prenderò ad esempio il tesauro, un modello consolidato di vocabolario controllato.
Immaginiamo Margherita come una motociclista. Ha letto Lo zen e l’arte della manutenzione della motocicletta⁵ e vorrebbe conoscere un po’ meglio la sua Guzzi nel caso avesse qualche contrattempo. Arriva dal bibliotecario e chiede quali libri potrebbe consultare sull’argomento “moto”. Il bibliotecario risponde cordialmente che consultando i terminali della biblioteca troverà molto materiale sotto il termine “motocicletta”. Margherita ottiene la lista di libri corrispondenti al termine “motocicletta”, ne sceglie uno e inizia a consultarlo. Fa per lei, lo porterà a casa.
Il bibliotecario per raffinare il tesauro ha degli strumenti chiamati relazioni, essi hanno la funzione di collegare due termini attraverso legami specifici. In questo caso “moto” è legato a “motocicletta” attraverso una relazione chiamata USE, ovvero “moto” USE “motocicletta”. Questo tipo di legame significa che se voglio cercare libri sull’argomento “moto” devo usare il termine “motocicletta”.
Google è in grado di distinguere tra “moto” e “motocicletta”? No, i risultati che seguono le due ricerche sono diversi.
Immaginiamo ora che Anna, agricoltrice per passione, voglia trovare libri sulla pesca. Il bibliotecario, sempre cordialmente, chiede se è interessata a libri sulla coltivazione del frutto o sulla disciplina sportiva. A seguito della risposta egli indirizza Anna verso una ricerca che la porterà a trovare i libri desiderati.
Il bibliotecario per raffinare il tesauro questa volta userà relazioni di tipo gerarchico: il termine “pèsca” potra essere nidificato a “frutto”, mentre il termine “pésca” potrà essere figlio di “disciplina sportiva”. In questo caso si dirà che “pèsca” è un narrower term rispetto a “frutto”. Relazioni di tipo gerarchico sono importanti perché aiutano a delimitare il significato di un termine, a specificarlo o a generalizzarlo sempre a seconda del materiale posseduto.
In questo caso i motori di ricerca come Google e Yahoo hanno una sezione dedicata chiamata directory, non solo caratterizzata da una struttura di tipo gerarchico ma anche da relazioni trasversali alle discipline.
Per esempio la ricerca di Anna l’ha portata a trovare libri sulla pesca legati alla disciplina dell’orticultura. Tuttavia potrebbe essere in seguito interessata anche all’uso della pesca in campo gastronomico. Per venirle incontro il bibliotecario interviene sul tesauro attraverso leganti trasversali chiamati related term, che nell’esempio specifico collegheranno la coltivazione della pesca alle ricette della pesca. Queste relazioni aiuteranno quindi l’utente a vedere un argomento da diversi punti di vista.
Questi esempi sono serviti a dare un’idea di quali siano i meccanismi che regolano la gestione dei vocabolari controllati, ma soprattutto sono serviti a farvi capire che dietro a un qualsiasi tipo di vocabolario controllato (tesauro, classificazione, soggettario, tassonomia, etc.) esiste un profondo lavoro da parte del bibliotecario. Senza questo lavoro di manipolazione, difficilmente riusciremo a giungere a dei risultati soddisfacenti.
Prendiamo ora in considerazione un social network come delicious, specializzato nella gestione dei bookmark. Una persona, dopo essersi iscritta, può salvare i suoi bookmark personali e condividerli con una comunità.
Il tessuto di questo network è affascinante: si genera sulle azioni di indicizzazione di ogni singolo utente e la quantità di dati prodotta è impressionante. Fare delle ricerche in delicious può portare a risultati più interessanti rispetto ai motori di ricerca stessi. Tuttavia ha il grande limite di non poter distinguere tra pèsca e pésca o più semplicemente tra il singolare e il plurale.
Anch’io sono un utente di delicious e per quanto mi posso permettere, cerco di tenere aggiornata la lista dei termini. Però, non essendoci un vocabolario comune, il mio sforzo non è condivisibile con la comunità.
La biblioteconomia ha già risolto problemi come questi, ma il mondo di Internet non sembra interessaresene, anzi sembra ancora in uno stato di entusiasmo per le folksonomy.
Un’altra grande differenza che divide Internet dal mondo della biblioteconomia è lo spazio.
Sul web esiste una quantità tale di dati che si potrebbe considerare infinita, le biblioteche invece sanno che lo spazio costa ed è prezioso, eccezion fatta per la Biblioteca di Babele⁶.
Nelle biblioteche avere spazio limitato significa dover scegliere il materiale da esporre al pubblico. Anche questo è uno dei compiti del bibliotecario: introdurre e scartare volumi è la norma per mantenere una biblioteca aggiornata. Bisogna considerare inoltre che incaricare una persona a scegliere e valutare i libri è una garanzia di qualità. In questo modo in biblioteca difficilmente troverete un libro scritto male. Anche se ci finisse, col tempo sarebbe comunque destinato a sparire. In Internet invece una pagina è destinata a vivere quasi oltre la morte, creando così una quantità di rumore che va a danneggiare le ricerche. Inoltre una grande mole di dati tende a seppellire le informazioni e ora lo dimostreremo usando un paradosso.
Avete mai usato Google per cercare Google?
Se provate, ottenete due miliardi e mezzo di risultati. I primi quaranta risultati si riferiscono al dominio stesso di Google mentre i risultati dopo il cinquecento non sono nemmeno visualizzabili. Ci sono circa due miliardi e mezzo di indirizzi non visualizzati, praticamente la quasi totalità dei risultati è seppellita e inaccessibile.
Un bibliotecario di questi due miliardi e mezzo di pagine ne sceglierebbe tre, se parlassimo di una biblioteca specializzata potremmo arrivare a una decina. Invece con i motori di ricerca tocca a noi utenti fare una gran lavoro per trovare contenuti di qualità.
La bibloteconomia è una scienza illustre, riconducibile al Vallo Adriano⁷. Quello che mi premeva fare in questo scritto era di mettere in evidenza alcune tematiche che il mondo di Internet non ha avuto modo di approfondire e sviluppare adeguatamente. Penso che i nuovi media abbiano molto da imparare dalla biblioteconomia e che gli utenti dovrebbero essere educati maggiormente al loro ruolo, imparando a padroneggiare lo strumento conoscendone limiti e qualità.
Vorrei concludere presentandovi quelle che vorrebbero essere i cinque principi di Internet. Sono stati volutamente e forzatamente riadattati dalle cinque leggi della biblioteconomia di Ranganathan⁸, il padre della biblioteconomia indiana. In particolare “sito web” ha preso il posto di “libro” e Internet ha preso il posto di biblioteca. Nonostante questo le leggi non sembrano aver perso valore:
1. I siti web sono fatti per essere usati
2. Ad ogni utente il suo sito web
3. Ad ogni sito web il suo utente
4. Non far perdere tempo all’utente
5. Internet è un organismo mutevole
¹ M. Valenti, M.P. Carosella, Documentazione e biblioteconomia. Franco Angeli (1998)
² D. Rodighiero, M. Halkia, M. Gusmini, Mapping for Multi-Source Visualization: Scientific Information Retrieval Service (SIRS). Human-Computer Interaction: Interacting in Various Application Domains. 13th International Conference, HCI International 2009, San Diego, CA, USA, July 19-24, 2009, Proceedings, Part IV
³ S. L. Star, Sorting Things Out. MIT Press (2000)
⁴ D. A. Norman, La caffettiera del masochista. Giunti (1996)
⁵ R. M. Pirsig, Lo zen e l’arte della manutenzione della motocicletta. Adelphi (1999)
⁶ J. L. Borges, Finzioni. Einaudi (2005)
⁷ G. Mangani, Cartografia Morale. Franco Cosimo Panini (2006)
⁸ S. R. Ranganathan, The Five Laws of Library Science. Ess Ess Publication (2006)
Tags: bibliotecario, concetto, contaminazione, google, indicizzazione, termine, utente, web 2.0

Un sito deve offrire contenuti efficaci. La fruizione del contenuto è una delle basi per una buona

Come organizzare tutte le informazioni (tante ed eterogenee) sulla città? e che strumenti di ricerc

In TV, un oggetto dedicato all’intrattenimento, ha ovviamente peso anche un aspetto emozionale e

E, se esiste un metodo “univoco” per approcciarsi alla progettazione di una corretta web user ex

Nasce così la Neogeografia: l’insieme delle tecniche e degli strumenti in ambito geografico che c