giovedì 25 aprile 2013

Il metodo di Lachmann ai tempi di Google



Rispetto ai suoi colleghi scientifici il laureato in materie umanistiche forse ha una marcia in più: il mondo dell’informazione –inteso come metodo di ricerca, lettura e analisi dei segni- è il suo mondo. Oggi ci troviamo in una situazione simile a quella di Edison e Siemens, quando alla fine dell’Ottocento crearono le grandi compagnie elettriche. Entrambi dovettero reclutare i primi tecnici dell’elettricità fra i telegrafisti –gli unici che avevano competenze appropriate. Un esempio più vicino alla nostra sensibilità ci viene da Walter Benjamin a proposito del “riciclarsi” dei pittori di miniature, che già verso il 1840 diventarono “fotografi professionisti, dapprima a tempo perso, poi in modo esclusivo. Le esperienze derivanti dal loro precedente mestiere erano loro d’aiuto, e l’alto livello delle loro realizzazioni fotografiche è dovuto non alla loro preparazione artistica bensì alla loro perizia artigianale”. Entrambe le vicende ci suggeriscono che l’innovazione tecnologica fa emergere professionalità e mestieri ibridi, e che in un determinato momento storico si apre uno spazio molto vasto per la sperimentazione e la creatività dei singoli. Successivamente il sistema si stabilizza e a poco a poco gli spazi si chiudono: nascono gli equilibri monopolistici e i cartelli e le istituzioni educative fissano i percorsi di formazione. In questo momento il problema maggiore è la consapevolezza, soprattutto da parte degli umanisti, di queste potenzialità professionali e del poco tempo a nostra disposizione. Gli umanisti devono far sentire la loro voce lì dove le nuove tecnologie tracciano i contorni delle professioni future. Un futuro dal quale il  bias della testualità, come abbiamo visto, non è affatto bandito.

Concludendo, mi pare di poter dire che, grazie alla digitalizzazione, le humanities stanno uscendo dalla loro “infanzia”. È stata un’infanzia dorata, all’interno di un giardino elitario: l’alfabetizzazione. Questo è un problema che il libro, da solo, non ha saputo risolvere. Certo non possiamo dare la colpa (o il merito) ai supporti, ma è lecito sperare che il computer acceleri i processi di diffusione della lettura e della scrittura e, insieme, ci aiuti ad andare oltre. La rete è già adesso uno strumento di comunicazione e insieme un’architettura di conoscenza più aperta e più complessa del mondo della stampa. Il documento scritto –pensiamo alle leggi e alle carte costituzionali- ha impiegato secoli per raggiungere, e poi per creare (e solo in alcuni paesi), un pubblico di massa. La televisione lo ha fatto in una generazione. Internet lo farà in un paio di decenni. L’umanista informatico –manipolatore di segni- non può che rallegrarsene" Domenico Fiormonte

Come avrete intuito dall'inizio del post (e anche dalla conclusione dello scritto che si propone in Pdf), Il primo scritto di questo blog non è dedicato solo alla filologia (nelle prossime "puntate" si comincerà a parlare della stessa definizione e quest'iscrizione sarà cancellata e sostituita con un link e questa sarà solo una delle tante varianti virtuali): "Il metodo di Lachmann ai tempi di Google" è il tanto breve quanto ambizioso scritto, che dal relatore venne definito "come fare una tesi in filologia della letteratura italiana senza parlare della letteratura italiana" (definizione in realtà errata perché vengono citati grandi italiani, da Dante ai filologi italiani che hanno contribuito al dibattito filologico internazionale, anche se bisogna ammettere che un grande, nel breve, spazio è dedicato principalmente al mondo dei motori di ricerca, di Internet e del Metodo di Lachmann per la sua importanza didattica) ...





... di Paolo Maria Addabbo: una tesi per laurea triennale in "Studi Italiani" poco acclamata dai suoi docenti e leggermente corretta dalla versione cartacea originale consegnata e, a differenza dell'ultima, priva di striminzite biografia e sitografia finali (anche perché, sua colpa, fu presentata in "estremo" ritardo e non raggiunse mai i livelli "onnicomprensivi" meditati in almeno un anno fuoricorso e i commenti seduta furono del tipo "la biografia insomma, solo Tizio e Caio, eh è striminzita, inutile anche solo pensare di affermare, cosa che feci "ma c'è la sitografia e poi il vero ispiratore che mi ha dato qualche nozione di Informatica in quanto l'ho conosciuta davvero è Semproni, non Caio e Tizio che sarebbe lei"). Per questo, salvo successi inaspettati, proprio perché... "mai dire mai"... almeno per adesso si risparmiano di citare anche i due (ispiratori e relatore) docenti che con i loro esami (ma, per i posteri saranno codici incomprensibili, soprattutto per i 509 è meglio parlare di "moduli") continuano a spronarmi nel cercare di avvicinare le scienze informatiche a quelle umanistiche, e in particolare alla disciplina che si occupa dello studio dei testi. Cercando di "fissare" e proporre concetti e metodi che, dall'era dei manoscritti a quella del web e di internet, sono alla base di qualunque testo, si forniranno anche definizioni "basilari" in campo filologico e SEO, come quelle legate ai motori di ricerca e al metodo di Lachmann. E soprattutto si ringraziano quanti vorranno contribuire al blog tramite i commenti, anche con correzioni e critiche aspre perché, soprattutto in campo informatico, c'è sempre da imparare e per chi ha redatto questo scritto c'è "tutto" da imparare dato che non ha mai nemmeno studiato l'HTML o altri linguaggi di programmazione, ma ha sviluppato questo scritto e altri progetti sfruttando semmai delle nozioni apprese da corsi universitari mirati a fornire, appunto, le nozioni "informatiche" per gli studenti di materie umanistiche, quindi corsi che per esempio non insegnano l'HTML ma ne esemplificano il funzionamento e spiegano che che cosa sono i linguaggi di markup (ma non posso addentrarmi, non ho le competenze e sono uno studente pessimo per cui per adesso solo: no comment e non ricordo)...
Inoltre anche il giornalismo, avendo coinciso la mia laurea con la fine del mio percorso da aspirante pubblicista, e tutti i tipi di "testi" giocano un ruolo importante in questo elaborato e si ricercano,si presume di averli già trovati anche se molti li sfruttano quotidianamente nella vita di tutti i giorni più o meno inconsapevolmente e da punti di vista infulenzati dalla propria formazione culturale, spunti di innovazione nell'editoria e negli strumenti quotidiani come i motori di ricerca anche dalla filologia classica.

 Questa premessa è doverosa per capire lo spirito con cui è stato realizzato questo scritto, con la speranza che anche in concetti semplici di persone "non addette ai lavori" si provi a realizzare motori di ricerca, articoli di giornale e magari un giorno anche linguaggi di programmazione migliori! Magari tramite questo blog si potranno raggruppare idee interdisciplinari e, siccome ha un carattere personale almeno per adesso, sperò rifletterà anche la mia evoluzione in nuovi campi del sapere e nei vecchi (non si finisce mai con le lacune). In particolare questo periodo di pagina 32 riportato di seguito, potrebbe essere utile a un dibattito sui motori di ricerca, e magari negli ambienti e sui forum specializzati se ne parlerà già in forme più evolute e quindi quello che dico sarà una realtà da tempo, o ancora da ignorante "informatico" non considero eventuali problemi o assurdità... Comunque:
un primo criterio per un motore di ricerca che si appresti ad abbattere la concorrenza di Google, oppure uno strumento per implementare quest’ultimo, (aggiungendo una sorta di funzione in stile "mi sento fortunato", per esempio "tutto in un post" = quante più parole possibili vicine, o meglio ancora "marcate" in un solo articolo definito che dà al 100% la possibilità di trovare parole non, per esempio, nel tag e nell'articolo, ma solo nell'articolo; marcatore che sarebbe incorporato di base per le maggiori piattaforme blogging) potrebbe essere un algoritmo che consideri e  sia in grado di riconoscere quando in una pagina web due risultati si trovano in post diversi (difficilmente si potrebbe imporre ai webmaster un marcatore specifico che separi “nettamente” i diversi post, dato che solo un motore di ricerca importante come Google riesce a imporre le sue politiche ai SEO e ai Webmaster, ma c’è da dire che gli algoritmi esistenti sono già in grado di discernere le diverse componenti di una pagina web, ossia l’articolo principale, le scritte riconducibili a sponsor o ad altri messaggi della testata ecc.). Naturalmente una maniera per ovviare al problema è stata già pensata: schiacciando un apposito tasto, e quindi senza aprire il link dalla pagina dei risultati, si può visualizzare l’anteprima della pagina che, nella stragrande maggioranza dei casi, mostra la posizione delle parole cerchiandole in rosso, e possiamo quindi renderci conto se le parole sono nella stessa parte della pagina, nello stesso articolo o post (magari schiacciando il "prototipo", l'ipotetico bottone "tutto in un post" si potrebbe avere accesso a una pagina con meno risultati e più spazi alle anteprime, invece dei "3 puntini" che spesso non riescono a far capire se le diverse parole della frase sono vicine o meno, senza aprire la pagina e schiacciare "ctrl+f" per cercare le parole esatte o perdere tempo leggendo l'articolo che non soddisfa la nostra ricerca e già dall'inizio "non ci sentivamo fortunati"). Ancora a onor del vero bisogna ricordare che in realtà il parametro della “distanza” tra una parola e l’altra è un criterio che notoriamente viene già valutato dagli algoritmi dei motori, algoritmi che ovviamente rimangono coperti dal segreto industriale e di cui si può solo intuire il funzionamento, oltre al fatto che vengono puntualmente cambiati










COME UN FRAMMENTO DELLE ANTICA MURA DI UNA CASA, SVELATO DA UNA TRASPARENZA NELLE NUOVE PARETI, LASCIO MATTONELLE USATE MENRE PREPARAVO IL POST, GRAZIE PER LA PAZIENZA E APPROPRIATEVI PURE DELLE MIE IDEE SE FOSSERO UTILI, PURCHé SI CERCHI UN ARRICCHIMINTO COMUNE... E FORSE LO SI Fà ANCHE PER PIGRIZIA




tesi
un errore sicuro cfr invece citato da fusi


articoli da cui sono tratte o "collegate" le immagini
http://www.independent.ie/business/technology/google-is-watching-you-26292810.html

http://www.guardian.co.uk/technology/2012/mar/01/eu-warns-google-over-privacy

http://www.guardian.co.uk/commentisfree/2012/mar/01/google-watching-you-privacy-policy

http://www.independent.co.uk/news/science/google-is-watching-you-6154523.html
http://www.businessspectator.com.au/article/2013/1/16/telecommunications/big-google-watching-you

Nessun commento:

Posta un commento