Solo pochi mesi fa, la scorsa estate, il padre gesuita Roberto Busa ha deciso di donare alla Biblioteca d’Ateneo dell’Università Cattolica la sua raccolta di libri (circa 1400 volumi) e un archivio personale fatto di appunti, lettere e fotografie in grado di raccontare una vita spesa nella doppia vocazione della preghiera e della ricerca. Tutto il materiale donato sarà presto messo a disposizione degli studenti e dei ricercatori, «per tramandare – come ha detto nei giorni scorsi lo stesso padre Busa, alla soglia dei 97 anni – un sapere pluridisciplinare come la linguistica computazionale, per la fondazione della quale molto ho lavorato».
Quando nel 1942 i superiori inviarono Busa, appena laureato, all'Università Gregoriana di Roma per prepararsi alla libera docenza in filosofia con l’incarico di studiare la dottrina della “presenza” in san Tommaso d'Aquino, il giovane ricercatore si accorse subito che qualcosa nell’approccio alla ricerca non tornava. «Dopo sei mesi di lavoro – racconta lo studioso – mi accorsi che tale parola nel lessico dell'Aquinate è periferica, mentre è centrale la preposizione "in". Ricominciai quindi da capo, scrivendomi a mano in 10.000 schede altrettante frasi contestuali di questa proposizione. Ne uscì un libro che pubblicai. Ne vennero fuori anche due certezze. La prima, della pregnanza filosofica delle particelle; la seconda, che l'analisi linguistica di testi di grandi dimensioni non poteva essere compiuta che con macchine automatiche».
Sette anni dopo, nel 1949, Busa partì per New York, dove chiese a Thomas Watson, allora presidente della Ibm, di mettere a punto degli strumenti informatici in grado di indicizzare l’Opera omnia di San Tommaso. Dalla collaborazione – durata nei decenni – tra il gesuita e l’azienda informatica statunitense nacque l’Index Thomisticus: 56 volumi, pubblicati tra il 1976 e il 1980, frutto di 18 milioni di ore di lavoro e che riportano i 9 milioni di parole usate da San Tommaso. È l’atto di nascita della linguistica computazionale, un ambito di ricerca a metà strada tra gli studi umanistici e l’informatica, in cui l’intelligenza artificiale delle macchine è messa al servizio della linguistica come della filologia.
Appena pubblicata, l’opera di padre Busa suscitò le attenzioni dell’Università Cattolica, in particolare del professor Gianfranco Bolognesi che invitò il religioso invitato a tenere i primi seminari di linguistica computazionale presso l’istituto di Glottologia. Dalle prime lezioni senza contratto alla cattedra da ordinario il passo fu breve e anche dopo il pensionamento di Busa alcuni allievi decisero di proseguire la sua ricerca. Nel 2006 l’attività del gruppo di studiosi della Cattolica venne istituzionalizzata prendendo il nome di Centro interdisciplinare di ricerche per la computerizzazione dei segni dell’espressione (Circse). Filologi, informatici, linguisti, matematici e filosofi lavorano fianco a fianco in una sinergia in grado di raccogliere i frutti di un metodo sintetizzato nelle parole “Computer in the Humanities”. «Oggi – spiega Savina Raynaud, docente di Filosofia del linguaggio e direttrice del Circse – il progetto principale di prosecuzione del lavoro avviato da padre Busa va sotto il nome di Index Thomisticus Treebank. Si tratta di un processo di annotazione sintattica degli stessi testi indicizzati da padre Busa. In sostanza, si tratta di passare dal lessico alla sintassi, ricostruendo tramite appositi programmi del computer gli alberi sintattici degli enunciati presenti dell’opera dei San Tommaso». «L’impresa ciclopica di padre Busa e l’attività di ricerca portata avanti dalla nostra Università – conclude Savina Raynaud – rappresentano uno strumento ricco a disposizione di chi studia il latino e la cultura medioevale, permettendo di ricostruire la storia della lingua latina successiva all’età classica».