AI no va descodificar el críptic manuscrit de Voynich, sinó que es va afegir al misteri
Les afirmacions sobre la intel·ligència artificial per “trencar” el codi de fa 600 anys només eren un pensament desitjós

Si estiguéssiu compilant una llista dels 100 objectes més estranys del món, només els més estranys coses que la civilització humana ha excretat al llarg dels mil·lennis; llavors hauríeu de deixar lloc en algun lloc per al manuscrit Voynich. Té 600 anys, està escrit en un idioma que ningú no pot llegir i ple de diagrames que ningú no entén. És un misteri genuí, de bona fe i de classe mundial. Probablement per això, quan les redaccions de tot el món van tenir aquesta setmana la possibilitat de publicar històries afirmant que la intel·ligència artificial les havia descodificat, van saltar a l’oportunitat.
Llevat, és clar, no ho ha estat. No del tot. Segons els experts, el manuscrit Voynich continua sent tan inescrutable com sempre. Però entendre per què aquesta nova investigació no descodifica el text i què afegeix exactament als anals de la voynicologia té el seu propi valor. També subratlla (si calgués més èmfasi) que aquest manuscrit és una cookie extremadament estranya.
nintendo divendres negre
La investigació que va provocar la cobertura és un document anomenatDescodificació de textos anagramats escrits en un idioma i un script desconeguts. Es va publicar el 2016, però va ser presentat en una conferència l'any passat i recollit pels periodistes a principis de mes. En ell, el professor d’informàtica Greg Kondrak i l’estudiant de postgrau Bradley Hauer descriuen un mètode per trobar el llenguatge d’origen dels textos xifrats, abans d’invertir aquest mètode en el propi manuscrit i decidir que originalment estava escrit en hebreu, abans de codificar-lo en el seu document actual. forma.
És una afirmació que, de ser cert, seria un trencament de la mida d’una glacera en un cas fred. El manuscrit Voynich de 240 pàgines està escrit en unalfabet desconegutaixò no s’ha vist mai abans ni des d’aleshores. El guió consta d'aproximadament 25 a 30 personatges individuals (les interpretacions varien) escrites d'esquerra a dreta amb una sola mà elegant. Hi ha escampats per tot arreuil·lustracionsde plantes no identificables, diagrames astrològics, doodles de castells i dracs i una secció particularment estranya que mostra dones nues banyant-se en piscines connectades per tubs que flueixen. Sembla el mapa d’un antic parc aquàtic, però els estudiosos suggereixen que podria tenir una intenció mèdica o alquímica.

La majoria assumeixen que el manuscrit està escrit amb el que s’anomena xifratge de substitució. Aquest és un dels tipus de codis més senzills i antics, en què es canvien les lletres d’un alfabet establert per les inventades. El problema és que centenars d’anys d’estudi no han pogut treballarquinidioma en què es va escriure originalment el manuscrit Voynich.
Ningú no ha defensat mai cap cas convincent per a cap idioma concret, explica Lisa Fagin Davis, directora executiva de l'Acadèmia Medieval d'Amèrica i entusiasta erudit de Voynich.The Verge. He vist suggeriments que codifiquen l’àrab, l’asteca, els gitanos, el llatí i l’italià. Davis diu que la gent tendeix a estudiar les proves paleogràfiques, forenses i artístiques per trobar un país d'origen i, amb això, un llenguatge d'origen, però afegeix que també s'utilitza l'anàlisi computacional.
És aquesta eina que Kondrak i Hauer van recollir en el seu intent de deconstruir el manuscrit. Van imaginar, com molts criptòlegs anteriors, que calculant certes qualitats del text, com, per exemple, la freqüència amb què apareixen cada lletra i cada combinació de lletres, podrien crear una empremta digital estadística que es podria comparar amb altres idiomes.
Es poden imprimir tots els idiomes segons estadístiques com la freqüència de lletresPer tant, van formar diversos algoritmes per seleccionar aquestes mètriques, utilitzant la Declaració Universal dels Drets Humans com a text de mostra en 380 idiomes. (Malgrat el que suggereixen algunes cobertures, aquest procés no implicava xarxes neuronals ni aprenentatge profund, sinó una bona anàlisi estadística a l'antiga, també conegut com un munt de recompte i percentatges.) I va funcionar. No massa mal de totes maneres. Segons el professor Shlomo Argamon, lingüista computacional de l'Illinois Institute of Technology, els resultats de les proves preliminars són potser lleugerament qüestionables, però no més que molts altres resultats publicats sovint a la literatura científica. Així doncs, amb el seu equiparador de patrons algorítmic entrenat i provat, Kondrak i Hauer van recórrer al manuscrit de Voynich. Aquí, diuen els experts, és on les coses realment van començar a baixar.
El problema no és un error únic, sinó una sèrie d’assumpcions i omissions que donen a Kondrak i Hauer més marge d’interpretació dels seus resultats del que no és científicament rigorós.
El primer és força senzill: el seu algoritme es va formar en llenguatges actuals, però el manuscrit està datat al carboni al segle XV. Per tant, si s’escrivís originalment en hebreu, hauria estat escrit en hebreu del segle XV. La gramàtica, l'ortografia i el vocabulari haurien estat força diferents, especialment per a un manuscrit com el Voynich que té un caràcter científic (a diferència del bíblic o litúrgic), diu Davis.
La segona és que, tot i que l’algorisme de Kondrak i Hauer pot produir suggeriments per a llenguatges d’origen de textos xifrats, no avalua laprobabilitatd'aquests partits. Per tant, quan la parella diu que l’hebreu va ser el partit amb més puntuació del manuscrit sense valorar-ne la probabilitat, es tracta d’una presumència una mica inútil.Algúha de tenir la puntuació més alta, diu Argamon. Esmenten alguns dels altres millors partits. Com recordo, un era el malai, que és una llengua molt, molt diferent de l’hebreu.
La tercera suposició és potser la més gran: Kondrak i Hauer afirmen que, a més de ser un xifratge de substitució, el manuscrit Voynich també s’escriu en anagrames, de manera que les lletres de cada paraula es barregen. Aquest no és un nou suggeriment en el món de la voynicologia, però està lluny d’una veritat establerta. També configura perfectament el floriment final de la investigació de Kondrak i Hauer: traduir la frase inicial del manuscrit Voynich a l’anglès.

La frase en qüestió és la següent: va fer recomanacions al sacerdot, home de la casa, a mi i a la gent. Kondrakdiu, És una mena de frase estranya començar un manuscrit, però sens dubte té sentit. Però fins i tot dins del diari, ell i Hauer descriuen com van haver de falsificar la traducció per produir aquest resultat. El primer intent no va ser del tot coherent, va dir un parlant d’hebreu modern, i van haver de fer un parell de correccions ortogràfiques abans d’introduir els personatges al Google Translate per produir el resultat anterior. (Sempre que hagueu de recórrer al Traductor de Google per sobre d'algú que realment hagi estudiat l'idioma, perdeu certa credibilitat, apunta Fagin).
Però és aquí on la suposició que el manuscrit s’ha escrit en anagrames esdevé encara més crucial. Argamon assenyala que l’hebreu escrit és el que es coneix com a abjad, és a dir, un guió sense vocals. Si suposeu que el manuscrit va ser escrit en hebreuique està escrit en anagrames, es fa molt més fàcil de traduir. Aleshores, no només podeu reordenar tots els caràcters d’una paraula per trobar alguna cosa que tingui sentit, sinó que podeu afegir-hi les vostres pròpies vocals. Argamon diu que això significa que moltes seqüències aleatòries de lletres formen paraules coherents. Afegiu-ho amb el fet que Kondrak i Hauer van fer correccions ortogràfiques i es van basar en Google Translate (un programari que sembla tan dur per obtenir contingut significatiu, que sovint converteix la tonteria en frases coherents) i podeu veure per què els experts són escèptics.
El seu mètode [...] els dóna una latitud enormeLa qüestió aquí és que el seu mètode [...] els dóna una gran latitud a l'hora de fer aquest tipus d'interpretació impressionista, diu Argamon. Agafen aquesta frase descodificada, la miren a través d’ulleres gruixudes i diuen que és prou bo per a nosaltres. Nick Pelling, aExpert Voynichque ha escrit molt sobre el tema, és més contundent. Quan se li demanaThe VergeQuina possibilitat creu que les conclusions del document són correctes, diu: Tan a prop del 0%, ja que no fa diferència pràctica.
Llavors, la IA descodifica un misteriós manuscrit de 600 anys? No tant.
Per ser justos amb Kondrak i Hauer (i com sol passar amb aquestes històries), els mitjans de comunicació mereixen sens dubte una gran culpa per l'exageració. La parella admet que la seva investigació és només un punt de partida i els experts amb qui hem parlat van reconèixer la utilitat dels seus algorismes subjacents. Els experts diuen que es van perdre massa passos per començar a fer reclamacions sobre el propi manuscrit.
I, en molts aspectes, té sentit que els intents de trencar el manuscrit de Voynich mitjançant intel·ligència artificial estiguessin coberts tan sense alè. A Nova Yorkerarticlesobre la història del manuscrit el descriu com el llenç perfecte sobre el qual projectar les nostres preocupacions sobre el difícil, l’espantós i l’arcà, i es podria dir el mateix sobre la IA. En el panorama mediàtic contemporani, aquest complex i complex grup de tecnologies s’utilitza sovint com a substitut de les pors sobre l’automatització i la intel·ligència de la màquina incognoscible (i incontrolable). Enfrontar AI contra el manuscrit Voynich és com veure Godzilla lluitant contra Mothra: l’espectacle és tan divertit que no ens importen ni pensem massa en els detalls.
Tot i això, per als experts, el fet que el manuscrit sigui impenetrable pot ser un alleujament. Al cap i a la fi, si heu passat anys i anys de la vostra vida intentant descodificar un misteriós document, probablement seria un cop dur si alguna màquina sense sang l’esquerda durant la nit.
Com deia Pelling en un correu electrònic final: A través del meu llibre [...] i del meu bloc, probablement he escrit una investigació històrica més real sobre el Voynich que qualsevol altra persona viva: hi he parlat i he realitzat un documental televisiu. en ell, i m'han entrevistat moltes vegades a la ràdio i la televisió ... I encara no el puc llegir. :-) El misteri continua.