Qui és l'autor del llibre?

Un nou estudi per ordinador pot ajudar a identificar a l'autor d'un llibre. Un programa informàtic desenvolupat recentment a Itàlia permet detectar diferències entre autors que fins ara no podien veure's. Aquest algorisme construeix un arbre lingüístic entre 50 llengües diferents. Aquesta diferenciació lingüística no és difícil en un text, però la diferenciació d'estil és la que més treball té.

Investigadors de la Universitat de la Sapienza analitzen la llengua escrita com una cadena de símbols. En aquestes cadenes de símbols s'observa l'entropia, és a dir, la seqüència de repetició de certs símbols. D'aquesta forma s'aconsegueix resumir les frases sense perdre significat. Aquesta és la base dels programes d'ordinador que realitzen compressió de les dades. Utilitzant aquesta base, els investigadors poden calcular l'entropia de dues cadenes de lletres. Aquesta distància entre entropies sol ser major entre textos de diferents autors que entre textos d'un mateix autor.

Babesleak
Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Saila