Quen é o autor do libro?

Un novo estudo por computador pode axudar a identificar ao autor dun libro. Un programa informático desenvolvido recentemente en Italia permite detectar diferenzas entre autores que até agora non podían verse. Este algoritmo constrúe unha árbore lingüística entre 50 linguas diferentes. Esta diferenciación lingüística non é difícil nun texto, pero a diferenciación de estilo é a que máis traballo ten.

Investigadores da Universidade da Sapienza analizan a lingua escrita como una cadea de símbolos. Nestas cadeas de símbolos obsérvase a entropía, é dicir, a secuencia de repetición de certos símbolos. Desta forma conséguese resumir as frases sen perder significado. Esta é a base dos programas de computador que realizan compresión dos datos. Utilizando esta base, os investigadores poden calcular a entropía de dúas cadeas de letras. Esta distancia entre entropías adoita ser maior entre textos de distintos autores que entre textos dun mesmo autor.

Babesleak
Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Saila