¿Quién es el autor del libro?

Un nuevo estudio por ordenador puede ayudar a identificar al autor de un libro. Un programa informático desarrollado recientemente en Italia permite detectar diferencias entre autores que hasta ahora no podían verse. Este algoritmo construye un árbol lingüístico entre 50 lenguas diferentes. Esta diferenciación lingüística no es difícil en un texto, pero la diferenciación de estilo es la que más trabajo tiene.

Investigadores de la Universidad de La Sapienza analizan la lengua escrita como una cadena de símbolos. En estas cadenas de símbolos se observa la entropía, es decir, la secuencia de repetición de ciertos símbolos. De esta forma se consigue resumir las frases sin perder significado. Esta es la base de los programas de ordenador que realizan compresión de los datos. Utilizando esta base, los investigadores pueden calcular la entropía de dos cadenas de letras. Esta distancia entre entropías suele ser mayor entre textos de distintos autores que entre textos de un mismo autor.

Babesleak
Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Saila