Une nouvelle étude par ordinateur peut aider à identifier l'auteur d'un livre. Un logiciel récemment développé en Italie permet de détecter les différences entre les auteurs qui jusqu'ici ne pouvaient pas être vu. Cet algorithme construit un arbre linguistique parmi 50 langues différentes. Cette différenciation linguistique n'est pas difficile dans un texte, mais la différenciation de style est celle qui a le plus de travail.
Des chercheurs de l'Université de La Sapienza analysent la langue écrite comme une chaîne de symboles. Dans ces chaînes de symboles, on observe l'entropie, c'est-à-dire la séquence de répétition de certains symboles. De cette façon, vous pouvez résumer les phrases sans perdre de sens. C'est la base des programmes informatiques qui effectuent la compression des données. En utilisant cette base, les chercheurs peuvent calculer l'entropie de deux chaînes de lettres. Cette distance entre les entrées est généralement plus grande entre les textes de différents auteurs que entre les textes d'un même auteur.