Nor da liburuaren egilea?

Ordenagailu bidezko azterketa berri batek liburu baten egilea zein den bereizten lagun dezake. Italian garatu berri duten programa informatiko baten bidez, orain arte ikus ezin zitezkeen egileen arteko ezberdintasunak atzeman daitezke. Algoritmo horrek, hizkuntza zuhaitz bat eraikitzen du 50 hizkuntza ezberdinen artean. Hizkuntza-bereizketa hori ez da zaila testu batean, baina estiloa bereiztean dago lan gehien.

La Sapienza Unibertsitateko ikertzaileek hizkuntza idatzia sinbolo-katea bailitzan aztertzen dute. Sinbolo-kate horietan, entropia begiratzen da, hau da, zenbait sinboloren errepikapen-sekuentzia. Horrela, esaldiak laburtzea lortzen da esanahirik galdu gabe. Hori da datuen konpresioa egiten duten ordenagailuko programen oinarria. Ikertzaileek, oinarri hori erabiliz, bi hizki-kateren entropia kalkula dezakete. Entropien arteko distantzia hori handiagoa izaten da egile ezberdinen testuen artean, egile beraren testuen artean baino.

Babesleak
Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Saila