AAren datu-multzoen alborapen demografikoak kuantifikatzeko metrika bat proposatu dute

Elhuyar Zientzia

Zabaldu:
Twitter
Facebook
Emaila

aaren-datu-multzoen-alborapen-demografikoak-kuanti

Ezkerretik eskuinera, Mikel Galar Idoate, Iris Domínguez Catena eta Daniel Paternáin Dallo, ikerketaren egileak. Arg. NUP

ISC Smart Cities Institutuko Iris Domínguez-Catena informatikariak eta kideek (NUP) metrika batzuk diseinatu dituzte, adimen artifizialeko ereduak entrenatzeko erabiltzen diren datu-multzoen alborapen demografikoak kuantifikatzeko.

Izan ere, azaldu dutenez, adimen artifizialeko sistemetan gutxi edo gaizki ordezkatuak egoten dira talde demografiko jakin batzuk; adibidez, emakumeak, 70 urtetik gorako pertsonak eta pertsona beltzak. Horren ondorioz, baliteke halako datuekin trebatutako adimen artifizialeko sistemek gaizki jokatzea, eta populazio talde jakin batzuek diskriminazioz tratatzea.

Adibidez, ikertzaileek baieztatu dute curriculumak iragazteko sistema batzuek sistematikoki baztertzen zituztela emakumeenak ziruditen curriculumak. Eta adimen artifizial generatiboaren kasuan, ChatGPT sistemarenean adibidez, ohartu dira generoa zenbait lanbiderekin lotzen duela, eta arraza talde batzuk, berriz, ezaugarri negatibo batzuekin.

Ikerketa IEEE Transactions on Pattern Analysis and Machine Intelligence aldizkarian argitaratu da, eta aurpegiko adierazpenen ezagutza automatikoan oinarrituta dago; hau da, pertsonen argazkietan, zer emozio adierazten duten asmatzen duten sistemei buruzkoa. Sistema horiek aplikazio garrantzitsuak dituzte medikuntzan (haurtxoen min-seinaleak detektatzeko), laguntzeko robotikan (adinekoei laguntzeko, batez ere) eta ikus-entzunezkoen sorkuntzan.

Alborapen-mota bat baino gehiago

Hala, aipatutako sistemak entrenatzeko erabiltzen diren datu-multzoak aztertu dituzte (hogei baino gehiago). Eta ikusi dute datu-multzoetan orekatua egon ohi dela gizonen eta emakumeen presentzia; ez, ordea, adina eta arraza. Izan ere, 20 eta 30 urte bitarteko pertsona zurien datuak askoz gehiago dira beste talde batzuetakoenak baino, eta, horren ondorioz, litekeena da adimen artifizialeko ereduek 70 urtetik gorakoak eta emakume arrazializatuak diskriminatzea, besteak beste. Halako alborapenei ordezkaritza-alborapen deitzen zaie.

Baina ez da adimen artifizialeko sistemek duten alborapen bakarra. Hain zuzen, beste gauza bat ere egiaztatu dute: datu-multzo askotako emakume zoriontsuen kopurua gizonezkoena halako bi da ia-ia; haserre ageri diren emakumeen kopurua, aldiz, gizonezkoenaren erdia. Horrek sistemari iradokitzen dio pertsonaren generoa edo sexua eta zoriona edo haserrea erlazionatuta daudela. Alborapen estereotipiko deritze halakoei.

Guztira, 17 metrika aztertu dituzte alborapen-mota guztiak kuantifikatzeko, eta hortik ondorioztatu dute zein diren egokienak datu-multzo batean dauden alborapenak kuantitatiboki neurtzeko, hori baita lehen pausoa, adimen artifizialeko ereduetara alborapenak transferitzea eragozteko eta haien eragina txikitzeko.