O informático e membros do Instituto ISC Smart Cities Iris Domínguez – Catena (NUP) deseñaron métricas para cuantificar os rumbos demográficos dos conxuntos de datos utilizados para o adestramento de modelos de intelixencia artificial.
E é que, segundo explicaron, nos sistemas de intelixencia artificial existen poucos ou mal representados determinados grupos demográficos, como as mulleres, as persoas maiores de 70 anos e as persoas negras. Isto pode provocar que os sistemas de intelixencia artificial formados con estes datos actúen de forma incorrecta e sexan tratados discriminatoriamente por determinados grupos de poboación.
Por exemplo, os investigadores afirmaron que algúns sistemas de filtrado curricular excluían sistematicamente os currículos que parecían femininos. E no caso da intelixencia artificial xenerativa, como o sistema ChatGPT, déronse conta de que asocia o xénero a determinadas profesións, mentres que algúns grupos raciais asóciano a certas características negativas.
A investigación, publicada na revista IEEE Transactions on Pattern Analysis and Machine Intelligence, baséase no coñecemento automático das expresións faciais, é dicir, dos sistemas que inventan nas fotografías das persoas que emocións representan. Estes sistemas teñen importantes aplicacións en medicamento (detección de sinais dolorosos en bebés), robótica de apoio (sobre todo para persoas maiores) e creación audiovisual.
Así, analizáronse máis de vinte conxuntos de datos utilizados para o adestramento dos sistemas mencionados. E han visto que nos conxuntos de datos a presenza de homes e mulleres adoita estar equilibrada, pero non a idade e a raza. De feito, os datos das persoas brancas de entre 20 e 30 anos son moito máis que os doutros grupos e, en consecuencia, os modelos de intelixencia artificial poden discriminar ás persoas maiores de 70 anos e ás mulleres racionalizadas, entre outros. Estes rumbos denomínanse rumbos de representación.
Pero non é o único rumbo que teñen os sistemas de intelixencia artificial. De feito, constátase que o número de mulleres felices en moitos grupos de datos case duplica ao dos homes, mentres que o número de mulleres enfadadas case a metade. Isto suxire ao sistema que o xénero ou o sexo da persoa están relacionados coa felicidade ou o enfado. Denomínanse rumbos estereotípicos.
En total, analizáronse 17 métricas para cuantificar todos os tipos de rumbos, de onde se deduciron cales son as máis axeitadas para medir cuantitativamente os rumbos contidos nun conxunto de datos, primeiro paso para evitar a transferencia de rumbos a modelos de intelixencia artificial e minimizar o seu impacto.