Al costat de la digitalització de mostres d'història natural acumulades al llarg dels segles, la revolució tecnològica ha portat amb si oportunitats de big data en el camp de la biodiversitat. Per a conèixer la distribució de les espècies es disposa en una successió de clics de la informació més abundant i detallada de la història. No obstant això, la pròpia quantitat d'informació pot comprometre la credibilitat dels mapes de biodiversitat.
Edward O. Wilson va proposar el terme biofilia per a reivindicar la vocació congènita de l'ésser humà cap als éssers vius. Una vegada garantida l'alimentació i la protecció, l'home va començar a investigar i classificar als éssers vius des d'una perspectiva inútil [1]. Des de llavors portem segles treballant a completar i comprendre el puzle de la biodiversitat.
XVII. i XVIII. Els segles 15 van ser testimonis de múltiples exploracions de la naturalesa. En aquells temps també es van iniciar exposicions de col·leccions biològiques. Exemples d'això són el Museu d'Història Natural de París, fundat en 1635, o el Kunstgela, fundat fa uns 300 anys per Petri I de Rússia, en el qual es van exposar al públic col·leccions d'animals de tot el món [2] (incloent formes animals poc habituals).
A més dels abundants descobriments de noves espècies, el XIX ens va deixar treballs pioners en la comprensió de la distribució de les formes de vida (biogeografia) i de l'origen (evolució). segles. Humboldt, Wallace i el mateix Darwin es van basar en l'observació de la biodiversitat per a materialitzar les seves idees; tractant de respondre a preguntes sobre la biodiversitat, convertint la biodiversitat en un petó.
XX. En el segle XX va prosseguir la catalogació d'espècies i la documentació de la seva distribució. Per a l'any 2000, els museus i herbaris comptaven amb prop de 3 bilions d'especimenes [3].
A pesar que el llegat dels segles és impressionant, la revolució tecnològica de les últimes dècades ha deixat petita aquesta barrera. El desenvolupament de repositoris de dades i eines digitals (apps, GPS, Telèfons intel·ligents) han permès una recollida massiva d'informació, al mateix temps que s'ha aconseguit la “democratització” de la catalogació de la biodiversitat. En l'actualitat, la major part de les dades de distribució de les espècies són recollits per voluntaris en una mesura diferent a l'anterior. Per exemple, en el Global Big Day han participat més de 28.000 persones de 170 països i s'han registrat 1,6 milions de registres de 6.899 espècies d'ocells (2/3 de les conegudes) [4].
Al costat del desenvolupament de noves formes de recollida de dades, en els últims anys s'han produït importants canvis de paradigma en la propietat de les dades. S'han obert milions de dades que estaven recollits en museus i herbaris, sense límits i de manera gratuïta per a l'usuari. Tot això ha facilitat el desenvolupament de plataformes d'intercanvi d'informació [5]. Global Biodiversity Information Facility (GBIF) és la plataforma més coneguda a nivell mundial que ha posat registres unificats i estandarditzats d'espècies de més d'1 reunió per a la seva consulta online.
La utilitat de la informació genera noves oportunitats en àmbits com l'econòmic (per exemple, a través del turisme de la vida salvatge), l'educatiu, l'etnobotánico i, per descomptat, la conservació de la biodiversitat. De fet, els mapes de biodiversitat són fonamentals per a resoldre múltiples qüestions ecològiques i de conservació, entre elles: Com es distribueixen les espècies? Quin paper juguen en aquest patró de repartiment les condicions ambientals actuals i passades i els factors geogràfics i ecològics? Quins són els punts més calents de la biodiversitat? Com ha canviat la distribució d'una determinada espècie (per exemple, una espècie invasora, amenaçada)? Com canviarà en el futur? Per descomptat, totes aquestes respostes poden tenir una importància cabdal per a fer front a les conseqüències dels canvis antropogènics [6].
Si bé fins al moment hem realitzat l'apologia de la informació disponible, el major repte és garantir la qualitat de la pròpia informació. Tota entrada d'informació, bé sigui una dada recollida en la muntanya o provinent d'una antiga font d'informació (inclosa la literatura grisa), ha de ser validada abans de donar el vistiplau al digitalitzat. La majoria de les plataformes d'informació subministradores segueixen protocols estrictes de detecció i neteja de possibles errors (per exemple, taxonòmics, associats a georreferenciación) i existeixen nombroses eines de suport per al postprocesamiento de la informació (per a aconseguir una homogeneïtzació taxonòmica, per a la neteja de dades duplicades i georreferenciales erronis, etc.). No obstant això, no sol ser un treball lent aconseguir que la informació tingui un nivell mínim de qualitat i, a vegades, aquestes operacions de garbellat poden suposar l'exclusió de molta informació. Per tant, a més de la quantitat, la qualitat limitarà la grandària de la informació efectiva (figura 1).
Atès que la majoria dels espècimens i els registres de localització de les espècies s'han rebut sense planificació, la distribució de la informació no és homogènia entre els grups taxonòmics, ni en l'espai ni en el temps [7]. Així mateix, la combinació de diverses fonts d'informació pot suposar un augment de l'heterogeneïtat, fins al punt de comprometre la credibilitat dels mapes de biodiversitat.
Tradicionalment, alguns grups taxonòmics han adquirit major atenció que uns altres (figura 2). A pesar que totes dues experiències poden ser fascinants, la gent tendeix més a observar els ocells que a fer col·leccions de caragols. Així mateix, en la mesura en què espècies estranyes, emblemàtiques, amenaçades, etc. són tresors més benvolguts per als amants de la naturalesa, es documenten amb major intensitat, tal com es reflecteix en el nombre de registres de plataformes de biodiversitat.
Així mateix, algunes àrees geogràfiques estan millor muestradas que unes altres. Excepte excepcions, els punts d'informació més calentes són els espais naturals. Les espècies preuades solen actuar com a esquer, ja que les espècies atreuen als amants de la naturalesa als seus llocs de residència [8]. En altres casos, les raons logístiques se centren en la proximitat al domicili del receptor principal de dades, l'existència d'una zona d'accés públic, l'accessibilitat o l'existència d'una zona de monitoratge a llarg termini [9].
Així, tant la tendència taxonòmica com l'espacial poden ser variables en el temps. Això permet conèixer bé la distribució passada d'una espècie, però no l'actual (també a l'inrevés). En el cas més greu la informació pot quedar obsoleta. Per això, és recomanable utilitzar únicament registres d'un període de temps determinat que s'ajustin de manera realista a l'objectiu de recerca, encara que pugui suposar una pèrdua important d'informació.
Les raons de les tendències taxonòmiques, espacials i temporals poden ser molt diverses, segons els casos i segons l'escala. Per raons, és fonamental identificar aquestes tendències i valorar el seu impacte per a poder realitzar anàlisi de biodiversitat creïbles. I en aquest sentit, analitzar el desconeixement pot ser tan important com analitzar el propi coneixement.
El mostreig heterogeni en biodiversitat per espai es reflecteix en les bases de dades: algunes unitats espacials tenen més registres que unes altres. En un mapa de biodiversitat mundial, l'efecte d'aquest esforç de mostreig serà menor pel fet que els gradients de biodiversitat són més marcats. No obstant això, en una escala mitjana o petita, la distorsió de l'esforç de mostreig serà molt més greu: els punts més calents de la biodiversitat es correspondran amb els punts més profunds, mentre que els freds es correspondran amb els poc mostrejats (Figura 3). Darrere d'aquest resultat es troben les corbes d'acumulació d'espècies, que adopten la forma de les corbes de saturació dels enzims: en les primeres mostres corresponents a una unitat geogràfica es recolliran moltes noves espècies; en les següents, cada vegada menys, fins que no es trobin més espècies en la unitat (saturació).
Coneixent en quin punt es troba el procés d'acumulació d'espècies, es pot estimar el grau de coneixement (o grau de desconeixement) de la llista d'espècies. Així (o altres mètodes no paramètrics, vegeu [10]) es pot mesurar si cada unitat geogràfica està bé o malament muestrada i, de pas, determinar la credibilitat del mapa de biodiversitat [11]. A partir d'aquests mesuraments es pot crear un mapa de coneixement que ens ajudi a jutjar si la informació és útil per a respondre a la pregunta que ens ocupa. En alguns casos, les anàlisis de biodiversitat podran limitar-se a unitats “bé” muestradas [12], mentre que en altres casos serà evident la necessitat de més dades.
Per a completar les llacunes d'informació s'ha proposat utilitzar models de distribució d'espècies. No obstant això, els models no són en absolut perfectes i, en la majoria dels casos, no sembla la millor alternativa incorporar més incertesa a un mapa amb un alt grau d'incertesa [8]. Llavors, què? Digitalitzar noves dades (només l'1% de les dades d'herbaris i museus estan georreferenciados [13] o només queda anar a buscar dades a la muntanya, una realitat bruta. No obstant això, hi ha bones notícies, els mapes de coneixement poden ser una eina eficaç per a planificar i optimitzar nous mostrejos. De fet, la promoció de mostrejos en llocs poc coneguts permet maximitzar les aportacions dels nous registres per a elaborar mapes de biodiversitat fiables [14].
En l'era del Big Data tan important com garantir l'accés a la informació és fomentar el seu ús crític. El mesurament del coneixement pot ser el punt de partida per a enjudiciar la credibilitat dels mapes de biodiversitat, així com per a dissenyar mostrejos per a completar-los. No obstant això, els usuaris no especialitzats (gestors, professionals, investigadors de ciències naturals, etc.) haurien de realitzar greus exercicis de programació i modelització per a produir aquest tipus de mapes. És hora, per tant, de trencar aquest coll d'ampolla i d'estendre l'ús de mapes de coneixement a diferents àmbits. Per a això, poden resultar útils eines que permetin visualitzar l'estimació del nivell de mostreig i la seva distribució espacial (p. ex. aplicacions web interactives).
Conèixer quantes peces i on ens falten per a completar el puzle de la biodiversitat pot ser un punt de partida sòlid per a avançar en el coneixement, així com un exercici sincer de rebuig a objectius massa ambiciosos.