Antigamente as máquinas de escribir mecánicas, como as antigas Underwood, utilizáronse durante moitos anos. Despois, na década dos 70, IBM sacou máquinas eléctricas de bólas e ultimamente multiplicáronse os microordenadores paira escribir textos. No computador pódense facer moitas cousas a través do procesamiento de texto: cortar una parte, pegala noutro lugar, cambiar os tipos de letra, aumentar o rango de liñas, etc. Con todo, tanto en máquinas antigas como no computador, sempre hai teclado paira escribir o texto antes de imprimir.
Con todo, hoxe en día, no que se están renovando os costumes por todas as partes, aparecen computadores sen teclado. Grazas aos avances en miniaturización, os fabricantes de computadores conseguiron que máquinas tan potentes como as anteriores metéronse nun tamaño mediano e de 2 centímetros de espesor. Pódense utilizar no taller, no bus, na rúa e en calquera lugar. E é que, sen chegar aos 500 gramos de peso, estes aparellos dispoñen de pantalla e unidade central de proceso. O teclado substitúese por un lapis que permite escribir directamente na pantalla (coma se escribísese na páxina). Baixo o nome de Newton, Apple sacou este aparello. O PDA ( Persoal Dixital Assistant ) é a palabra que xeralmente se utiliza paira designar estes aparellos e consta basicamente de “folla” (pantalla) paira escribir o computador, a axenda e as notas.
Paira utilizar estes computadores non fai falta saber moito, xa que basta con saber escribir. Pero o computador ten no seu interior os sistemas informáticos máis desenvolvidos: pantalla sensible, procesador RISC, redes neuronais, etc. Todos eles son necesarios paira levar a cabo o traballo que pode realizar calquera neno, paira coñecer as letras escritas.
Esta operación realizámola todos os días automaticamente cando lemos, e intuitivamente identificamos máis que letras. Cando atopamos una palabra descoñecida, primeiro temos que descifrala e tomar conciencia do seu significado, e logo identificámola con facilidade. Coñecemos os caracteres desde o contexto. Con todo, como saberá a máquina se I ( maiúscula i) ou l (bilingüe minúscula)? É 0 (cero) ou ou ou (vogal)? O computador, en verdade, non adoita estar ben formado con intelixencia e adoita ser difícil coñecer a escritura.
Os computadores utilizan paira iso os programas OCR ( Optical Character Recognition ). Estes programas iniciáronse na década dos 80 cun futuro prometedor. En varios bancos, departamentos administrativos e oficinas podíanse informatizar os documentos que contiñan miles de toneladas de papel e, de paso, había un mercado de millóns de dólares paira os programadores.
Calquera tecnoloxía utilizada paira o recoñecemento de caracteres ten en primeiro lugar a etapa de numerización. O documento pasa por un escáner paira extraer a imaxe informática. Paira esta operación o escáner dispón dunha barra de diodos de luz que ilumina cada una das partes do documento. A luz reflectida no papel é analizada polo escáner, decidindo si é branca ou negra.
Una vez finalizada esta operación, trátase dunha imaxe formada por puntos negros e brancos que non teñen ningunha organización lóxica. O programa de recoñecemento determinará a continuación os caracteres destes conxuntos de puntos. Una vez identificados os caracteres se codificarán no sistema binario paira a súa posterior utilización no computador.
Existen dous sistemas de identificación de caracteres: o matricial e o topológico. No sistema matricial, o programa contén una lista ou colección de modelos e compara cada carácter que atopa no documento cos que contén na súa colección. Hai moitos problemas. Por exemplo, si os caracteres do documento están demasiado próximos entre si, é difícil que o sistema os trate individualmente. Neste caso atopa un gran número de puntos e non se parece a nada da súa colección.
Ademais, se o documento ou papel orixinal non é de boa calidade (papel malo, amarelado, etc.). si é así), é difícil identificar caracteres. Ademais, en ocasións pode ocorrer que no documento orixinal utilícese un tipo especial de letra, e que o programa na súa colección non o teña. Neste caso o programa debe “aprender” estes caracteres. O programa mostra un a un os caracteres que non coñece e o usuario debe identificalos desde o teclado. Os caracteres así identificados engádense á colección para que sirvan nunha próxima ocasión.
O método topológico baséase na definición lóxica do carácter e nas liñas verticais, horizontais, curvas, liñas, etc. ten en conta. O programa coñece estas formas básicas e identifica o propio carácter.
Mediante aproximacións e afinos repetidos, estes programas identifican correctamente máis do 96% dos caracteres. Isto significa que na páxina normal escrita quedan 180 caracteres máis ou menos descoñecidos. O lector normal dáse conta facilmente deses erros e sabe como é o texto correctamente. Con todo, se este texto con erros ten que ser posteriormente informatizado, o resultado obtido en moitos casos non é aceptable. Por iso, téndese a recorrer a redes neuronais paira mellorar a identificación de caracteres. A través destas redes, por exemplo, se o carácter “ou” é un círculo perfecto, identifícase como vogal “ou” e identifica que se o círculo “0” non é perfecto é una cifra cero.
As redes neuronais utilizan neuronas como elemento básico e están conectadas entre si mediante sinapsis (Ver Elhuyar. Ciencia e Técnica. Número 79. Xaneiro 1994. “Rede neuronal artificial”. A. D. Tapia Florez). A principal barreira deste sistema é a necesidade dunha gran capacidade informática, e os microordenadores que temos na actualidade non chegan a iso. Una das solucións que se aplica actualmente é a mestura de redes neuronais e métodos tradicionais. O programa identifícao nunha primeira volta cun método matricial ou topológico e despois só se tratan os caracteres con problemas con redes neuronais.
A empresa Microsoft, que realiza o sistema operativo MS DOUS de microordenadores, desenvolveu o seu propio sistema. O programa analiza os caracteres dun nun e cando atopa algunha dúbida sérvese da “metakaractera”. Por exemplo, cando ten a dúbida de “ha(nr)i” (é dicir, “n” ou “r”) decide cun dicionario ortográfico.
Os programas de computador paira coñecer a escritura teñen xa numerosas aplicacións en calquera oficina. Una destas aplicacións é a das oficinas de correos. De feito, ao colocarse o código postal na portada, a distribución realízase automaticamente. Nos bancos tamén se utilizan sistemas automáticos de identificación de letras de cambio, pero por suposto, estes sistemas non poden conter erros debido a que o diñeiro está incluído.
Existen sistemas que coñecen os datos introducidos manualmente. Ao escribir os datos nunha pantalla, estes deben ser capaces de soportar os esforzos mecánicos que se producen na escritura manual. Mediante estas pantallas, táboas ou PDA abriuse una nova era á industria informática a través de programas de recoñecemento de escritura. O modelo Newton de Apple supuxo un gran avance. O prezo deste computador sen teclado é de 1.000 dólares, pero está a piques de sacar o modelo EO e custará entre 2.000 e 3.400 dólares. Ademais de coñecer a escritura, o teléfono e o fax estarán integrados e todo iso funcionará sen teclados nin cables.