Untitled Document

<%@LANGUAGE="JAVASCRIPT" CODEPAGE="CP_ACP"%> Untitled Document

ATLAS LINGÜÍSTICO (Y ETNOGRÁFICO) DE CASTILLA - LA MANCHA

página principal

CARTOGRAFIADO AUTOMÁTICO
Y BASES DE DATOS GEOLINGÜÍSTICAS

Francisco Moreno Fernández
José Enrique Moreno Fernández
Antonio García de las Heras

Universidad de Alcalá, España

Introducción
Desde 1996, la Universidad de Alcalá ha venido haciendo un notable esfuerzo para conseguir una aplicación informática capaz de cartografiar de forma automática los materiales registrados previamente en una o más bases de datos. Este esfuerzo ha permitido incorporar nuestro trabajo a una línea de investigación muy cultivada en otros centros de investigación, tanto de Europa como de América: pensamos, por ejemplo, en los sistemas informáticos desarrollados para el Atlante linguistico del ladino dolomitico/centrale e dialetti limitrofi, de la Universidad de Salzburgo, en la informatización del Atlante linguistico de la Sicilia, realizada en el Centro de Estudios Filológicos y Lingüísticos Sicilianos (Palermo) o en los trabajos del Linguistic Atlas of the Middle and South Atlantic States, de la Universidad de Georgia (EE.UU.).
En el dominio hispanohablante, la primera obra que se ha adentrado en el terreno de la automatización ha sido el Atlas Lingüístico y Etnográfico de Cantabria, dirigido por Manuel Alvar, aunque también hay noticias de la informatización de parte de los materiales del Atlas Lingüístico de Hispanoamérica. La aplicación desarrollada en la Universidad de Alcalá se denomina Atlante y la intención de estas páginas es describir someramente su utilidad y sus características.

Objetivos de Atlante.
El objetivo general del programa Atlante es la automatización de las labores de gabinete que conducen a la consecución de un atlas lingüístico, así como el máximo aprovechamiento de toda la información lingüística que contiene una obra de estas características. Para el cumplimiento de tal objetivo, se precisa una base de datos en la que queden registrados todos los materiales, que permita una rápida búsqueda de cualquier información que requiera el investigador y la elaboración de diversas clases de índices. Además se necesita un mecanismo que permita trasladar a un mapa cualquiera de los datos lingüísticos contenidos en la base, ya sea en forma de transcripción fonética, ya sea en ortografía ordinaria o mediante símbolos.
La finalidad de la aplicación Atlante no es solamente - y no es poco - llegar a una redacción informatizada de atlas lingüísticos que van a ser presentados en papel, sino ofrecer la posibilidad de trabajar y manipular la información lingüística directamente en medios informáticos. Con otras palabras, se ha buscado un medio que automatice la elaboración convencional de atlas lingüísticos y que permita presentar un atlas o bien encuadernado o bien en soportes informáticos, como el CD-ROM o la consulta on line.
A la hora de decidir el atlas tipo al que deseábamos llegar mediante nuestra aplicación, hemos usado como referencia uno de los modelos más ricos y complejos de los que conocemos: el modelo de los atlas lingüísticos españoles dirigidos por Manuel Alvar. Se trata de atlas, como es bien sabido, en los que se incluyen mapas lingüísticos, mapas etnográficos y mapas lingüístico-etnográficos, en los que la información lingüística se ofrece, unas veces, mediante símbolos - como es frecuente en otras obras informatizadas -, pero la mayoría de ellas en transcripción fonética, con respuestas de extensión variable en cada punto, con los datos distribuidos dentro de los mapas, fuera de los mapas (en los márgenes) y en láminas complementarias, en los que se alternan tipos de letras y caracteres de diversa naturaleza. La transcripción fonética se presenta, además, siguiendo el alfabeto de la Revista de Filología Española.
Las características de las obras que nos han servido de modelo exigían la preparación de una aplicación sumamente flexible, capaz de registrar materiales en transcripción fonética y en ortografía ordinaria, capaz de alternar alfabetos en el mismo texto, de redactar mapas muy densos automáticamente, pero dando al investigador, al mismo tiempo, la oportunidad de ajustar la presentación definitiva de los mapas a sus gustos y necesidades. Todo ello complementado con el desarrollo del alfabeto fonético mencionado, pero enriquecido con una larga lista de caracteres fonéticos imprescindibles para la transcripción de numerosos rasgos de las hablas hispánicas.
Las bases de datos deben ser capaces de permitir usos y manipulaciones muy diversas, desde la simple consulta de cualquier cadena de caracteres, hasta la elaboración de índices - incluidos índices de formas inversas -, la incorporación de archivos sonoros y gráficos o el cálculo de distancias lingüísticas entre puntos (dialectometría).

Características de Atlante.
Atlante es una aplicación preparada para ejecutarse bajo sistemas operativos de 32 bits - en particular para Windows’95 o versiones posteriores- utilizando Visual Basic v.4.0.; la formación y el manejo de la base de datos de Atlante se realiza mediante “Microsoft Access Jet Engine”. Para la utilización de este programa es aconsejable disponer de un procesador Pentium 100 o superior, con 16 M de RAM como mínimo (aunque lo recomendable es contar con 32M) y suficiente espacio en el disco duro para almacenar tanto la base de datos como los ficheros BMP de 256 colores que se vayan desarrollando al elaborar los mapas.
Atlante basa su funcionamiento en la utilización de tres bases de datos específicas y su proyección gráfica en un mapa. Las bases de datos que se crean y manejan son las siguientes:

· Bases de localidades. Se accede a ella desde el menú principal, una vez abierto el programa. En ella se deben introducir, y es donde van a figurar, el nombre de la localidad, el código con el que la identificaremos, los nombres de los informadores y las coordenadas relativas que cada la localidad ha de tener en el mapa. En esta base es posible añadir otros datos adicionales, según las características de cada o atlas (por ejemplo, el nombre dialectal de los naturales de cada localidad).

· Base de informantes. También se accede a ella desde el menú principal, una vez abierto el programa. En esta base debemos introducir, porque aquí van a figurar, todo los datos relacionados con los informantes que se consideren pertinentes: profesión, naturaleza de los padres, nivel de instrucción, lecturas, viajes, tiempo dedicado a ver y oír la televisión o la radio, etc.

· Base de respuestas o de información lingüística. Igualmente que en los casos anteriores, accedemos a ella desde el menú principal, una vez abierto el programa. Los datos lingüísticos que aquí se registran pueden aparecer en ortografía ordinaria (en cualquiera de los alfabetos de que disponga el ordenador o computadora) o en transcripción fonética. Para transcribir los datos fonéticos en los campos de la base destinados a ello, se puede utilizar una fuente “TTF” para windows, previamente instalada en el directorio “Windows/Fonts”. La Universidad de Alcalá ha preparado una fuente de estas características (afe.ttf) para la representación de signos fonéticos ajustados a las pautas establecidas en la Revista de Filología Española, aunque también es posible utilizar cualquiera de las versiones disponibles en mercado para el Alfabeto Fonético Internacional.

De las tres bases de datos de las que acabamos de dar cuenta, sin duda la más compleja desde un punto de vista técnico, y la más rica desde una perspectiva lingüística, es la de respuestas. Técnicamente no se trata de una sola base sino de un conjunto de bases, que será más o menos amplio según la cantidad y la variedad de los contenidos que en ella se quieran incluir: no es lo mismo un atlas fonético, que un atlas general, no es igual un atlas de 300 mapas que uno de 3000, evidentemente. Al hablar de una base de respuestas tan sólo pretendemos facilitar la comprensión de la estructura del programa.
Las bases de datos que componen lo que hemos llamado la base de respuestas podrían ser tantas como niveles lingüísticos deban quedar recogidos en el atlas. Así, si un atlas sólo incluye información fonético-fonológica y léxica, serían dos las bases necesarias; si se trabaja, además, con un nivel morfológico o sintáctico - o de cualquier otro tipo -, se contaría con otras tantas bases de datos. Por otra parte, cada una de las bases, según el número de unidades que la compongan, puede estar subdividida en “tablas” a las que denominamos campos; de este modo, la base de “Fonética” puede subdividirse en un campo de “Fonética vocálica” y otro de “Fonética consonántica”, por ejemplo, y la base “Léxico” puede quedar dividida en campos como “Partes del cuerpo”, “Vida agrícola”, “Fenómenos atmosféricos”, etc. Dentro de cada campo, figuran las respuestas recogidas a propósito de determinados objetos, acciones o conceptos. Cuanto mayor sea el número de unidades que componen cada base, más necesaria se hace la subdivisión en tablas o campos, para garantizar siempre un manejo ágil y rápido de la base.
La introducción de los datos en la base de respuestas se hace a través de una ventana dispuesta de forma similar a un formulario; algunos datos han de registrarse en ortografía ordinaria y otros en transcripción fonética. Para introducir la información correspondiente a cada campo, es preciso seleccionar en el formulario una serie de opciones referidas al nivel lingüístico, la localidad, el informante y el nombre del propio campo. Las posibilidades de selección de cada uno de estos aspectos (nivel lingüístico que interesa, nombre del campo que interesa, código de la localidad, nombre del informante) se despliegan automáticamente en el formulario, eliminando las posibilidades de error. Esto es posible gracias a que en el formulario contamos con una lista actualizada de todas las localidades y todos los informantes insertados anteriormente en nuestras bases. Así pues, la ventana de la base de respuestas muestra, en principio, información sobre la localidad, el informante, el nivel lingüístico y el campo a los que corresponden los datos lingüísticos que allí se van a introducir y que posteriormente se van a consultar, si se desea.
La información lingüística que se introduce en esta ventana se registra tanto en ortografía ordinaria como en transcripción fonética; se hace así, entre otras razones, para facilitar las búsquedas de secuencias de caracteres. Si se maneja información referida a las conjugaciones verbales, también es posible contar con una lista de los verbos cuyas formas se van a introducir o consultar.
Para introducir la información lingüística, esto es, las respuestas que los informantes han dado a un cuestionario, disponemos de dos tipos de ayuda: por un lado, el formulario ofrece un listado con las respuestas registradas en cada campo, evitando introducir una y otra vez unos mismos datos, con los consiguientes ahorro de tiempo y reducción de errores innecesarios; por otro lado, pulsando las teclas F1 y F2 obtenemos una ayuda gráfica del alfabeto fonético que estamos utilizando y su distribución en el teclado.
En resumen, la ventana en la que se introducen y consultan las respuestas recogidas en las encuestas geolingüísticas ofrece en todo momento información actualizada sobre el lugar, el informante, el nivel lingüístico y el campo a los que corresponde una serie de formas lingüísticas que se presentan en transcripción fonética y en ortografía ordinaria.

La consulta de las bases de datos
El menú principal del programa dispone de una opción llamada Búsquedas mediante la cual se accede a un sencillo menú. Las búsquedas se realizan automáticamente entre las respuestas registradas en ortografía ordinaria: en el lugar adecuado para ello, se ha de anotar la secuencia de caracteres (una palabra o una parte de la palabra) que se quiere encontrar en todos los campos de todas las bases. Efectuado el rastreo, el programa proporciona información precisa sobre el campo, el mapa, la localidad y el informante en los que se han encontrado cada una de las apariciones de la secuencia buscada. La información se ofrece siguiente, para cada uno de los casos encontrados, de la forma siguiente:

Búsqueda: *sma*

Campo : Morfología
_____________________________________________
Palabra: fantasma
Nº de Mapa : 100
Nº de Lámina : 100

Palabra: fantasma -> fantasma, el
Localidad: M 103
Informante: Pedro Pérez Pérez

Esta información puede ser impresa en papel, para un más cómodo manejo por parte del investigador.

Cartografiado automático
Las bases de datos lingüísticos permiten que la información en ellas contenida se pueda proyectar de forma horizontal, en mapas, y de un modo automático: para realizar esta tarea basta seleccionar la opción Mapa del menú principal.
Cuando se elige la opción de crear un mapa, para lo que previamente debemos haber cumplimentado las bases de datos lingüísticos, aparece en pantalla un mapa mudo del territorio de nuestro atlas y varias opciones en un nuevo menú. Las opciones que se presentan son las que se exponen a continuación:

· Mapa de símbolos: permite crear un mapa con símbolos asociados a una leyenda, a partir dela información almacenada en la base de datos. Para elaborar estos mapas, podemos combinar hasta diez símbolos diferentes a los cuales se puede asociar cualquier tipo de leyenda escrita con cualquier tipo y tamaño de letra.

· Texto: permite insertar cualquier texto en un margen del mapa, con el fin de aclarar cualquier problema sobre el contenido del mapa o para aportar cualquier tipo de información adicional.

· Archivo: permite guardar el mapa que se tiene en pantalla; también permite abrir un mapa grabado previamente. Con la opción Nuevo se crea un mapa nuevo con las características que se desee, entre las posibilidades que se ofrecen en un formulario. En ese formulario se elige la información lingüística (respuesta) que se quiere representar de entre todas las que se recogen en las bases de datos, así como las localidades que se quiere representar o no representar, dentro del mapa o en un margen.

Conclusión
La aplicación Atlante, creada en la Universidad de Alcalá, pretende ser un instrumento ágil, flexible y potente para el cartografiado automático y la gestión de bases de datos lingüísticos. Su versatilidad para buscar, cartografiar o consultar información lingüística lo hace un instrumento capaz de automatizar prácticamente cualquier tipo de atlas lingüístico, desde los más simples a los más ricos y complejos.

Atlante: an Application for Automatic Elaboration of Linguistic Atlas

Atlante is a program developed by the University of Alcala (Spain) for automatic cartography and use of geolinguistic database. It is an application for Windows’95 in Visual Basic 4.0 32 bits programming language.
We have conceived Atlante in two different ways. On one hand a powerful database with Access database jet engine where we store every data; on the other hand a graphical interface where it is possible to create and view the maps. Furthermore we use the fonts TrueType Afe.ttf and Afe2.ttf. We have created those Windows TrueType fonts and they are based on a phonetic alphabet very used for Spanish (Revista de Filología Española).
Due to these characteristics, it is necessary at least a Pentium processor with 16M RAM and 10M hard drive free space and Windows’95 operating system. The graphical interface requires a big amount of RAM (32M recommended) memory. We must set the hard drive free space depending on the database size.