%@LANGUAGE="JAVASCRIPT" CODEPAGE="CP_ACP"%>
ATLAS LINGÜÍSTICO (Y ETNOGRÁFICO) DE CASTILLA - LA MANCHA
página principal
CARTOGRAFIADO AUTOMÁTICO
Y BASES DE DATOS GEOLINGÜÍSTICAS
Francisco Moreno Fernández
José Enrique Moreno Fernández
Antonio García de las Heras
Universidad de Alcalá, España
Introducción
Desde 1996, la Universidad de Alcalá ha venido haciendo un notable esfuerzo
para conseguir una aplicación informática capaz de cartografiar
de forma automática los materiales registrados previamente en una o más
bases de datos. Este esfuerzo ha permitido incorporar nuestro trabajo a una
línea de investigación muy cultivada en otros centros de investigación,
tanto de Europa como de América: pensamos, por ejemplo, en los sistemas
informáticos desarrollados para el Atlante linguistico del ladino dolomitico/centrale
e dialetti limitrofi, de la Universidad de Salzburgo, en la informatización
del Atlante linguistico de la Sicilia, realizada en el Centro de Estudios Filológicos
y Lingüísticos Sicilianos (Palermo) o en los trabajos del Linguistic
Atlas of the Middle and South Atlantic States, de la Universidad de Georgia
(EE.UU.).
En el dominio hispanohablante, la primera obra que se ha adentrado en el terreno
de la automatización ha sido el Atlas Lingüístico y Etnográfico
de Cantabria, dirigido por Manuel Alvar, aunque también hay noticias
de la informatización de parte de los materiales del Atlas Lingüístico
de Hispanoamérica. La aplicación desarrollada en la Universidad
de Alcalá se denomina Atlante y la intención de estas páginas
es describir someramente su utilidad y sus características.
Objetivos de Atlante.
El objetivo general del programa Atlante es la automatización de las
labores de gabinete que conducen a la consecución de un atlas lingüístico,
así como el máximo aprovechamiento de toda la información
lingüística que contiene una obra de estas características.
Para el cumplimiento de tal objetivo, se precisa una base de datos en la que
queden registrados todos los materiales, que permita una rápida búsqueda
de cualquier información que requiera el investigador y la elaboración
de diversas clases de índices. Además se necesita un mecanismo
que permita trasladar a un mapa cualquiera de los datos lingüísticos
contenidos en la base, ya sea en forma de transcripción fonética,
ya sea en ortografía ordinaria o mediante símbolos.
La finalidad de la aplicación Atlante no es solamente - y no es poco
- llegar a una redacción informatizada de atlas lingüísticos
que van a ser presentados en papel, sino ofrecer la posibilidad de trabajar
y manipular la información lingüística directamente en medios
informáticos. Con otras palabras, se ha buscado un medio que automatice
la elaboración convencional de atlas lingüísticos y que permita
presentar un atlas o bien encuadernado o bien en soportes informáticos,
como el CD-ROM o la consulta on line.
A la hora de decidir el atlas tipo al que deseábamos llegar mediante
nuestra aplicación, hemos usado como referencia uno de los modelos más
ricos y complejos de los que conocemos: el modelo de los atlas lingüísticos
españoles dirigidos por Manuel Alvar. Se trata de atlas, como es bien
sabido, en los que se incluyen mapas lingüísticos, mapas etnográficos
y mapas lingüístico-etnográficos, en los que la información
lingüística se ofrece, unas veces, mediante símbolos - como
es frecuente en otras obras informatizadas -, pero la mayoría de ellas
en transcripción fonética, con respuestas de extensión
variable en cada punto, con los datos distribuidos dentro de los mapas, fuera
de los mapas (en los márgenes) y en láminas complementarias, en
los que se alternan tipos de letras y caracteres de diversa naturaleza. La transcripción
fonética se presenta, además, siguiendo el alfabeto de la Revista
de Filología Española.
Las características de las obras que nos han servido de modelo exigían
la preparación de una aplicación sumamente flexible, capaz de
registrar materiales en transcripción fonética y en ortografía
ordinaria, capaz de alternar alfabetos en el mismo texto, de redactar mapas
muy densos automáticamente, pero dando al investigador, al mismo tiempo,
la oportunidad de ajustar la presentación definitiva de los mapas a sus
gustos y necesidades. Todo ello complementado con el desarrollo del alfabeto
fonético mencionado, pero enriquecido con una larga lista de caracteres
fonéticos imprescindibles para la transcripción de numerosos rasgos
de las hablas hispánicas.
Las bases de datos deben ser capaces de permitir usos y manipulaciones muy diversas,
desde la simple consulta de cualquier cadena de caracteres, hasta la elaboración
de índices - incluidos índices de formas inversas -, la incorporación
de archivos sonoros y gráficos o el cálculo de distancias lingüísticas
entre puntos (dialectometría).
Características de Atlante.
Atlante es una aplicación preparada para ejecutarse bajo sistemas operativos
de 32 bits - en particular para Windows’95 o versiones posteriores- utilizando
Visual Basic v.4.0.; la formación y el manejo de la base de datos de
Atlante se realiza mediante “Microsoft Access Jet Engine”. Para
la utilización de este programa es aconsejable disponer de un procesador
Pentium 100 o superior, con 16 M de RAM como mínimo (aunque lo recomendable
es contar con 32M) y suficiente espacio en el disco duro para almacenar tanto
la base de datos como los ficheros BMP de 256 colores que se vayan desarrollando
al elaborar los mapas.
Atlante basa su funcionamiento en la utilización de tres bases de datos
específicas y su proyección gráfica en un mapa. Las bases
de datos que se crean y manejan son las siguientes:
· Bases de localidades. Se accede a ella desde el menú
principal, una vez abierto el programa. En ella se deben introducir, y es donde
van a figurar, el nombre de la localidad, el código con el que la identificaremos,
los nombres de los informadores y las coordenadas relativas que cada la localidad
ha de tener en el mapa. En esta base es posible añadir otros datos adicionales,
según las características de cada o atlas (por ejemplo, el nombre
dialectal de los naturales de cada localidad).
· Base de informantes. También se accede a ella desde el menú
principal, una vez abierto el programa. En esta base debemos introducir, porque
aquí van a figurar, todo los datos relacionados con los informantes que
se consideren pertinentes: profesión, naturaleza de los padres, nivel
de instrucción, lecturas, viajes, tiempo dedicado a ver y oír
la televisión o la radio, etc.
· Base de respuestas o de información lingüística. Igualmente que en los casos anteriores, accedemos a ella desde el menú principal, una vez abierto el programa. Los datos lingüísticos que aquí se registran pueden aparecer en ortografía ordinaria (en cualquiera de los alfabetos de que disponga el ordenador o computadora) o en transcripción fonética. Para transcribir los datos fonéticos en los campos de la base destinados a ello, se puede utilizar una fuente “TTF” para windows, previamente instalada en el directorio “Windows/Fonts”. La Universidad de Alcalá ha preparado una fuente de estas características (afe.ttf) para la representación de signos fonéticos ajustados a las pautas establecidas en la Revista de Filología Española, aunque también es posible utilizar cualquiera de las versiones disponibles en mercado para el Alfabeto Fonético Internacional.
De las tres bases de datos de las que acabamos de dar cuenta,
sin duda la más compleja desde un punto de vista técnico, y la
más rica desde una perspectiva lingüística, es la de respuestas.
Técnicamente no se trata de una sola base sino de un conjunto de bases,
que será más o menos amplio según la cantidad y la variedad
de los contenidos que en ella se quieran incluir: no es lo mismo un atlas fonético,
que un atlas general, no es igual un atlas de 300 mapas que uno de 3000, evidentemente.
Al hablar de una base de respuestas tan sólo pretendemos facilitar la
comprensión de la estructura del programa.
Las bases de datos que componen lo que hemos llamado la base de respuestas podrían
ser tantas como niveles lingüísticos deban quedar recogidos en el
atlas. Así, si un atlas sólo incluye información fonético-fonológica
y léxica, serían dos las bases necesarias; si se trabaja, además,
con un nivel morfológico o sintáctico - o de cualquier otro tipo
-, se contaría con otras tantas bases de datos. Por otra parte, cada
una de las bases, según el número de unidades que la compongan,
puede estar subdividida en “tablas” a las que denominamos campos;
de este modo, la base de “Fonética” puede subdividirse en
un campo de “Fonética vocálica” y otro de “Fonética
consonántica”, por ejemplo, y la base “Léxico”
puede quedar dividida en campos como “Partes del cuerpo”, “Vida
agrícola”, “Fenómenos atmosféricos”,
etc. Dentro de cada campo, figuran las respuestas recogidas a propósito
de determinados objetos, acciones o conceptos. Cuanto mayor sea el número
de unidades que componen cada base, más necesaria se hace la subdivisión
en tablas o campos, para garantizar siempre un manejo ágil y rápido
de la base.
La introducción de los datos en la base de respuestas se hace a través
de una ventana dispuesta de forma similar a un formulario; algunos datos han
de registrarse en ortografía ordinaria y otros en transcripción
fonética. Para introducir la información correspondiente a cada
campo, es preciso seleccionar en el formulario una serie de opciones referidas
al nivel lingüístico, la localidad, el informante y el nombre del
propio campo. Las posibilidades de selección de cada uno de estos aspectos
(nivel lingüístico que interesa, nombre del campo que interesa,
código de la localidad, nombre del informante) se despliegan automáticamente
en el formulario, eliminando las posibilidades de error. Esto es posible gracias
a que en el formulario contamos con una lista actualizada de todas las localidades
y todos los informantes insertados anteriormente en nuestras bases. Así
pues, la ventana de la base de respuestas muestra, en principio, información
sobre la localidad, el informante, el nivel lingüístico y el campo
a los que corresponden los datos lingüísticos que allí se
van a introducir y que posteriormente se van a consultar, si se desea.
La información lingüística que se introduce en esta ventana
se registra tanto en ortografía ordinaria como en transcripción
fonética; se hace así, entre otras razones, para facilitar las
búsquedas de secuencias de caracteres. Si se maneja información
referida a las conjugaciones verbales, también es posible contar con
una lista de los verbos cuyas formas se van a introducir o consultar.
Para introducir la información lingüística, esto es, las
respuestas que los informantes han dado a un cuestionario, disponemos de dos
tipos de ayuda: por un lado, el formulario ofrece un listado con las respuestas
registradas en cada campo, evitando introducir una y otra vez unos mismos datos,
con los consiguientes ahorro de tiempo y reducción de errores innecesarios;
por otro lado, pulsando las teclas F1 y F2 obtenemos una ayuda gráfica
del alfabeto fonético que estamos utilizando y su distribución
en el teclado.
En resumen, la ventana en la que se introducen y consultan las respuestas recogidas
en las encuestas geolingüísticas ofrece en todo momento información
actualizada sobre el lugar, el informante, el nivel lingüístico
y el campo a los que corresponde una serie de formas lingüísticas
que se presentan en transcripción fonética y en ortografía
ordinaria.
La consulta de las bases de datos
El menú principal del programa dispone de una opción llamada Búsquedas
mediante la cual se accede a un sencillo menú. Las búsquedas se
realizan automáticamente entre las respuestas registradas en ortografía
ordinaria: en el lugar adecuado para ello, se ha de anotar la secuencia de caracteres
(una palabra o una parte de la palabra) que se quiere encontrar en todos los
campos de todas las bases. Efectuado el rastreo, el programa proporciona información
precisa sobre el campo, el mapa, la localidad y el informante en los que se
han encontrado cada una de las apariciones de la secuencia buscada. La información
se ofrece siguiente, para cada uno de los casos encontrados, de la forma siguiente:
Búsqueda: *sma*
Campo : Morfología
_____________________________________________
Palabra: fantasma
Nº de Mapa : 100
Nº de Lámina : 100
Palabra: fantasma -> fantasma, el
Localidad: M 103
Informante: Pedro Pérez Pérez
Esta información puede ser impresa en papel, para un más cómodo manejo por parte del investigador.
Cartografiado automático
Las bases de datos lingüísticos permiten que la información
en ellas contenida se pueda proyectar de forma horizontal, en mapas, y de un
modo automático: para realizar esta tarea basta seleccionar la opción
Mapa del menú principal.
Cuando se elige la opción de crear un mapa, para lo que previamente debemos
haber cumplimentado las bases de datos lingüísticos, aparece en
pantalla un mapa mudo del territorio de nuestro atlas y varias opciones en un
nuevo menú. Las opciones que se presentan son las que se exponen a continuación:
· Mapa de símbolos: permite crear un mapa con símbolos asociados a una leyenda, a partir dela información almacenada en la base de datos. Para elaborar estos mapas, podemos combinar hasta diez símbolos diferentes a los cuales se puede asociar cualquier tipo de leyenda escrita con cualquier tipo y tamaño de letra.
· Texto: permite insertar cualquier texto en un margen
del mapa, con el fin de aclarar cualquier problema sobre el contenido del mapa
o para aportar cualquier tipo de información adicional.
· Archivo: permite guardar el mapa que se tiene en pantalla; también
permite abrir un mapa grabado previamente. Con la opción Nuevo se crea
un mapa nuevo con las características que se desee, entre las posibilidades
que se ofrecen en un formulario. En ese formulario se elige la información
lingüística (respuesta) que se quiere representar de entre todas
las que se recogen en las bases de datos, así como las localidades que
se quiere representar o no representar, dentro del mapa o en un margen.
Conclusión
La aplicación Atlante, creada en la Universidad de Alcalá, pretende
ser un instrumento ágil, flexible y potente para el cartografiado automático
y la gestión de bases de datos lingüísticos. Su versatilidad
para buscar, cartografiar o consultar información lingüística
lo hace un instrumento capaz de automatizar prácticamente cualquier tipo
de atlas lingüístico, desde los más simples a los más
ricos y complejos.
Atlante: an Application for Automatic Elaboration
of Linguistic Atlas
Atlante is a program developed by the University
of Alcala (Spain) for automatic cartography and use of geolinguistic database.
It is an application for Windows’95 in Visual Basic 4.0 32 bits programming
language.
We have conceived Atlante in two different ways. On one hand a powerful database
with Access database jet engine where we store every data; on the other hand
a graphical interface where it is possible to create and view the maps. Furthermore
we use the fonts TrueType Afe.ttf and Afe2.ttf. We have created those Windows
TrueType fonts and they are based on a phonetic alphabet very used for Spanish
(Revista de Filología Española).
Due to these characteristics, it is necessary at least a Pentium processor with
16M RAM and 10M hard drive free space and Windows’95 operating system.
The graphical interface requires a big amount of RAM (32M recommended) memory.
We must set the hard drive free space depending on the database size.