Georeferenciación


La base del Geomarketing es el uso de la información asociada a la geografía, por lo cual es imprescindible ser capaz de posicionar geográficamente nuestros datos de estudio (clientes, tiendas, competencia,…) y de este modo poder trabajar con la posición de los mismos, bien sea con distancias, áreas de atracción, temáticos ó cualquiera de las otras funcionalidades que nos permiten las soluciones de análisis geográfico.

El concepto de ser capaz de pasar de una dirección a una coordenada, ó lo que es lo mismo, poder cruzar una base de datos de información con una base de datos geográfica, es lo que llamamos Geocoding.

Un único problema, dos soluciones

Prácticamente todas las soluciones S.I.G. disponen de un módulo específico de Geocoding. Frente a esta solución, existe la posibilidad de utilizar soluciones específicas de Limpieza de Datos ó Data Cleansing, que permiten el tratamiento de direcciones y a partir de las direcciones ya tratadas, la georreferenciación de las mismas.

De este modo, encontramos dos escenarios posibles:

  • Soluciones de Geocoding de paquetes comerciales de S.I.G.
  • Soluciones de Data Cleansing con extensión de Georreferenciación.

Las primeras tienen la ventaja de estar incorporadas en la solución S.I.G., pero suelen tener un nivel de precisión y de resultados inferiores a las soluciones de Limpieza de Datos.

Adicionalmente, las suites de Limpieza de Datos, suelen incorporar funcionalidades adicionales que pueden ser de gran interés a la hora de trabajar con direcciones como pueden ser:

  • Asignación de Códigos Postales, secciones censales.
  • Asignación de Códigos oficiales INE (municipios, vía,…).
  • Estandarización a nombre oficial para procesos de cruce.
  • Capacidad de asignar variables enriquecidas como Tipologías (link a www.geostat.es/Componentes/Tipologías).
  • Adaptación a las características de la geografía específica del país.

La solución de Data Cleansing de arvato services recibe el nombre de Geocode (Link a www.geostat.es/Geomarketing en Arvato/Soluciones/Geocode), y es utilizada por empresas de primer nivel para sus estudios de Geomarketing.


¿Qué hay que tener en cuenta al hacer Geocoding?

Algunos de los puntos clave a tener en cuenta en una solución de Geocoding deberían ser: Nivel de Confianza en la respuesta: Es frecuente que confiemos en el resultado de una solución de Geocoding y que cuando vemos los puntos sobre un mapa encontremos que están “movidos” ó directamente mal ubicados.

Nivel de Confianza en la respuesta:

Es frecuente que confiemos en el resultado de una solución de Geocoding y que cuando vemos los puntos sobre un mapa encontremos que están “movidos” ó directamente mal ubicados.

Ejemplo de resultado de un proceso de tratamiento con un producto S.I.G. con módulo Geocoding

La imagen muestra un ejemplo de resultado de un proceso de tratamiento con un producto S.I.G con módulo de Geocoding. Como se puede ver, los resultados tienen asignadas diferentes niveles de precisión en la geocodificación y una confianza asociada al resultado.

Esta confianza suele estar basada en la “similitud” entre la dirección introducida y la dirección en planimetría, aplicada con algoritmos variados (lógica difusa, fonética, distancias,…). Es importante ser capaz de “cortar” los resultados en función del tipo de uso que queramos hacer de la geocodificación.

Tipos de coordenada obtenida: Una de las consultas clásicas de un usuario que se enfrenta a soluciones de Geomarketing es la referida a la proyección de las coordenadas con las que trabaja.

En función de si estamos obteniendo coordenadas UTM ó Geodésicas (GPS, Google Maps) puede que necesitemos realizar algún tipo de conversión para trabajar con dichas coordenadas. Recomendamos en este punto, trabajar con coordenadas obtenidas directamente de la solución de Geocoding ó transformadas con un software S.I.G., pero no recomendamos realizar conversiones mediante formulas, ya que suele ser frecuente no realizar los cálculos adecuadamente, además de la dificultad de los mismos.

Nivel de Resolución de La Coordenada:

Si estamos posicionando un conjunto de establecimientos de una cadena, es probable que necesitemos la mayor precisión en la ubicación, por lo que querremos trabajar a “Nivel de Calle y Número”, pero en muchas ocasiones, necesitaremos obtener datos estadísticos agregados, por lo que nuestro nivel de asignación puede ser suficiente por municipio, código postal ó sección censal.

Es conveniente que decidamos qué nivel es el correcto para nuestro estudio, ya que marcará la confianza en la codificación realizada.

En este ejemplo, no es lo mismo trabajar con la calle+número con un 87% de los registros asignados, que un estudio a nivel de sección censal, en el que superamos el 96% de asignación.

Método de Asignación y ámbito de la solución:

Los algoritmos basados en lógica ó similares encuentran su contrapartida en las soluciones basadas en varianteros/versioneros.

La diferencia es que mientras los primeros utilizan algoritmos que evalúan similitudes entre palabras, los segundo trabajan con variantes (ó versiones) conocidas para el nombre de una vía ó municipio. De este modo, los versioneros suelen encontrar casos comunes que los algoritmos no encuentran.

Asimismo, hay que tener muy en cuenta las particularidades de la geografía española (todos los que hemos trabajado con direcciones conocemos las casuísticas y dificultades de trabajar con datos, por ejemplo, de La Comunidad de Murcia ó de Galicia). Las soluciones internacionales no tienen en cuenta particularidades de cada región ó país, por lo que suelen dar resultados inferiores a los productos específicos adaptados a cada país.