The Gaussian

Redcap

Recoge datos con calidad. Access y Redcap

Siempre que comenzamos una base de datos (bien sea para una empresa o para hacer un estudio) nos enfrentamos con un problema parecido: la calidad de los datos.
Todos los que hemos trabajado con bases de datos relativamente grandes (más de 100 registros o variables), hemos visto de cerca los problemas de calidad que enfrentamos. Por ello, recoger datos en un Excel -o de cualquier otra manera parecida- no es una opción.
A continuación enumeramos los principales problemas por los que te recomendamos usar una base de datos relacional como Access o Redcap para la captación de datos:

1.-Opciones erróneas o imposibles: 

Siempre que nos disponemos a hacer una base de datos de cualquier tipo debemos tener en cuenta que existirán datos introducidos imposibles: edades de 1 y 2 años en encuestas a una población universitaria (o no digamos ya edades negativas), alturas de unos pocos centímetros, precios irreales, glucemias que serían “mortales”, etc…
Access o Redcap tienen una interfaz de entrada, es decir, que si se introduce un dato como la fecha de nacimiento, mediante una sencilla regla es capaz de calcular qué edad tiene el sujeto y decirle que es imposible que tenga esa edad en el presente estudio, y que -por tanto- se ha equivocado al rellenar los datos.
Podemos especificar en la aplicación que no le deje continuar con el registro sin subsanar el error, o que en todo caso debe constar como variable perdida (missing), si previamente hemos considerado que esa variable puede quedarse en blanco.

2.-Opciones posibles introducidas de diferentes maneras:
Otro de los problemas que solucionamos con esta aplicación es la introducción de datos de diferentes maneras, problema muy común si en la base de datos intervienen muchas personas. Un ejemplo puede ser rellenar las fechas en formatos “dd/mm/aaaa” ó “d/m/aa” o escribir “rep. domin.” O bien “República Dominicana” ó “Rep. Dominicana”. Todo esto será luego un dolor de cabeza a la hora de hacer indicadores o aunar datos. Access nos deja hacer opciones para introducir siempre los datos de la misma manera, como la creación de un diccionario con los 195 países del mundo o una máscara de entrada de datos con forma XX/XX/XXXX.

3.-Notas o campos abiertos además de la variable de interés.
Un error clásico en los estudios es que las personas que están recogiendo los datos, no saben qué proceso habrá después, por lo que se quedan tranquilos utilizando la base como medio de comunicación con las personas que la vayan a analizar más tarde, como para clarificar o quedarse tranquilos en el momento.
Es frecuente encontrar Excels con un párrafo en una casilla, donde en la variable fecha de visita pone “le he llamado pero no lo coge” o cosas por el estilo. Con Access, nosotros acotamos qué tipo de variable puede entrar en cada campo, si debe ser numérica, textual, o si esta debe ser corta o larga

4.-Valores perdidos.
Los valores perdidos son uno de los datos más importantes en un estudio. Sí, como lo oyes, uno de los más importantes. Cuando encontramos demasiados, la primera pregunta que nos surgirá es ¿Qué hacemos con ellos? En muchas bases de datos (por no decir en casi todas), hechas con Excel, se acaba rellenando solo lo que “sí” ha ocurrido, o lo que «sí» contesta. Mientras que se utilizan las casillas vacías para indicar que una persona no tiene esa característica, no le ha pasado o no la cumple. Sin embargo, ¡no tiene nada que ver! Un valor vacío es una pérdida de información. Si sigue un patrón (por ejemplo, muchos valores vacíos en una sola variable) es como si no existiera. No podemos justificar un número alto de valores perdidos en un estudio. En general, no sabremos si esa variable está vacía porque no querían dar ese dato, no lo sabían o le ha parecido tedioso recordarlo.
5.-Variables añadidas.
Otro error frecuente son las variables añadidas. Siempre que se pone una base de datos a funcionar, esta debe tener un diseño definitivo, en el caso de Access es así. No es modificable (sí lo es, pero debe hacerlo el que la haya creado), esto contribuyea la idea más importante de cualquier base de datos: lo más importante es el diseño, no el análisis.
Hay que pararse a pensar qué vamos a preguntar y por qué, así como leer y poner a prueba el cuestionario en petit comittée. Si se trata de una base sin un interfaz, como una hoja de Excel simple, en algún momento alguien añadirá más variables que no estén en el diseño inicial, haciendo que el estudio llegue a un punto crítico: ¿qué hacemos con los registros previos a los que no se les ha preguntado por esa variable? Y ¿Cómo preguntamos por esa variable? Un ejemplo práctico sería añadir una variable en un Excel que ponga “¿ha tenido síntomas COVID?», como ha sido añadida sin mucha reflexión, probablemente nadie concluya lo mismo: ¿síntomas en las últimas 24 horas? ¿Síntomas en el último episodio? ¿Síntomas ahora? ¿Síntomas desde que comenzó la pandemia?

Por estas razones vale la pena aprender a usar Access, sus diccionarios y reglas de validación. Además, tiene la ventaja de que es relativamente intuitito y fácil de usar, con una curva de aprendizaje rápida.
Si tenemos que destacar una pega de Access es sin duda esta: no permite trabajar en línea. Es decir, la base de datos (donde se deben introducir todos) solo puede estar en un sitio, por lo que no podemos introducir información varias personas a la vez. Para ello, sí disponemos de Redcap (Research Electronic Data CAPture), esta aplicación sí tiene un servicio online para introducir datos utilizando reglas de validación e interfaces de entrada de datos, lo que nos facilita mucho la tarea si estamos hablando de una gran cantidad de datos.

Deja un comentario

Tu dirección de correo electrónico no será publicada.

9 + dieciseis =