Datos para un proyecto
Primera etapa: Utilidad de los datos.
Recolección y entendimiento de los datos.
Las primeras consideraciones son en función del origen de los datos necesarios.
Datos existentes. Incluye una amplia variedad de datos, como datos transaccionales, datos de encuesta, registros Web, etc. Tenga en cuenta si los datos existentes son suficientes para adaptarse a sus necesidades.
Datos adquiridos. ¿Su organización utiliza datos adicionales, como datos demográficos? Si no los utiliza, considere si son necesarios.
Datos adicionales. Si los orígenes anteriores no satisfacen sus necesidades, es posible que necesite realizar encuestas o realizar seguimientos adicionales para servir de complemento a los almacenes de datos actuales.
Lista de tareas
Observe los datos y considere las siguientes cuestiones:
¿Qué atributos (columnas) de la base de datos parecen más prometedores?
¿Qué atributos no parecen relevantes y se pueden excluir?
¿Existen datos suficientes para obtener conclusiones generales o realizar predicciones precisas?
¿Dispone de atributos suficientes para su proyecto?
¿Está fusionando varios orígenes de datos? En caso afirmativo, ¿existen áreas que puedan plantear problemas al fusionar?
¿Ha considerado cómo se gestionan los valores perdidos en cada origen de datos?
Reconocimiento y análisis de utilidad de los datos
El reconocimiento y clasificación de un determinado tipo de dato esta asociado y permite entender la utilidad del mismo. La utilidad de un dato es función de su grado de implicancia o interés para un determinado análisis o proyecto.
Para avanzar en el análisis de la utilidad de los datos es siempre bueno y necesario hacer el ejercicio de clasificarlos de acuerdo a criterios de nominalidad, ordinalidad, intervalos, rangos y proporcionalidad más allá de verlos simplemente como datos cuantitantivos o cualitativos.
Los niveles de medición de los datos son importantes porque nos ayudan a definir como los datos pueden ser recabados, analizados e interpretados.