¿Qué es la ciencia de datos?
La ciencia de datos es un campo interdisciplinario que involucra métodos científicos, procesos y sistemas para extraer conocimiento o un mejor entendimiento de los datos en sus diferentes formas, ya sea estructurados o no estructurados.

La ciencia de datos es considerada un nuevo paradigma de la ciencia más que un campo de estudio en específico. La ciencia basada en datos se considera el cuarto paradigma , siendo los anteriores tres la ciencia experimental, la ciencia teórica y la ciencia computacional.

Este paradigma nuevo indica que la ciencia actualmente puede impulsarse por toda la gran cantidad de datos que existen. Ahora se parte de los datos que se tienen para analizarse de forma exploratoria, cuando antes los datos eran obtenidos hasta después de formular la hipótesis y hacer experimentos basados en esa hipótesis. Los datos se tienen de antemano y se puede entonces hacer preguntas sobre dichos conjuntos de datos o mediante técnicas de aprendizaje automático, encontrar patrones o correlaciones aún si no se tiene una hipótesis de que esos patrones pudieran existir.

Pero así como la ciencia de datos es diferente a la ciencia computacional, el tercer paradigma, donde la computación impulsa a la ciencia,  así mismo hay otra interpretación de la ciencia de datos que tiene que ver con un campo de estudio enfocado a los datos mismos; la estadística.

Tanto la estadística como la ciencia de la computación tratan acerca de datos, solo que la estadística se enfoca  en el estudio del estado de los datos (de ahí el nombre de estadística), mientras que la ciencia de la computación estudia los cálculos que se efectúan sobre los datos y que a su vez generan nuevos datos (es de la palabra cálculo donde proviene el nombre de computación).

Estas dos disciplinas se complementan para conformar lo que actualmente conocemos como ciencia de datos que utiliza herramientas como clustering, clasificación, procesamiento de señales, reconocimiento de patrones, modelos de probabilidad, minería de datos, machine learning, analítica predictiva, estructuras de datos, bases de datos (relacionales y no relacionales) y visualización de datos.

© 2019 EnlineaSaltillo.com

Todos los derechos reservados.