Hace mucho tiempo que no hago una entrada relacionada con cursos, y es que he estado haciendo dos cursos sobre Python y la ciencia de los datos (Python and Data Science), que puedes encontrar en EdX, de la mano de Microsoft. Tienes para hacerlos hasta el 31 de Diciembre, y son dos cursos:
Empecemos por el primer curso …
Introducción a la ciencia de datos
Si no tienes conocimientos (o son básicos) de Python, éste es tu curso por donde empezar. Ya hablamos en otras entradas de cursos de Python, donde recomendé el de creación de juegos con Python (de Coursera), así que, si no tuviste oportunidad, ahora estás a tiempo de aprender Python desde el principio.
El curso lo puedes hacer a tu propio ritmo, y en teoría son 6 semanas, que se inicia por conceptos más básicos de programación (variables, funciones, …), y va subiendo el nivel con las listas, importación de paquetes, … A partir del módulo 4 empieza la parte fuerte de la ciencia de datos, con Numpy, Matplotlib y Pandas (o sea, trabajar con matrices y representación gráfica de datos).
El curso está especialmente dedicado a aquellas personas que tengan especial interés por trabajar con datos, donde aprenderán a almacenar datos, manipular datos, representar datos, …. y a aprender el uso de una serie de herramientas para hacerlo posible.
Un apunte importante es que el curso está diseñado para Python 3.5, aunque yo siempre recomiendo Anaconda como versión de Python, y que tiene tanto para Python 2.x como para Python 3.x.
Los módulos del curso
Para aprender la dinámica del curso, el módulo 1 es fundamental, pues es el más sencillo de todos, y cuando lo termines, ya podrás hacer bastantes cosas con variables, tipos, … Es básico, pero fundamental para los siguientes módulos.
El módulo 2, dedicado a las listas, es fundamental en Python, pues es un rescurso mucho más utilizado de lo que uno piensa a priori, y es conveniente dedicarle atención.
El módulo 3 trabaja con funciones y paquetes. Será el siguiente paso en el proceso de aprendizaje. Las funciones, para realizar tareas concretas y los paquetes, para usar código de otros en nuestras tareas.
El módulo 4 es específico de Numpy, y es el paquete básico por excelencia para el manejo de datos, porque permite realizar operaciones matemáticas con amtrices, esto es, con todos los elementos a la vez (en las listas hay que hacerlo uno a uno).
El módulo 5 está dedicado a matplotlib, que es la libraría básica por excelencia para la representación gráfica. Aunque se tratan cosas muy básicas, está bastante bien para comenzar a soltarse con la representación de datos, desde mostrar datos a los histogramas son algunos de los ejercicios a realizar (algo que en este blog teníamos pendiente desde hace mucho!).
Por último, el módulo 6 está dedicado al control de flujo de datos, y a otra librería para tratamiento de datos, pandas, que emplea Numpy también para sus cálculos.
Conclusión del primer curso
El curso del que os he hablado en esta entrada está creado específicamente para aprender Python y aplicarlo al tratamiento de datos, porque hay aspectos de programación en Python que no son tocados, cómo las clases o los diccionarios. Bien es cierto que para analisis de datos no es tan necesario, pero para el desarrollo de scripts en Python, sí que son recursos muy interesantes que conviene conocer. Por tanto, a pesar de que el curso es para principiantes, recomiendo realizar algún otro curso donde se trabajen estos aspectos. También conviene advertir de que el manejo de cadenas es básico, y no hace uso de otras técnicas incluidas en Python.
De todas formas, si tienes algún conocimiento del lenguaje, no está mal que hagas los 3 primero módulos, pues son bastante sencillos, y no te llevarán más de una hora cada uno. Los 3 últmos módulos están centrados en conocer las herramientas principales que dispone Python para analisis de datos, si bien, para los que dominan más, se queda en una buena base para continuar.
Este primer curso es introductorio más bien (en DataCamp puedes encontrar cursos más avanzados también, tanto de Python como de ciencia de datos), pero se definen y presentan una serie de herramientas y módulos con los que se trabaja en el segundo curso, que aun no he terminado, y que te dejo el comentario del mismo en otra entrada!
Buen día!