Curso de Data Science con Python. De cero a experto (Programa detallado)
Objetivo
Al finalizar el curso podrá…
- Dominar el lenguaje de propósito general Python desde cero, incluyendo su instalación.
- Comprender y profundizar en el flujo completo de un proyecto de Data Science para convertirse en científico de datos.
- Aprender todos los conceptos de estadística necesarios para poder analizar los datos que le rodean.
- Utilizar librerías como Numpy o Pandas para la importación desde fuentes heterogéneas (CSV, Excel, texto plano, SQL, Web, redes sociales, cloud,…) y la limpieza y transformación de datos.
- Crear potentes visualizaciones con las librerías Matplotlib y Seaborn para el análisis de la información.
- Analizar series temporales y realizar previsiones.
- Automatizar sus tareas cotidianas con Python
Dirigido a:
- Toda persona que quiera potenciar su perfil adquiriendo habilidades de análisis de datos con gran futuro.
- Estudiantes que quieran aprender desde cero una habilidad muy demandada en cualquier sector desde un punto de vista práctico.
- Personas que quieran asombrar a su audiencia con un enfoque analítico generando conclusiones que marcan la diferencia.
- Analistas que quieran profundizar en Python y sus librerías enfocadas en Data Science.
- Profesionales que quieran automatizar sus tareas diarias con Python.
Requisitos:
No es necesario requisitos previos, incluso habrá un bloque introductorio al lenguaje Python desde cero.
PROGRAMA DEL CURSO
1.- Introducción al Análisis de Datos
Objetivo
Al finalizar la unidad, el alumno comprenderá en qué consiste un proyecto de Data Science y cómo Python nos ayudará a llevarlo a cabo.
Contenido
- Introducción al Análisis de Datos con Python
- ¿Qué es Python y qué nos proporciona para el análisis de datos?
- Instalación Python + Jupyter
- Importar librerías y fuentes de datos
- Visualización básica con Matplotlib
- Flujograma de un proyecto Data Science
- Resumen
2.- Fundamentos del lenguaje Python
Objetivo
Al finalizar la unidad, el alumno conseguirá dominar el lenguaje Python y su sintaxis.
Contenido
- Fundamentos del lenguaje Python
- Variables en Python
- Creación de listas y extracción de datos
- Conceptos avanzados de creación de listas
- Uso de funciones en Python (in-built)
- Creación de funciones en Python y argumentos flexibles
- Funciones lambda
- Métodos en Python
- Cómo crear diccionarios en Python
- Uso de función zip para creación de diccionarios en base a listas
- Operadores en Python
- Bucles en Python
- Comprensión de listas en python
- Resumen
3.- Conceptos de Estadística para el Análisis de Datos
Objetivo
Al finalizar la unidad, el alumno entenderá los fundamentos estadísticos para convertirse en científico de datos, lo cual es la base sólida para poder analizar y obtener conclusiones.
Contenido
- Conceptos de Estadística para el Análisis de Datos
- Variables y Conceptos básicos
- Varianza de una variable
- Correlación de variables
- Histogramas
- Análisis con percentiles (CDF)
- Funciones densidad de probabilidad
- Cálculo de previsiones (forecast) y media móvil
- Resumen
4.- Calculo numérico con Numpy
Objetivo
Al finalizar la unidad, el alumno habrá profundizado en la librería Numpy para hacer cálculos numéricos con Python.
Contenido
- Calculo numérico con Numpy
- Introducción a la librería Numpy
- Selección de datos con array Numpy
- Arrays 2D en Numpy
- Cálculo estadístico con NumPy
- Resumen
5.- Análisis de datos con Pandas
Objetivo
Al finalizar la unidad, el alumno habrá profundizado en la librería más importante para limpieza y
transformación de datos con Pandas.
Contenido
- Análisis de datos con Pandas
- Introducción a la librería Pandas ¿qué es un dataframe?
- Creación de un dataframe a partir de un diccionario
- Cómo importar datos desde un fichero de texto plano (txt, csv...)
- Selección de datos en un dataframe Pandas
- Métodos útiles de un dataframe Pandas
- Eliminar duplicados, valores erróneos y columnas de un dataframe Pandas
- Interpolación de datos
- Filtrar datos en un dataframe Pandas
- Ordenación valores en un dataframe Pandas
- Crear columnas en un dataframe para cadenas de texto
- Crear columnas en un dataframe a partir de un diccionario con map
- Crear columnas en un dataframe a partir de funciones lambda
- Crear columnas en un dataframe a partir de funciones condicionales
- Renombrar y reordenar columnas de un dataframe Pandas
- Cómo crear pivot tables en Pandas
- Uso de groupby en Pandas
- Concatenación de dataframes (union)
- Combinación de dataframes
- Resumen
6.- Importación y exportación con Pandas
Objetivo
Al finalizar la unidad, el alumno conseguirá importar y exportar desde múltiples fuentes de datos.
Contenido
- Importación y exportación con Pandas
- Cómo importar datos desde un fichero Excel
- Introducción a las BBDD relacionales / Modelos de datos
- Cómo importar datos desde una BBDD SQL
- Cómo importar datos desde una página web
- Cómo importar datos desde una página web (Web scraping)
- Cómo importar datos desde un fichero semi-estructurado JSON
- Cómo importar datos desde Redes Sociales
- Cómo importar datos desde Cloud (AWS / Azure / Google Cloud)
- Exportación de datos a csv y Excel
- Exportación de datos a BBDD SQL
- Resumen
7.- Visualización de datos en Python - Matplotlib
Objetivo
Al finalizar la unidad, el alumno conseguirá crear potentes visualizaciones con Matplotlib para poder analizar y explicar los resultados obtenidos.
Contenido
- Visualización de datos en Python - Matplotlib
- Consejos para la visualización de datos
- Introducción a la librería Matplotlib
- Creación de un gráfico de línea, bar, scatter
- Personalización de gráficos (título, etiquetas, ticks, leyenda, límites de ejes, anotaciones...)
- Creación de box & whiskers plot
- Creación de un histograma y CDF
- Gráfico de media móvil
- Visualización de gráficos múltiples (subplots)
- Aplicación de estilos
- Creación de gráficos a partir de objeto groupby
- Creación de histogramas en 2D
- Creación de mapas geográficos con basemap y Google maps
- Resumen
8.- Visualización de datos en Python - Seaborn
Objetivo
Al finalizar la unidad, el alumno conseguirá crear potentes estadísticas con la librería Seaborn para un análisis profundo de la información.
Contenido
- Visualización de datos en Python - Seaborn
- Introducción a la librería Seaborn
- Seaborn - Creación de Regresión Lineal
- Seaborn - Stripplot
- Seaborn - Swarmplot
- Seaborn - Violinplot
- Seaborn - Uso de jointplot
- Seaborn - Uso de pairplot
- Seaborn - Correlación con heatmap
- Resumen
9.- Series temporales en Python
Objetivo
Al finalizar la unidad, el alumno conseguirá explotar sus datos históricos para realizar análisis y previsiones.
Contenido
- Series temporales en Python
- Series temporales en Pandas: Extracción y parsing
- Series temporales: Filtrado
- Series temporales: Remuestreo - Diezmado (downsampling)
- Series temporales: Remuestreo - Interpolación (upsampling)
- Visualización de series temporales
- Previsiones basadas en datos históricos
- Resumen
10.- Ejecución e interconexión de Python con otras plataformas
Objetivo
Al finalizar la unidad, el alumno conseguirá generar scripts de Python para automatizar tareas e interconectar con otras herramientas de Business Intelligence.
Contenido
- Ejecución e interconexión de Python con otras plataformas
- Generación de scripts de python y automatización de tareas
- Uso de Python en herramienta de Business Intelligence Power BI
- Resumen