Curso completo de Machine Learning: Data Science con RStudio

Training

Virtual

$ 100.001-250.000

Descripción

  • Tipología

    Training

  • Metodología

    Virtual

  • Inicio

    Fechas disponibles

"¿Te suenan las palabras Machine Learning o Data Scientist? ¿Te pica la curiosidad de para qué sirven estas técnicas o por qué empresas de todo el mundo pagan un sueldo de 120.000 hasta 200.000$ al año a un científico de datos?
Este curso está pensado y diseñado por todo un profesional del mundo del Data Science como es Juan Gabriel Gomila, que compartirá su conocimiento y ayudaros a entender la teoría tan compleja sobre las matemáticas que tiene detrás, los algoritmos, y librerías de programación con R.
Veremos paso a paso como empezar a trabajar con conceptos y algoritmos del mundo del Machine Learning. Con cada nueva clase y sección que completes tendrás unas nuevas habilidades que te ayudarán a entender este mundo tan completo y lucrativo que puede ser esta rama del Data Science.
Este curso te mostrará cómo puedes poner sus habilidades de análisis de datos en R para uso práctico, con recetas que atienden las tareas básicas y avanzadas de análisis de datos.
Desde la adquisición de los datos y su preparación previa para el análisis hasta las técnicas más complejas de análisis de datos, intentaremos llevar a cabo las implementaciones de cada técnica de la mejor manera posible. También visualizaremos los datos utilizando los paquetes más populares de R como ggplot2 y encontraremos información oculta en los mismos. Comenzando con la implementación de conceptos básicos del mundo del análisis de datos, manejar sus datos para crear gráficos básicos, dominar las técnicas de análisis de datos más avanzadas, realizar análisis de clúster o generar informes y visualizaciones de análisis efectivas. También trabajaremos con series temporales, regresión y estimación de datos, un sistema de recomendaciones o el análisis de mercados financieros o redes sociales entre otros.
A lo largo del curso, conoceremos los problemas comunes y los obstáculos que se suelen encontrar, así como diferentes formas de superarlas.
"

Información importante

¿Qué objetivos tiene esta formación?: "Adquirir, formatear y visualizar nuestros datos usando R
Usar R para realizar un análisis exploratorios de los datos
Conocer algoritmos de machine learning tales como clasificación y regresión
Saber llevar acabo el análisis de redes sociales
Generar informes dinámicos con Shiny
Conocer y saber realizar el análisis geoespacial
Manejar datos grandes con R usando Spark y MongoDB
Construir un sistema de recomendaciones incluyendo el filtrado colaborativo, basado en contenido e híbrido
Conocer ejemplos del conjunto de datos del mundo real como la detección de fraude y reconocimiento de imágenes
Ser todo un master Jedi del Machine Learning con R Studio
Llevar a cabo predicciones y toma de decisiones precisas
Elaborar modelos robustos de Machine Learning
Utilizar las técnicas de Machine Learning para uso personal y para asesorar empresas
Tener una buena intuición de la mayoría de modelos de Machine Learning
Construir modelos diversos de Machine Learning y combinarlos para resolver cualquier problema que uno se plantee
Utilizar técnicas avanzadas para reducir la dimensión del problema"

¿Esta formación es para mí?: "Cualquiera que quiera iniciarse en el mundo de la estadística y el análisis de datos
Cualquiera interesado en aprender Machine Learning
Cualquiera que quiera aprender R y RStudio
Cualquiera con nociones básicas de R y estadística que busque conocer las técnicas avanzadas usadas por las grandes empresas
Estudiantes que tienen un conocimiento de matemáticas que quieran aprender acerca del Machine Learning con R
Usuarios intermedios que conocen los fundamentos de Machine learning como los algoritmos clásicos de regresión lineal o logística pero buscan aprender más y explorar otros campos del aprendizaje estadístico
Programadores que les guste el código y que estén interesados en aprender Machine Learning para aplicar dichas técnicas a sus datasets
Estudiantes de universidad que busquen especializarse y aprender a ser Data Scientists
Analistas de datos que quieran ir más allá gracias al Machine Learning con RStudio
Cualquier persona que no esté satisfecha con su propio trabajo y busque empezar a trabajar como un Data Scientist profesional
Cualquier persona que quiera dar valor añadido a su propia empresa utilizando las potentes herramientas de Machine Learning"

Requisitos: "Saber usar un ordenador con fluidez, independientemente del sistema operativo Tener conocimientos básicos de estadística o de R es recomendable pero no necesario para seguir el curso Se necesitan conocimientos de matemáticas de bachillerato o conocimientos básicos de estadística"

Sedes y fechas disponibles

Ubicación

Inicio

Online

Inicio

Fechas disponibles Inscripciones abiertas

Materias

  • Technolgy

Programa académico

"Introducción Introducción Pre requisitos del curso Contenidos del curso Conoce a Juan Gabriel Gomila, tu profesor de Data Science Acerca de la valoración prematura del curso en Udemy Conoce R y RStudio Descargando nuestra herramienta de trabajo: R y R Studio Ayuda con la instalación de R y Rstudio Si tienes problemas con Ubuntu... La organización es la clave Repositorio de los proyectos del curso de Data Science Un paseo por la interfaz de R Studio Comunidad de estudiantes del curso Adquirir y preparar nuestros ingredientes - Los datos Preparando los datos para su análisis ¿En qué consiste esto del Data Science? El fichero CSV y la función read.csv Opciones adicionales de read.csv Los datos en CSV Leyendo datos de un XML Leyendo tablas incrustadas en un HTML Problemas leyendo tablas en HTML Los datos en XML Leyendo datos desde un JSON Alternativa a la API de Yahoo finanzas Acceso a los datos con la sintaxis de $ Los datos en un JSON Los ficheros de ancho fijo Los datos en un fichero de ancho fijo Creando ficheros Rdata y rds Cargando ficheros Rdata y rds Los ficheros de datos de R Eliminar datos sin valor con na.omit Limpieza selectiva de los datos sin valor Reemplazo de NA con la media o extracción aleatoria Evitando duplicaciones de entradas Reescalado lineal de datos Normalizando o estandarizando datos de un data frame Limpieza de datos Categorizando información numérica Variables ficticias para categorizaciones Formas de eliminar la información que falta Formas de completar la información que falta Preparando nuestros datos iniciales Combinando y separando los datos Uso de modelos predictivos para eliminar NAs Detección de outliers a través de box plots Enmascarando los outliers con transformaciones y cappings Corrección de los datos ¿Qué tenemos aquí? - El análisis exploratorio datos Acerca del análisis exploratorio de los datos Resumiendo nuestros datos con summary y str Estadísticos y medidas básicas Análisis exploratorio inicial Subconjuntos de datos Divisiones con split Partición de data frames con variables numéricas Partición de data frames con variables categóricas División de los datos Histogramas, boxplots y scatterplots Personalizando nuestros gráficos Múltiples gráficos con la función par El paquete lattice Comparación a través de representaciones El gráfico de las judías Análisis de la causalidad Representación de los datos La técnica de la validación cruzada Gráficos cuantil - cuantil ¿Donde pongo esto? - El proceso de clasificación Acerca de la clasificación en data science Cómo generar matrices de confusión Diagramas de mosaico Análisis de componentes principales Diagramas ROC Análisis y representaciones para clasificar correctamente Los árboles de clasificación La poda del árbol de clasificación Los bosques aleatorios Árboles y bosques de clasificación Máquinas de soporte vectorial Naïve Bayes K Nearest Neighbors Eligiendo el mejor número de vecinos para la decisión Redes neuronales para clasificar Análisis del discriminante lineal La regresión logística Técnicas de clasificación Conexión a la API de Twitter Limpiando los tweets descargados Clasificación de textos para análisis de sentimiento ¿Cuanto voy a vender? - Regresión La regresión para predecir valores La raíz del error cuadrático medio K nearest neighbors K Nearest Neighbors sin partición de validación Regresión Lineal Entendiendo los gráficos de los residuos en un modelo lineal Opciones para las fórmulas de un modelo lineal"

Curso completo de Machine Learning: Data Science con RStudio

$ 100.001-250.000