Data Analytics - Proyecto en Excel para principiantes.
¿Por dónde empezar a la hora de hacer un proyecto?
Es común que nos realizamos esta pregunta a la hora de hacer un proyecto, especialmente si se es principiante.
En los videos del canal en youtube y en otros artículos comentaba la importancia de adquirir o desarrollar el pensamiento estructurado, es decir, aprender a segmentar y organizar el trabajo de tal forma que al realizar cada paso/fase/segmento nos acerquemos al logro del objetivo planteado.
También comentaba los pasos necesarios para realizar casi cualquier proyecto de análisis de datos, independientemente de la herramienta o programa, lo ideal es que tengas en cuenta los pasos, el orden y comprender en qué consiste cada uno y como interactúan entre sí.
El video está diseñado para mostrarte esta serie de pasos de una forma práctica y aplicada a un nivel básico o principiante en Excel, va dirigido a la comprensión e importancia de cada paso y como aporta a la resolución de un problema y la toma de decisiones.
Este proyecto de ejemplo abarca los siguientes pasos:
Definir el problema
Preparar los datos
Procesar y limpiar los datos
Analizar los datos
Compartirlos
Toma de decisiones basadas en los datos.
Excel es una herramienta muy completa que permite realizar los anteriores pasos con diversas funcionalidades, fórmulas y complementos, así que es importante conocer, practicar y procurarlo de hacer de la forma más eficiente posible.
Si bien hay muchas más funcionalidades en Excel para realizar estos pasos, lo importante es comprender cuál es la tarea a realizar independientemente de la herramienta (si con excel, SQL, phyton, R, tableu....etc) depende de la complejidad y volumen de datos, así como de tus habilidades y requerimientos.
El tutorial te lo dejo por aquí:
El enlace para que puedas descargar el libro de trabajo lo puedes descargar haciendo clic aquí
No olvides seguir el blog y suscribirte a mi canal de youtubepara más contenido.
Con tantas opciones (algunas muy costosas) y herramientas por aprender
analítica de datos como Excel, Sql, visualización de datos y programación es
común preguntarse por dónde empezar y donde encontramos los recursos necesarios
para desarrollar estas habilidades.
En esta ocasión comparto los cursos que elegí para formarme como Analista de Datos (cursos que a la fecha de este artículo me encuentro haciendo).
Antes de empezar quiero recordar el proceso que
mejores resultados me ha dado para aprender algo nuevo, especialmente si se
trata de algo relacionado con tecnología y es aprender las bases y luego
construir algo o aplicarlo en un proyecto. En resumen aprender y aplicar. Tal como explicaba en este otro post
¿Dónde encuentro los cursos?
Ahora, la plataforma que elegí para formarme
como analista de datos es Coursera y es 100% en línea, anteriormente la he
usado para tomar cursos complementarios a mis clases universitarias llevándome
un paso adelante de mis compañeros y de clase e incluso de alguno de mis maestros,
por lo cual es mi plataforma favorita, puedes revisar todo el contenido y acceder a todo el material de forma gratuita (Auditar), los certificados de los cursos que apruebes son de pago, la info sobre tarifas las encuentras aquí.
¿En qué cursos enfocarse?
Para ser analistas de datos debemos
desarrollar cuatro habilidades técnicas principales y que son las más demandas en el mercado laboral, estas son:
Hojas de
cálculo
SQL
Visualización de datos
Programación
Una vez se tiene identificado en que Technical Skills enfocarse, es hora de seguir con los cursos.
si deseas profundizar más en los cursos te recomiendo este video que he preparado como material complementario a este post.
Curso introductorio
El primer curso que sugiero es elcertificado profesional de análisis de datos de Google, esta especialización brinda una visión general
del análisis de datos, en qué consiste, que herramientas y habilidades son
necesarias así como algunos tips para el desarrollo de la profesión. Aquí
tendrás la oportunidad de hacer un acercamiento a herramientas como las hojas
de cálculo, Sql, visualización de datos y programación.
Hojas de cálculo / Excel
La siguiente habilidad técnica a desarrollar es
Excel y para esto recomiendo realizar la especialización de habilidades de Excelaplicadas a los negocios, esta especialización está compuesta por cuatro cursos
que cubre desde los elementos básicos como identificar los diversos elementos
que comprende desde los elementos que componen las hojas de cálculo hasta
diseñar hojas de cálculo a modo de base de datos, pasando por la limpieza de
datos, fórmulas, funciones, el diseño de gráficos y construcción de tableros o
dashboards.
Como segunda opción, para aquellos que
necesitan un aprendizaje rápido o un repaso general, recomiendo el cursoExcel básico para el análisis de datos, se requiere alrededor de 12 horas para
completarlo.
SQL / Bases de datos
Una vez se ha aprendido y empleado las
herramientas que ofrece Excel en el ámbito del análisis de datos y por supuesto
hacer los primeros proyectos usando Excel, es hora de continuar con SQL,
recomiendo la especialización en SQL para la ciencia de datos. Este programa está dirigido a estudiantes que
están iniciando o no tienen experiencia en el manejo de SQL y bases de datos.
Otra opción para aprender SQL es el programa
especializado PostgreSQL for everybody, esta especialización la compone cuatro cursos,
en los cuales se abarca las bases de SQL y se enfoca en el diseño y manejo de
la base de datos Postgre, aunque las bases, conceptos y aplicaciones son
igualmente aplicables a otras bases de datos.
Visualización de datos
Una vez se tiene
afianzado los conocimientos y la práctica en Excel y hojas de cálculo es hora
de continuar con la visualización de datos.
Así que recomiendo la especializado
llamado visualización de datos con tableu, se conforma de cinco cursos, en el quinto curso
haces un proyecto aplicado a un tema de tu interés y la idea es que el
resultado sea parte de los proyectos de tu portafolio. Cada curso toma
aproximadamente entre 12 y 15 horas para completarlo, de nuevo, puede ser menos o más horas, esto
depende tu ritmo de aprendizaje, si ya tienes conocimientos previos o si
dedicas tiempo adicional para practicar lo aprendido.
Si desean aprender sobre
otra herramienta para visualización de datos recomiendo un proyecto guiado llamado
Introducción a power BI de escritorio, toma alrededor de dos horas finalizarlo
y se realiza un proyecto basado en el análisis de datos sobre el incumplimiento
entorno a las tarjetas de crédito.
Programación para data analytics
Ahora vamos con la
programación, en nuestro video anterior veíamos que los dos lenguajes de
programación más demandados son Python y R, con cual iniciar es tu decisión, no
hay uno mejor que otro, depende del área en que planees trabajar en el futuro o
el lenguaje que maneje cierto nicho de empresas.
Empecemos por phyton, en
el programa especializado Python for everybody se aprenderá los conceptos
básicos fundamentales de programación, considerando las estructuras datos, la
interfaz del programa, su aplicación en bases de datos, también se aprenderá
sobre el procesamiento y visualización de datos.
El siguiente lenguaje es R, la especialización: dataScience: fundamentos usando Restá compuesta de cinco cursos en los cuales
aprenderás desde instalar el programa, su interfaz, pasando por las herramientas y
técnicas fundamentales para la obtención, limpieza y exploración de datos,
programación en R entre otros aspectos relacionados un poco más con la ciencia
de datos. Es una muy buena opción para aquellos que prefieren iniciar con R.
Bonus
Un último curso que me
gustaría recomendar y no es precisamente para aprender un programa o
herramienta sino para desarrollar el pensamiento analítico y que muchas veces
es pasado por alto, y es estadística, el curso introducción a estadística cubre
conceptos sobre el pensamiento estadístico y porqué es importante al momento de
analizar datos y comunicar resultados.
No olvides seguir el blog y suscribirte a mi canal de youtubepara más contenido.
En esta ocasión compartiré los elementos en los que debes enfocarte para formarte como analista de datos y la forma más adecuada de hacerlo.
Primero quiero mencionar que he optado por un modelo autodidacta ya que desde mi
experiencia puedo escoger el contenido, cursos, libros y proyectos que se
ajustan a mis necesidades y gustos, y de cierto modo ahorran dinero, tiempo y
energía.
¿Cómo aprender?
Una de las maneras que me ha resultado más efectiva para aprender un
tema en especial es aprender y aplicar.
Cuando aprendes algo, recibes y comprendes información que te puede
resultar útil en el futuro, pero cuando pones eso que aprendiste en práctica,
así sea con un proyecto pequeño, terminas de entender en qué situaciones puede
ser útil y como puede ayudarte a hallar una solución a un problema específico. Si bien este proceso puede resultar un poco más largo que solamente dedicarse a recibir información y hacer anotaciones, resulta más efectivo en el sentido que a través de la práctica puedes autoevaluarte, decidir si necesitas repasar un contenido específico para poder llevar a cabo determinado proceso. Un ejemplo en forma de analogía es el siguiente: Aprender sobre las tuercas e ir armando el motor a la par, si no sabes dónde va la tuerca revisas tus apuntes, en contraste con primero aprenderte todas las tuercas y luego ir a ciegas armando el motor.
¿Qué aprender?
En la siguiente imagen hay diversas ofertas laborales reales para el cargo de analista de datos, podemos observar cuatro elementos que sobresalen en todas, y son:
Habilidades técnicas
Habilidades blandas
Habilidades analíticas
Área de dominio.
¿Cómo aplicar lo que se aprende?
La práctica es muy importante
a la hora de desarrollar, mejorar y retener una habilidad y hay varias formas
de hacerlo, por ejemplo:
•Desarrollar un proyecto como
parte de una materia o asignatura si estás estudiando.
•Hacer proyectos para tu trabajo
o empresa.
•Llevar a cabo proyectos para
incluir en tu portafolio y en tu hoja de vida. O proyectos para enseñarles a
otros.
Cuando haces estos proyectos agregas valor a tu experiencia o si no
tienes, estos funcionarán como experiencia en el orden que muestras cómo usas
tus habilidades y conocimientos en proyectos prácticos, y esto puede ser muy
atractivo para los empleadores y aumentan la probabilidad de ser contratado.
En resumen, aprender y aplicar te permite
mostrar tu formación en analítica de datos y también mostrar tus proyectos como
experiencia. Una vez aprendes una habilidad y la aplicas, es hora de continuar
con otra habilidad y así sucesivamente.
¿Qué aprender primero?
Recomiendo Empezar por las habilidades
técnicas e ir integrando las otras habilidades. En la medida que desarrolles
proyectos en tu área de dominio necesitarás habilidades analíticas, o mejorarás
tus habilidades blandas si por ejemplo compartes tus proyectos en un blog o
videos, allí estarás trabajando en tus habilidades de escritura y comunicación.
Al realizar proyectos es más fácil sentir el avance en el
aprendizaje de tus habilidades en conjunto, esto también ayudará a aumentar la
motivación y la sensación de logro.
Iniciar con las habilidades técnicas permite integrar las otras
habilidades, por lo que es una buena forma de iniciar, en lugar que aprender
cada cosa por separado y secuencialmente, por ejemplo, primero aprender lo
relacionado con habilidades comunicativas y después bases de estadística y
luego Excel para el análisis de datos.
¿Qué habilidad técnica aprender primero?
Teniendo en cuenta los requerimientos más comunes en las
ofertas de empleo para analistas de datos en un nivel junior o básico, las
habilidades más solicitadas en SQL, Excel, tableu, power BI, un lenguaje de
programación como Phyton o r.
Ahora por dónde empezar… recomiendo primero revisar brevemente y a
modo general estas herramientas con el fin de identificar sus usos en el rol
del analista de datos, así como identificar en cuál herramienta nos queremos
enfocar basados en nuestros intereses y gustos.
Para esto recomiendo optar por el curso de Google data Analytics.
Este curso te brindará un panorama general sobre el rol, te enseñará
habilidades técnicas a nivel introductorio en herramientas como hojas de
cálculo, Sql, programación y visualización de datos.
El paso por seguir es empezar por alguna de las dos habilidades más
demandas, puedes empezar por Excel que es la herramienta más común y con la que
por lo general se está más familiarizado, además se puede desarrollar proyectos
completos de baja complejidad, desde cargar y transformar los datos hasta trabajar
en la visualización.
Posteriormente recomiendo SQL, para profundizar en el
manejo de bases de datos. Con manejar con muy estas dos herramientas ya
aumentan las probabilidades para ser candidatos a una vacante de analistas de
datos.
Una vez manejes estas dos herramientas, es hora de avanzar con visualización de
datos y programación, selecciona una herramienta que te llame la atención, que
te guste y que te permita desarrollar otras habilidades. Por ejemplo, con la
visualización de datos también trabajas la capacidad de sintetizar información
y comunicar resultados.
Recuerda que el objetivo aquí es aprender estas herramientas para
ser analistas de datos, no para volvernos expertos en un programa u otro. Es
como cuando necesitas aprender a conducir, lo haces porque tienes como objetivo
lograr movilizarte por la ciudad e ir de un lugar a otro, para esto necesitas
aprender lo necesario para lograr conducir con seguridad en la vía, así que no
necesitas convertirte en un mecánico experto que conoce el funcionamiento de
cada uno de los componente del vehículo.
Las habilidades analíticas consisten en la resolución de problemas,
pensamiento crítico, investigación, habilidades matemáticas (para iniciar basta
con matemática básica, algebra, Probabilidad y estadística. Algunas de estas
bases se aprenden en el colegio o universidad, tampoco es difícil aprenderlos
hay muchos cursos en internet para “repasar” este contenido).
También se puede desarrollar estas habilidades aplicándolos a un
proyecto, por ejemplo, si deseas analizar los precios de los alimentos en la última década aplicarás habilidades matemáticas y estadística para calcular precios, variaciones, precios medios, y demás.
Área de dominio:
El área de dominio hace referencia a una disciplina especifica o
campo, por ejemplo, economía, finanzas, economía, o sectores como la medicina o
educación.
No es necesario cambiar de profesión para convertirse en analista de
datos, el tener un área de dominio te da un campo que conoces y en el que
puedes aplicar en proyectos o trabajos en tu área de estudio. Recomiendo tomar
una herramienta en conjunto con un proyecto que te permita profundizar en tu
área de dominio.
Habilidades blandas:
Las habilidades blandas hacen referencia a como trabajas e
interactúas con otras personas. Por ejemplo las habilidades comunicativas,
creatividad, trabajo en equipo, ética profesional.
Puedes compartir tus proyectos en tus redes sociales, compartir tus
proyectos en tableu public, kaggle o github. Esto permite mejorar mis habilidades técnicas y también mejorar mis habilidades comunicativas y de escritura, además servirá de ventana
en la cual tus empleadores pueden conocer tu trabajo.
Si deseas profundizar un poco más, te dejo este video que he preparado sobre este tema:
Algunas recomendaciones finales:
Iniciar de a poco, iniciar con una habilidad técnica e integrar otra
habilidad en la quieras trabajar y construir un proyecto. Puedes empezar con
Excel y con los recursos que tengas a la mano.
Otra recomendación muy importante es aprender inglés, la mayoría del
contenido de calidad en cuanto al análisis y ciencia de datos se encuentra en
ingles así que es importante ir acostumbrándonos a este lenguaje, por lo
general los programas, comandos y demás los encontraremos en este idioma, así
que es mejor que el inglés sea nuestro aliado y no nuestro enemigo.
No olvides seguir el blog y suscribirte a mi canal de youtubepara más contenido.
En esta ocasión quiero compartir los seis pasos que sin duda te ayudarán en el momento de realizar un análisis de datos, estos pasos están diseñados de forma similar a los procesos de investigación, desde la observación y realización de preguntas hasta compartir de manera efectiva tus hallazgos y así brindar soluciones a situaciones específicas.
Si en el colegio o universidad te gustaba la investigación sin duda estos pasos te serán familiares.
Preguntar: esta etapa puede parecer sencilla pero es una de las más importantes ya que marcarán el resto del proceso, aquí es clave las habilidades comunicativas y analíticas ya que mediante preguntas efectivas dirigidas a las partes interesadas (en inglés se llaman stakeholders) a los jefes lograrás definir correctamente el problema.
Preparar: consiste en entender como los datos son generados y recolectados, identificar y recolectar la información que necesitas y en qué tipo de formatos o estructuras vienen los datos, así como asegurarse que esta sea de calidad y que no contengan sesgos. también diseñarás la mejor forma para organizar y proteger tus datos.
Procesar: Aquí crearás, transformarás y limpiarás los datos empleando diversas herramientas como hojas de cálculo, sql o mediante programación, dejarás los datos listos para hacer tus análisis.
Analizar: en esta fase se formatea, organiza y filtra los datos con el fin de identificar patrones, sacar conclusiones, hacer predicciones y recomendaciones entorno al problema planteado inicialmente, es decir, responder a las preguntas planteadas, se busca que tus análisis basados en datos guíen y apoyen la toma de decisiones.
Compartir: en este paso se planea, diseña y comparte los reportes o visualizaciones que comunicarán tus análisis de forma efectiva, esto ayudará a otros a entender los resultados, en otras palabras, debes contar la historia que cuentan los datos.
Actuar: Esta es el último paso y aquí es el momento en el que quienes lideran el proyecto tomen decisiones en miras a resolver el problema, para lo cual se apoyarán en tus descubrimientos, a partir de aquí también se pueden generar nuevas preguntas, situaciones o problemas, así iniciará de nuevo el ciclo.
En la actualidad, existen diversos modelos para hacer análisis de datos, es común que las empresas diseñen sus propios protocolos, incluso puedes diseñar el tuyo, pero en general todos apuntan a las actividades que descritas anteriormente.
Si quieres aprender un poco más te dejo este video:
Cuéntame en los comentarios cuál de estos pasos te llamó más la atención y en cuál te gustaría aprender un poco más.
En los próximos artículos y videos abarcaré cada paso minuciosamente, desde aprender a hacer preguntas efectivas hasta comunicar los resultados y aportar a la toma de decisiones con miras a brindar soluciones.
No olvides seguir el blog y suscribirte al canal de youtubepara más contenido.
En la última década los términos "analista de datos" y "científico de datos" se han popularizado gracias al desarrollo de las tecnologías propias de la cuarta revolución, la industria 4.0 y la era digital, cada vez más, la personas y empresas generan millones de datos, los cuales deben ser analizados empleando diversas herramientas que permiten tomar decisiones empresariales, sociales, gubernamentales, así como generar soluciones basadas en los datos.
Esta frase "los datos es están convirtiendo en la nueva materia prima de los negocios" es una clara invitación formarse en este campo ya sea quieras dar un impulso o giro a tu carrera actual o recién empiezas tus estudios.
Dos de los roles que están tomando fuerza en estos últimos años son el analista de datos (Data Analyst) y el científico de datos (Data scientist), a continuación se describe las principales diferencias en cuanto a las actividades principales, el nivel de profundidad del análisis, las habilidades requeridas, herramientas que debe manejar y los requisitos en lo referente a educación y por último los salarios.
Si quieres explorar un poco más estos roles y la demanda que se está generando te dejo este video:
Como ves, es difícil no fijarse en la diferencia de salarios o sueldos entre estos dos roles, aunque te aconsejo no te fijes tanto en eso sino en los conocimientos, habilidades y responsabilidades que afronta cada uno y que se ajusta más a tí.
Si bien, los analistas ganan un poco menos que los científicos de datos, se debe tener en cuenta que los requerimientos para ser científicos de datos son mayores, aunque puedes iniciar como analista de datos e ir avanzando progresivamente en conocimientos y experiencia hacia la ciencia de datos, o bien optar por un estilo de educación un poco más especializada como un master o doctorado en ciencias computacionales, estadística y afines si quieres inciar de lleno en el mundo de los datos.
Estos y otros temas los iré posteando aquí en el blog y en Mi canal de YouTube, suscríbete haciendo clic 👉Aquí.
Cuéntame en los comentarios cuál perfil y qué te llamó más la atención de estas dos profesiones.
Top 5 habilidades analíticas que debes tener si quieres ser analista de datos
Como analista de datos o data analyst es importante contar con habilidades analíticas porque te van a permitir comprender mejor el problema y guiar tu proceso de análisis hacia una mejor toma de decisiones, por supuesto basadas en los datos,a esto se le conoce como Data–Drive Decisions o decisiones basadas en datos. Las habilidades analíticas en varias ocasiones se pasan por alto pero son tan importantes como las habilidades técnicas,las habilidades analíticas son cualidades y características que se complementan entre sí y están asociadas con la resolución de problemas usando hechos. Veamos cuales son:
Curiosidad, es importante aprender constantemente, cuanto más aprendes más curioso eres. De esta forma eres más conciente del entorno y empezarás a identificar patrones en la vida cotidiana y esto nos lleva a la siguiente habilidad.
Comprender el contexto, es decir comprender las condiciones de que algo existe o está sucediendo, ya sea mientras haces fila en el banco, estás atascado en un trancón o embotellamiento o comprando palomitas para el cine, comenzarás a usar todas estas situaciones para identificar problemas, hacer predicciones, sacar conclusiones y demás.
Tener una mentalidad técnica, esto implica la capacidad de dividir los problemas o una situación del contexto en partes más pequeñas para poder trabajar de forma lógica y ordenada. Los analistas no se guían por intuiciones o sentimientos sino que buscan diseñar un proceso de análisis con el fin de tomar decisiones informadas, esto nos lleva a la cuarta habilidad y es
Diseño de datos, es decir, aprender a organizar la información de manera lógica, de tal forma que puedas acceder, comprender y aprovechar al máximo la información que tienes disponible, pero debes hacerlo de forma inteligente y aquí viene la quinta pero no más importante habilidad.
Estrategia de datos, Se trata de ser capaz de gestionar los procesos, personas y las herramientas que vas a emplear en tus análisis de datos, diseñar un plan o proceso específico para la recolectar y procesar los datos y que herramientas vas a necesitar para eso y cómo las vas y por cuanto tiempo las vas a emplear.
Si quieres explorar un poco más te dejo este video:
Trabajar en desarrollar estas habilidades sin duda te otorgará un impulso para lograr resultados exitosos como analista de datos y marcarás la diferencia en tu trabajo o proyectos. Cuéntame más abajo que tipo de problemas o situaciones te encuentras en la vida diaria y si alguna vez se te ha ocurrido alguna solución diferente. Estas y otras habilidades las iré posteando en el blog y en Mi canal de YouTube, puedes suscribirte haciendo clic 👉Aquí.
Problemas más comunes a resolver como analista de datos
Como analistas de datos o data analysts es común encontrarse con uno o varios tipos de problemáticas entorno a las necesidades de los stakeholders como tus jefes, compañeros de trabajo, líder de proyecto, clientes, etc. Estas problemáticas se engloban en seis grandes categorías, aprender a identificar que tipo de problemáticas estás afrontado te ayudará a planear correctamente tu análisis.
Los problemas o situaciones que más comúnmente se le solicita al analista de datos son las siguientes:
Hacer predicciones: Este tipo de problema implica el uso de datos para tomar una decisión informada sobre cómo pueden ser las cosas en el futuro, por lo general se hacen basadas en datos históricos.
Categorizar elementos: Esto significa asignar información a diferentes grupos o clústeres en función de características comunes de dichos elementos, por ejemplo sencillo podría darse cuando categorizas tus libros según género o autor.
Detectar algo inusual: En este tipo de problema no hay mucho que decir, ya que su nombre lo dice por sí mismo, aquí se busca identificar datos que son diferentes de la norma o a lo usual, con el fin de detectar anomalías, esto es muy útil en campos como la producción en serie, procesos automatizados, control de calidad, datos financieros y/o económicos.
Identificar temas: Aquí se busca llevar la categorización un paso más allá al agrupar la información en conceptos más amplios, es decir se agrupan las categorías, volviendo al ejemplo de los libros, imagina que ahora vas a identificar las estanterías dependiendo de dónde están ubicados, los libros de tu hermano en una estantería y los tuyos en otra, esto sin que se altere necesariamente tu primer orden por género o autor.
Descubrir conexiones: Este tipo de problema le permite al analista de datos encontrar desafíos similares a los que enfrentan diferentes entidades, en este tipo de problema por lo general se combinan datos e información para encontrar correlaciones entre variables o aspectos específicos que se deseen analizar.
Encontrar patrones: Por lo general se usan datos para encontrar patrones utilizando datos históricos para comprender lo que sucedió en el pasado y, por lo tanto, es probable que vuelva a suceder, este último es similar al primero, solo que aquí no hacemos predicciones, nos centramos en analizar el pasado.
Déjame saber en los comentarios cuál si alguna vez has enfrentado en tu trabajo, estudio o en tus proyectos alguno de estos problemas o situaciones.
No olvides seguir el blog y suscribirte al canal de youtubepara más contenido.