En esta página:
Demo
En mi humilde opinión existen muchos conceptos y teorías sobre Data Science, pero pocos ejemplos prácticos, quizás me equivoco, lo que si es cierto de los conceptos sobre Data Science es que con métodos y procesos podemos analizar datos, obtener resultados y tomar decisiones, pero te has preguntado alguna vez como podemos hacer esto, que herramientas usar, etc. Bueno vamos con este tutorial en donde te enseñaré Como hacer Ciencia de Datos (Data Science) a los productos de una Tienda de Postres.
Partes
Antes de continuar te invito a leer los siguientes artículos:
- Que es la Ciencia de Datos (Data Science)
- 5 Proyectos Open Source que te ayudarán a mejorar tus habilidades en Data Science (Ciencia de Datos)
- Errores que impiden hacer uso de las mejores prácticas de la Ciencia de Datos (Data Science)
- 5 Ideas Geniales para Proyectos de Data Science (Ciencia de Datos)
- Analizando Datos de Covid-19 mediante Data Science (Ciencia de Datos) – Parte 1
- Que es una Red Neuronal y Otros Detalles (Data Science)
- Puedes leer más en la categoría Data Science
Asimismo te invito a escuchar el Podcast: “17 – Porque El Lenguaje De Programación Python Es Tan Popular”:
Spotify | SoundCloud | Apple Podcasts |
Bien ahora continuemos con el Post: Como hacer Ciencia de Datos (Data Science) a los productos de una Tienda de Postres – Parte 1.
Antes de continuar con este Tutorial, te recomiendo leer nuestro artículo Que es la Ciencia de Datos (Data Science) para que estés familiarizado con este artículo, si ya lo sabes puedes continuar con el tutorial.
Y si aún no sabes que es Python, te recomiendo leer el artículo Que es Python y otros Detalles:
Nosotros apoyamos las herramientas y metodologías de Desarrollo de Software Ágil, ya que siendo realistas, en proyectos reales debemos tomarnos el menos tiempo posible en terminarlos.
Desplegando Herramientas para la Data Science (Ciencia de Datos)
Vamos a utilizar un conjunto de Herramientas y librerías que nos servirán para llevar a cabo la correcta visualización de nuestros datos.
Python
Para poder trabajar con Ciencia de Datos (Data Science) vamos a usar el Lenguaje de Programación Python, el cual es el ideal para esta área, ve a la página oficial de Python y descarga el instalador y ejecútalo para instalar Python.
Yo estoy usando Python 3.7 para Windows 8.1 de 64 Bytes, debes descargar la versión para tu Sistema Operativo, Python esta disponible para Sistemas Operativos Windows, Linux, Mac y otros.
Anacoda
Vamos a utilizar una herramienta muy popular en la comunidad de Profesionales que trabajan con con la Ciencia de Datos (Data Science), esta herramienta es Anaconda.
Descarga Anaconda desde su página oficial en este enlace.
La versión que utilizo hasta la fecha de este artículo es la versión de Anaconda 2019.03 la cual funciona con Python 3.7 así lo dice su página oficial
Una vez que descargaste este Software, debes de instalarlo. La instalación es como instalar cualquier otro programa una vez que ejecutas el instalador te aparece un conjunto de pasos que debes de seguir.
Esta herramienta esta Disponible para los Sistemas Operativos Windows, Mac y linux.
Yo estoy usando Windows 8.1 de 64 Bytes, cuando ejecuto el instalador me aparece la siguiente ventana, le doy clic en Next para continuar
Bien en el siguiente paso te va aparecerá 2 opciones, no actives la opción Add Anaconda to the system PATH environment variable ya que te puede dar errores mientras utilices Anaconda, marca esta opción si sabes bien lo que estas haciendo, si marcas te pintara el Texto en color rojo como Advertencia para que puedas saber que consecuencias tiene si activas esta casilla
Dale clic en siguiente y espera que termine de instalar Anaconda, no muevas nada ya que se puede dañar tu instalación mientras esta se esta realizando.
PyCharm
Al finalizar la instalación te va a pedir que instales el IDE PyCharm el cual te servirá como editor de código Python, por cierto este editor es uno de los mejores para trabajar con el Lenguaje de Programación Python, bueno hasta la fecha de este artículo aún lo es, quizás más adelante ya no lo sea, eso solo lo podemos saber en un futuro.
Si estas familiarizado en trabajar con código Python con otros editores como Sublime Text, Visual Studio Code, Brackets, etc. pues adelante no hay problema.
Pero si quieres utilizar PyCharm el cual es recomendado por Anaconda ya que cuenta con herramientas de Desarrollo en su interior que te facilitan el trabajo profesional con código Python, entre otras características que puedes apreciar si es que usas PyCharm.
Bien si quieres instalar PyCharm, ve a su página oficial, descarga la versión PyCharm Community Edition e instalalo, PyCharm también cuenta con una versión de Pago.
Una vez que terminas de instalar PyCharm, crea un nuevo proyecto dentro de un directorio nuevo y luego crear un archivo llamado saludo.py dentro de este archivo agrega el lo siguiente
1 2 3 |
print("Hola Mundo !") |
Guarda el archivo saludo.py y luego ve al menú Run y elije la opción Run
Te aparecerá en la parte de abajo en la pestaña Run el texto Hola Mundo ! con lo cual verificamos que se ha instalado correctamente PyCharm
Nota: Pycharm, solo lo usaré para limpiar, organizar y corregir mi código, pero no para ciencia de Datos.
Anaconda Navigator
Cuando instalaste Anaconda, este Software trae consigo un conjunto de herramientas que te ayudarán a trabajar de manera optima con algun requisito o necesidad que tengas en mente, una de estas herramientas es Anaconda Navigator que viene a ser como un gestor de herramientas o Software para extender más Anaconda.
Anaconda trae consigo la herramienta Anaconda Navigator, solo debes de buscarlo en tu lista de programas, por ejemplo en Windows al realizar la búsqueda me aparece la herramienta correctamente, hago clic en Anaconda Navigator para ejecutarlo
Cuando abrimos Anaconda Navigator me aparece una ventana con un conjunto de aplicaciones de las cuales mas adelante solamente haremos uso de las necesarias para este tutorial
Conclusión
Hasta aquí ya tenemos desplegado nuestro entorno con un conjunto de herramientas que nos ayudarán a realizar el Análisis de nuestros Datos sin problemas. Más adelante puede que necesitemos instalar otras herramientas, librerías o utilidades si se requiere de estas.
Notas
- Los Pasos y opciones mencionadas en este capitulo del tutorial pueden cambiar, esto no depende de nosotros, si no de las empresas que dan soporte a estas herramientas como Anaconda y Python, que suelen cambiar sus opciones en futuras versiones.
- En el siguiente capitulo empezaremos con la Magia para el Análisis de Datos y otros detalles más.
Síguenos en nuestras Redes Sociales para que no te pierdas nuestros próximos contenidos.