R, RStudio

Es un lenguaje de programación multi-paradigma y desarrollado con énfasis en estadística, análisis y visualización de datos. Tiene un repositorio de paquetes llamado CRAN, para esta etapa se sugieren paquetes como Plyer, Twang, Ggplot2. El software tiene dos versiones: R y RStudio (más amigable)

Etapa que uso el software:
Grado de dificultad de uso:
Software es libre:

Python

Es un lenguaje de programación multiparadigma que dispone de varios paquetes con distintas funciones y una gran comunidad de desarrolladores. Es multipropósito, se lo puede utilizar en ciencias de datos, desarrollo, administración de sistemas y construcción de aplicaciones web

Etapa que uso el software:
Grado de dificultad de uso:
Software es libre:

Scipy

Es una plataforma de programación para matemáticas, ciencia e ingeniería de código abierto, desarrollada en el lenguaje de programación Python. Provee una función de iteración que permite generar rutinas fáciles de usar y eficientes para integración y optimización numérica, análisis de datos y reporte

Etapa que uso el software:
Grado de dificultad de uso:
Software es libre:

Numby

Es una extensión de Python, que le agrega mayor soporte para vectores y matrices, constituyendo una biblioteca de funciones matemáticas de alto nivel para operar con esos vectores o matrices

Etapa que uso el software:
Grado de dificultad de uso:
Software es libre:

Jupiter

Es una aplicación web de código abierto que permite crear y compartir documentos con código en vivo, ecuaciones, visualizaciones y texto narrativo. Los usos incluyen: limpieza y transformación de datos, simulación numérica, modelado estadístico, visualización de datos, machine learning y entre otros

Etapa que uso el software:
Grado de dificultad de uso:
Software es libre:

Julia

Es un lenguaje de programación dinámico de alto desempeño que incorpora una sintaxis familiar para usuarios de otros ámbitos de la computación. Posee una función sofisticada de compilador y una extensa librería de paquetes que permiten ejecutar funciones matemáticas, estadísticas, entre otras

Etapa que uso el software:
Grado de dificultad de uso:
Software es libre:

Anaconda

Es un software de código abierto desarrollado en Python y que es utilizado para la ciencia de datos y machine learning. Es útil para el procesamiento de grandes volúmenes de información, para análisis predictivos y cómputos científicos debido a que le permite incorporar más de 1.500 paquetes desarrollados para R y Python

Etapa que uso el software:
Grado de dificultad de uso:
Software es libre:

Scikit-learn

Es un paquete de código abierto desarrollado para ejecutar procesos de machine learning en Python, provee de herramientas para el ajuste, selección y evaluación de los modelos, preprocesamiento de datos, predicción, validación cruzada, entre otras

Etapa que uso el software:
Grado de dificultad de uso:
Software es libre:

Apache Spark

Es un motor unificado de análisis para el procesamiento de datos a gran escala. Fue concebida como una plataforma diseñada para mejorar la velocidad y el rendimiento de las aplicaciones de big data

Etapa que uso el software:
Grado de dificultad de uso:
Software es libre:

Accord.NET

Es un paquete que provee al usuario con algoritmos de machine learning, análisis estadístico, inteligencia artificial (IA), reporte computacional y métodos de procesamiento de imágen

Etapa que uso el software:
Grado de dificultad de uso:
Software es libre:

Iniciativa de

Con la contribución de