Partiendo de la base de que todos conocemos Excel, el lenguaje de programación R es menos conocido para el público general, pero un gran aliado de los analistas de datos.
R es un entorno y lenguaje de programación con un enfoque hacia el análisis estadístico. Un software libre y uno de los lenguajes más utilizados en investigación por los científicos de datos. Tiene gran relevancia en áreas de Big Data, minería de datos, Inteligencia Artificial, bioinformática, logística, predicciones en mantenimiento de maquinaria industrial, matemáticas financieras y un largo etcétera.
Además, es una herramienta en constante crecimiento, ya que existe la posibilidad de utilizar diferentes bibliotecas con funcionalidades de cálculo y diferentes gráficas, siendo R una potente herramienta para la visualización de datos.
¿Cuáles son las principales ventajas del lenguaje de programación R frente a Excel?
Para poder entender que módulos o funciones del lenguaje de programación R aportan un valor real respecto a la utilización de Excel, primero hay que entender todo lo que nos puede aportar y en qué ámbitos nos ayuda realmente R para la recogida, tratamiento y visualización de datos:
- Rapidez en cálculo: aunque Excel tenga gran solvencia en realización de operaciones matemáticas, R aporta mayor automatización en muchas más operaciones.
- Es código abierto y gratuito: cambiar código a tu antojo y manejar la interfaz sin tener trabas es algo que en Excel no se puede hacer. En R se pueden escribir funciones para realizar tareas y aportar como paquete para que otros usuarios la utilicen y optimicen. El número de paquetes aumenta día a día.
- Más preciso que Excel: estudios indican que, en cuanto a análisis de regresión lineal, Excel muestra ciertas inexactitudes. El lenguaje de programación R fue creado específicamente para realizar análisis estadístico, por lo que en este punto resulta vencedor.
- Análisis estadísticos avanzados: R posee mayor capacidad estadística que Excel. Esto es en gran parte porque muchos usuarios han contribuido, gracias al código abierto, a crear funciones especializadas.
- Tratamiento de datos: R permite el tratamiento y manipulación de datos con gran velocidad. Generalmente, la mayor parte del tiempo dedicado en un proyecto de análisis con R se invierte en la preparación de los datos, por ello R es mucho más resolutivo y eficaz en la preparación de datos que Excel.
- Automatización y lectura de datos: el lenguaje de script que usa R en lugar de una interfaz gráfica de usuario aporta mayor facilidad en la automatización de tareas. También es capaz de leer prácticamente cualquier tipo de datos (.txt, .dat, .cvs…). Con diversos paquetes extras se podría leer JSON, SPSS, SAS…
- Organización de los proyectos: así como en Excel los proyectos se estructuran en hojas del mismo libro en R las diferentes tareas o sub-proyectos se pueden guardar en archivos diferenciados, aglutinados en la misma carpeta y conectados entre sí en un mismo proyecto con RStudio.
- Trabaja con grandes volúmenes de datos: en cuanto se añaden muchas pestañas, fórmulas y referencias, Excel puede volverse lento con grandes volúmenes de datos. R le supera con creces en este punto, pudiendo absorber grandes volúmenes de datos de fuentes como Hadoop.
- Corrección de errores mucho más sencilla: R utiliza secuencias de comandos en lugar de “clics” como en Excel, permitiendo comentarios y control de versiones. De esta forma se puede acceder a un “historial de acciones”. Esto agrega mayor facilidad de enmendar errores. En Excel podemos errar en una celda y arrastrar un fallo difícil de detectar si no se invierte mucho tiempo.
- Y por último, los gráficos: si R es también famoso por algo es por sus increíbles gráficos. Gráficos tridimensionales, de tallo, Boxplot, de puntos, circulares, histogramas, de dispersión, de independencia.
¿En qué aspectos sigue siendo Excel competitivo?
Teniendo en cuenta lo que nos puede aportar R, vamos a tratar, a grandes rasgos, qué puede aportarnos Excel en contraste con el anterior lenguaje de programación:
- Menor curva de aprendizaje que R: Excel requiere menos tiempo para llegar a manejar gran parte de sus funcionalidades que R. Existe una capa de uso y fórmulas muy básicas que puede usar cualquier persona tras algunas horas de estudio.
- Más ágil para el trabajo diario si no existe una gran carga de estadística: es una obviedad que Excel está mucho más instaurado que R para múltiples funciones del día a día.
- Visualización de datos: las hojas de cálculo pueden convertirse en pantallas de visualización de datos muy agradables, con gráficos sencillos y datos visualmente ordenados en tablas con diferentes diseños.
- Mayor probabilidad de uso colaborativo: a pesar de no ser código abierto (con las bondades que ello implica) en el uso de Excel para el entorno laboral, si se vincula a un servicio en la nube, muchas personas podrán interactuar con dicho proyecto, aportando datos en el archivo, mejorando fórmulas. Excel está mucho más extendido que R.
Conclusiones
Para terminar, podríamos aseverar que R tiene muchas ventajas sobre Excel en cuanto nuestros proyectos se acerquen al Big Data y se necesiten análisis mucho más profundos y complejos en cuanto a predicciones y prescripciones basadas en la estadística. Manejar R con cierta soltura significará muchas horas de estudio y de programación, pero una vez interiorizado dicho lenguaje, las posibilidades a la hora de tratar y visualizar los datos son mucho mayores. El enfoque de R incluye conceptos como iteración (ejecución de las sentencias ubicadas dentro de un ciclo o bucle), estructuras de datos y funciones.
Excel navega genial en mares donde existe aritmética, tabulaciones, trabajo diario de oficina, en especial en al ámbito de la administración (facturas, calendarios…). Gracias a la gama de funciones que posee, también resulta útil para muchos otros campos, como la creación de ciertas bases de datos o gráficos con cierta complejidad.
Sea cuál sea el programa que utilices, esperamos que este artículo haya sido de ayuda para comprender cómo puede ayudar el lenguaje de programación R en proyectos y las principales diferencias que existen frente al archiconocido Excel. Contacta con nosotros para que te ayudemos en la toma de decisiones basada en datos.
Deja una respuesta
Lo siento, debes estar conectado para publicar un comentario.