anonymous 1732734144755

Tengo un archivo de 15gb tipo de archivo .sas pero no he podido trabajarlo en R es muy pesado, es sobre las pruebas PISA quisiera saber como hago para poder procesar esos datos.

Pues a ver, tienes un par de paquetes en R para cargar datos de tipo .sas: {sas7bdat} por un lado y {haven} (función read_sas) por otro.

El problema aquí está en que 15 GB de datos no hay RAM que se lo trague, así que tienes que trabajar en disco sí o sí. La opción más popular es utilizar el paquete {data.table}, que presenta un alto rendimiento para trabajar con volúmenes de datos muy grandes pero cuya sintaxis es un poco diferente a la de R base, así que si te manejas con el Tidyverse puedes utilizar el paquete {dtplyr}.


Reactions

Comments
Leave a comment

Pressing continue will bring you to the following URL:

Are sure you want to go there?


Continue