Software abierto y herramientas útiles para investigadores

Software abierto y herramientas útiles para investigadores

El desarrollo de nuevas tecnologías y de los lenguajes de programación conlleva que el investigador cuente con aplicaciones muy interesantes para su labor investigadora y que exigen una formación permanente. Existen diferentes herramientas libres y/o gratuitas y de código abierto que permiten al investigador organizar y sistematizar los datos recopilados a lo largo de la investigación y ahorrar un tiempo valioso. Entre las numerosas aplicaciones, hemos seleccionado las siguientes por su interés e implantación:

Análisis de datos

  • Phyton: es un lenguaje de programación muy potente que se utiliza también para procedimientos avanzados en el análisis de datos. Resulta muy útil para importar y exportar conjuntos de datos. Permite también limpiar o preparar datos, incluyendo procesos como la normalización, identificación y tratamiento de valores perdidos. Además, cuenta con más funcionalidades como agrupación de conjuntos de datos, correlación y estadísticas descriptivas. Sin olvidar que puede usarse también para manejar regresión lineal simple, regresión lineal múltiple y regresión polinominal.
  • Lenguaje R: es una de las mejores herramientas de análisis de datos estadísticos y su visualización. Así, incluye programas estadísticos (modelos lineales y no lineales, tests estadísticos, análisis de series temporales, algoritmos de clasificación y agrupamiento, etc.) y gráficos. Admite el aprendizaje automático y el análisis de datos avanzados. Posibilita la creación de gráficos de alta calidad, sorprendentes y sofisticados. Su sintaxis básica es sencilla e intuitiva, lo que se traduce en un aprendizaje rápido y cómodo; además, tiene una enorme comunidad de usuarios, estructurada alrededor de la Comprehensive R Archive Network, CRAN, que desarrolla cada día nuevos paquetes que extienden sus funcionalidades y cubren casi todas las necesidades computacionales y estadísticas de un científico.
  • PSPP: es un programa de software libre para el análisis estadístico de muestras de datos. Es una alternativa gratuita a SPSS bastante similar, pero con algunas pequeñas diferencias. Permite realizar t-test, ANOVA, regresión lineal y logística; análisis de conglomerados, de confiabilidad y factoriales, entre otras.  PSPP está disponible para un gran número de distribuciones LINUX, así como para Windows y Mac OS X. También se distribuye desde un CD de arranque (Live CD) que no requiere instalación.

Extracción y curación de datos

  • Tabula: es una aplicación gratuita que permite manejar y extraer la información contenida en las tablas de un pdf fácilmente. Está disponible para Windows MacOS y Linux y es muy intuitiva. Simplemente, cargaremos el archivo PDF, marcamos la tabla o contenidos a extraer haciendo click en Preview & Export Extracted Data. Indicamos el formato de archivo de exportación que más nos interese como CSV, TSV, JSON, etc. Así, si optamos por CSV podremos trabajar posteriormente con los datos en una hoja de cálculo de Excell, Google Sheets o LibreOffice Calc.
  • Open Refine: es una herramienta de código abierto que sirve para limpiar, ordenar, transformar y extender registros incluidos en grandes conjuntos de datos. En ocasiones, los datos que nos interesan no son fácilmente utilizables, debido a errores o que se encuentran en formatos incompatibles. Por ello, Open Refine nos permite curar y convertir datos sucios en datos limpios y que se puedan reutilizar de forma sencilla, examinar valores de determinados sites y relacionarlas con bases de datos como Freebases, entre otras. 

Mapas conceptuales

  • draw.io: es una herramienta de diagramación, de diagrama de flujo, de proceso, entre otras muchas funciones. Es una aplicación de código abierto con la que se puede dibujar cualquier tipo de mapas mentales, mapas conceptuales, esquemas o diferentes representaciones gráficas, como diagrama de jerarquía o conjuntos. Cuenta con una serie de plantillas para facilitar el trabajo. Permite guardar las creaciones en distintos formatos, incluyendo PDF, PNG o JPG y en distintas aplicaciones de la nube, como Google Drive o Onedrive, entre otras.
  • creately.com: se trata de una aplicación que permite hacer diagramas y mapas conceptuales muy visuales y de una forma sencilla. Para facilitar la tarea ofrece un sistema de temas para inspirarse. También puede servir para esbozar conceptos, analizar procesos o generar planificaciones. Ofrece una gran cantidad de gráficos, formas y conectores para hacer hasta 70 tipos diferentes de diagramas.

Esperamos que os resulten interesantes y que os sirvan de ayuda a vuestra labor investigadora. De todas ellas encontraréis abundante documentación, tutoriales y manuales para aprender a sacarle el máximo rendimiento, e incluso también grandes comunidades y foros para resolver dudas, como en el caso de Phyton y R.

Foto de Marvin Meyer en Unsplash