Tu Blog contendrá alguno o varios de los siguientes componentes:
Tablas de datos.
Gráficas.
Mapas.
Análisis de datos geográficos.
Análisis de series de tiempo.
Modelos matemáticos.
Análisis estadísticos.
Análisis de datos moleculares.
Análisis de imágenes.
Análisis de audio.
Alguna otra cosa que sea de tu interés.
Sugiero hacer una reflexión sobre esto y considerar también de qué manera se obtendrán los datos, procesarán y presentarán.
Algunas ideas para animar la charla
Una cosa que podría ser de tu interés es cosechar datos del Internet. R tiene bibliotecas bbastante competenes para hacerlo, pero te invito primero a pensarlo y precisar la idea, para entonces dedicar alguna sesión del taller en el futuro próximo al tema. Junto con esto va una reflexión sobre datos abiertos que tengo previsto tratar y junto con esto alguunos asuntos sobre derechos de autor y licenciamiento del contenido que tu mismo producirás. En tanto resolvemos esta interés, una cosa más sencilla es trabajar con datos que ya tengo en mi poseción, es decir un Excel o documento semejante en mi máquina.
Datos en Mi equipo
Obviamente, la forma más sencilla de acceder a datos es cuando los tenemos en nuestro propio equipo. En este caso lo usual es que sea alguno de los formatos de Microsoft (Word o Excel) o algún formato genérico como los identificados como txt (texto plano) o csv (valores separados por comas). Puuede haber otras variantes de archivos de datos, como kml, GeoJson, GeoTIFF o shp (shape file) usuales en la gestión de datos geográficos. En Genómica está el formato fasta, que también cuenta con bibliotecas adecuadas en R. Hay una correspondiente variedad de recursos para leer todos estos tipos de datos en R así como para analizarlos y preparar resúmenes, modelos y gráficos de interés. A continuación veremos algunos ejemplos sencillos para tener una idea del proceso general. Para nuestros fines didácticos veamos como leer datos de Excel.
Datos Excel
Tengo este archivo de datos obtenidos por D.L. Cunningham de la Universidad de Cornell. Son registros de masa corporal (g) de pollos de acuerdo con su posición en la jerarquía de picotazos (Tabla 1). Veamos los datos. En el procceso de demostración también te comparto como construir una tabla en formato publicable con la biblioteca flextable. Otra posibilidad para trabajar tablas es la biblioteca DT, más orientada a construir tablas que serán utilizadas en forma interactiva.
Los datos están en un formato poco conveniente para un análisis general. Hagamos algunas operaciones para ponerlos en una forma más adecuada. Básicamente buscaremos cambiar del formato extendido, bueno para visualizar, a uno apilado, más apropiado para el análisis estadístico.
Aprovecharé la nueva disposición para demostrar el uso de la biblioteca DT que define la función datatable y un montón de otros recursos para dar formato tabular y anotar los datos de interés.
Otra cosa que puedo hacer ahora es construir un gráfico con los datos utilizando la bibliotea ggplot2, muy capáz de producir gráficos atractivos, incluso como para publicaciones formales. Piensa en qué gráficos te gustaría inlcuir en el blog que estas construyendo. En este enlace encontraras una galería de gráficos que pueden ayudar a estimular tu imaginación e interés.
muestra el escript:
ggplot(pollos_peso, aes(x = jerarquia, y = peso)) +geom_point(color ="darkgreen")
¿qué análisis sugieres habría que hacer ahora? ¿Cómo lo presentarías para asegurar que tu proceso analítico sea reproducible?
Un bonito mapa
¿Piensas que hacer mapas impactantes es cosa de una élite entrenada en GIS? Quizás la belleza de muchos mapas que encontramos por ahí justifica pensar así. Pero ahora podemos aspirar a incluir hermosos mapas en nuestros documentos, pues el acceso a recursos abiertos muy competentes de mapeo ha cambiado mucho. En R tenemos ahora bibliotecas como sf, raster, terra, leaflet, ggplot2 y tmap, además del software especializado QGIS,
Con leaflet incluir mapas, incluso interactivos, es bastante sencillo. Veamos como empezar con esta biblioteca con unas breves instrucciones.
muestra el escript:
library(leaflet) # cargar la biblioteca requerida.basemap <-leaflet() %>%# ubicación de la zona de interés y nivel de zoom inicialsetView(lng =-96.91841, lat =19.515157, zoom =20) %>%# Añade proveedor de mapaaddProviderTiles("OpenStreetMap",# Dale un nombre a la capagroup ="Mapa-OpenStreet" )# despliega el mapabasemap
Agregar capas, marcadores, etc. Tampoco es muy complicado. Veamos un ejemplo.
Otra posibilidad para producir documentos con mapas más bien de tipo impreso es la biblioteca tmap podemos hacer cosas como las siguiente. Usaremos los datos contenidos en el paquete spData para ejemplificar. Aquí está un tutorial sobre esta biblioteca.
Creating animation
Animation saved to C:\Users\equih\0 Versiones\ciencia-reproducible\2025\posts\2025-02-28-contenido\img\urb_anim.gif
muestra el escript:
knitr::include_graphics("img/urb_anim.gif")
Incluir videos
Si por cualquier razón encuentras justificado o importante mostrar algo que está en forma de video, fácilmente puedes agregarlo a tu blog. Tan simple como poner algo semejante a esto directamente en el texto. Es decir no se requiere un trozo de código ( code chunk) sino u código abreviado (shortcode).
{{< video https://youtu.be/wo9vZccmqwc start="10" >}}
Datos mediante captura con el celular
Usar las plataformas móbiles para capturar datos en campo tiene una historia que va a los primeros dispositivos llamados PDA (Personal Digital Assistant) allá por los mediados de 1990. Siguieron los avances que condujeron a la aparición del iPhone® y del sistema Android®. La aparición de Android incentivó el desarrollo que apareció en 2010 como Open Data Kit (ODK). Un poco más adelante un grupo de la Universidad de Harvard desarrolló la aplicación Kobo, basada en el mismo motor de software de ODK, pero con una estrategia de servico distinta. En cualquier caso, para la adquisición de datos en campo la base ODK es sin duda un estandar mundial (Brunette & Hartung, 2023; Hartung et al., 2010). No quiero entrar en los detalles de cada solución, sólo quiero que conozcas de su existencia, para saber más de ellas puedes ir a sus respectivos sitios Web: odkcloud y kobotoolbox. Hay bibliotecas en R para acceder a cualquiera de estas dos soluciones: ruODK, odkr y KoboconnectR, por ejemplo.
Otra opción interesante está en proceso de desarrollo actualmente. La encuentro viable como para satisfacer las neesidades de proyectos muy pequeños en estos momentos. Se trata de los recursos que ofrece la biblioteca surveydown. Aquí te dejo un tutorial de ejemplo sobre como aprovechar este paquete desde Quarto.
Lecturas sugeridas
Brunette, W., & Hartung, C. (2023). The OpenDataKitProject. En T. Madon, A. J. Gadgil, R. Anderson, L. Casaburi, K. Lee, & A. Rezaee (Eds.), Introduction to DevelopmentEngineering: AFramework with Applications from the Field (pp. 613-637). Springer International Publishing. https://doi.org/10.1007/978-3-030-86065-3_23
Hartung, C., Lerer, A., Anokwa, Y., Tseng, C., Brunette, W., & Borriello, G. (2010). Open data kit: tools to build information services for developing regions. Proceedings of the 4th ACM/IEEEInternationalConference on Information and CommunicationTechnologies and Development, 1-12. https://doi.org/10.1145/2369220.2369236