La última vez estuvimos hablando acerca de como resumir la información y entender los resultados de corridas múltiples esta vez vamos a hablar de una forma diferente de hacerlo, que es el uso de gráficos Los gráficos, para analizar los resultados nos brindan una forma visual de resumir los datos no voy a decir si son mejores o peores, sino que son diferentes, algunas personas prefieren resumir los datos en forma textual, algunos piensan que los gráficos son mejores, muchas veces hay más información en los gráficos pero a veces es difícil interpretarlos y hay muchos tipos diferentes de gráficos que pueden ser creados yo siempre encontré que es útil volver a mirar, no únicamente los resúmenes sino ver todos los datos eso es entonces lo primero que vamos a hacer, vamos a ver todos los datos y otra vez, esto es algo que es fácil de hacer en R, así que vamos a ver eso y voy a hablar de como hacer esto en R volvemos al R, vemos la ventana de la izquierda, si recuerdan ya pusimos toda la información, la resumimos y vimos los resultados estadísticos de hecho, tenemos una pieza, vimos las diferencias mínimas significativas entre 150 y 200 en las próximas líneas de estas porciones de código es que vamos a graficar los datos en R, hay un comando estándar que se llama plot y donde la primer entrada es lo que queremos que vaya al eje de las X, en este caso la cantidad de gente, que viene de los datos originales en el eje de las X y en el eje de las Y queremos ver la variable de salida que en este caso es el último tick también le damos un título, que en este caso es "Tiempo para infectar al 100% vs la población inicial", ponemos una etiqueta en el eje de las X que es "Número inicial de personas" y una etiqueta en el eje de las Y y lo hacemos en el comando de las respuestas obtenemos este lindo gráfico, donde podemos ver la dispersión de los datos y como pueden ver hay una gran dispersión en 50, es más estocástico y va para abajo a lo largo del tiempo, pero en 200 y en 150, están muy cerca uno del otro en términos de los valores medios, o en términos de la dispersión total de los datos si queremos ver, esto se llama ventana de quartz en R, escribimos quartz.save y ponemos donde queremos salvarlos y salvamos los datos en un archivo, así luego lo puedo pegar en un documento word o donde quiera, powerpoint, etc. así es como podemos mirar toda la data pero a veces lo que queremos hacer es mostrar algunos gráficos con resúmenes de esos datos, usando estos promedios y desvíos estándar para poder analizarlos ahí podemos usar el comando plot, que es un comando de R, que nos permite agregar barras a esos gráficos y aquí mostramos una desviación estándar aquí ponemos el valor de X, que es el número inicial de personas el valor de Y que es el del último tick y luego tenemos que decirle qué área debe estar debajo y cual debe estar arriba de ese valor de Y entonces quedará como el último tick, perdón es arriba y no abajo, el último tick más el desvío estándar y luego el último tick menos el desvío estándar y otra vez, podemos etiquetarlo, tanto el eje de las X como el de las Y y en este caso en vez de graficar, dejamos afuera este comando, sólo queremos graficar el punto, podemos decirle que los conecte con una línea, porque estamos aumentando el valor y ese valor es una variable continua y entonces podemos graficar con una línea entre ellos luego de ello, por alguna razón en R tenemos que poner este comando pero si ponemos el comando title y ponemos la media podemos graficar aplicamos estos dos comandos y vemos en la ventana de R de gráficos podemos ver este lindo gráfico que muestra las relaciones si estamos interesados en mirar la otra variable y escribir una sentencia, de qué manera es la correcta? pero en vez de ello, podemos querer ver como comparar la media de estas variables diferentes y observar si se solapan entonces necesitamos no utilizar el desvío estándar, sino el error estándar el error estándar es la desviación estándar dividida por el cuadrado de los puntos y lo que eso significa es que a medida que incrementamos los puntos y los acumulamos obtenemos mayor confianza acerca de lo que significa entonces lo que hice aquí es definir primero el número de corridas porque eso es lo que tenemos que saber, ya que es el número de puntos, tomo la medida del conjunto original de datos y lo divido por la medida del conjunto de datos agregados a medida que vemos que los datos agregados tienen la misma cantidad de representaciones en el conjunto de datos eso nos dirá el número de corridas y entonces tomo el último tick y lo divido por el cuadrado del número de corridas para obtener el error estándar ahora podemos volver a graficar con el mismo comando que antes, pero en vez de usar el último tick, la desviación estándar, usaremos el error estándar como mi barra y cuando lo hicimos esto indica que aún cuando la variación es alta, podemos tener confianza en que los valores subrayados de la media de cualquier población que tomemos allí estará ustedes pueden notar que la confianza es más alta para 200 mientras que los otros valores son menores debo mencionar que podemos tener una inspección visual si estas barras se solapan, podremos saber como un hecho que no son estadísticamente significativas pero el hecho de que no se solapen, no nos provee de una confianza perfecta de que son estadísticamente significativos en términos de sus diferencias debemos correr algún test como el de la T de Student o algo así para comparar los datos relevantes, para ver si esos valores son estadísticamente significativos pero usando el error estándar nos brinda una buena medida de cuanta confianza podemos tener en las diferencias entre dos medias que usando el desvío estándar entonces aquí estamos, tenemos este gráfico que resume los datos de nuestros resultados iniciales, parece indicar que es definitivamente el caso que si la densidad de la población crece, el tiempo para que se infecten decrece pero es una relación no lineal y parece que las diferencias comienzan a colapsar entre estas medias, aún cuando no son muy diferentes unas de otras, o parecen ser diferentes y por eso el test para averiguarlo, aquí estamos estas son las respuestas a nuestra investigación inicial