Tarea Evaluable T2
Esta
entrada tiene por objetivo darle respuesta al planteamiento presentado en la:
Tarea evaluable T2, relacionada con lo dado en la clase de Introducción a R
studio.
Pasos
Año
1:
Bajé
los ficheros de datos con los que voy trabajar:
Luego, abrí la interfaz R studio y cargué el fichero de
datos del año 1 desde la cuadrícula superior derecha: Import Dataset, después seleccioné From text file.
Posteriormente, abro el
contenido del fichero el cual voy a utilizar, estos se cargaran en R. El
fichero muestra el tipo de separador que se utiliza entre variables, que es el
punto y coma (;), el carácter utilizado para separar la parte entera de la
parte decimal de los números es el punto (.). Para que la estructura de datos
se realice sin problemas.
Estos datos se
presentan en una estructura dividida en
cuatro partes que recibe el nombre de cuadrícula.
Aparece una que carga datos y visualiza las variables
de trabajo.
Otra presenta el contenido de dichas variables.
La que se utiliza para introducir los comandos para procesar y analizar los datos.
Y la que se utiliza
para visualizar gráficas.
El siguiente paso consiste en filtrar los datos del año 1.
Para lograr esto, filtré los sujetos por tipo
de entorno, utilizando los siguientes comandos:
> m1 <- subset(Notas.2grupos.v1, grupo=="Moodle")
> g1 <-
subset(Notas.2grupos.v1, grupo=="Google Apps")
Al ejecutar esta acción,
se crearon dos nuevas variables: Moodle (m1) y Google Apps (g1).
El próximo paso es hacer
la representación gráfica por sexo, cuya longitud abarcando el rango de valores
de las variables (grupo y nota) e introduje el siguiente comando en la consola:
> plot(Notas.2grupos.v1$grupo,Notas.2grupos.v1$nota,xlab="Grupos",
ylab="Notas", type="n")
Este paso consiste en comprobar si existe una diferencia
significativa entre los grupos. Dicho análisis se realizará con el comando
presentado a continuación:
> t.test(m1$nota, g1$nota)
Welch Two Sample t-test
data: m1$nota and g1$nota
t = -2.8284, df = 38, p-value = 0.007427
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-1.7157314 -0.2842686
sample estimates:
mean of x mean of y
6.25 7.25
Al obtener el resultado,
puedo concluir diciendo que este indica diferencias significativas para ambos
grupos de estudiantes, puesto que el p-value es
0.007427, siendo su
equivalente 0.7427% de posibilidades de que se obtenga el mismo resultado al
utilizarse nuevamente con un mismo grupo, puesto que el resultado está por
debajo del margen acordado por la comunidad de científicos del cual es 0.05 →
5%.
Pasos
Año 2:
Como anteriormente, en el año 1, habia descargado el fichero, se realizará el mismo procedimiento. Luego, el
siguiente paso es:
Abrir la interfaz R studio, que ya está
instalada en el computador, y cargar el fichero de datos del año 2 desde la cuadrícula superior derecha: Import Dataset, luego selecciono From text file.
Más abajo aparece una ventana en la que se muestra el contenido del fichero
de texto y la estructura de datos que se cargará en R. El fichero incluye una
cabecera, el tipo de separador que utiliza entre variables es el símbolo de
número (#), el carácter utilizado para separar la parte entera de la parte
decimal de los números es el espacio en blanco (whitespace).
Para lograr que la estructura de datos se cree sin problemas, ya que se
presentó, observé que el símbolo de número no está disponible entre las
opciones en el Import Dataset, resuelvo el problema con los siguientes pasos:
- Voy a la Consola que está en la cuadrícula inferior izquierda.
- Hago clic debajo del comando de color azul.
- Presiono la flecha hacia arriba de la tecla de dirección.
- Coloco el símbolo de número (#) entre las comillas de sep=” ”, que está en el comando de color azul.
- Luego, ejecuto la tecla de Enter.
Y asunto
resuelto.
El paso siguiente consiste en filtrar los datos del año 2. Para esto, filtré los
sujetos por tipo de entorno utilizando los siguientes comandos:
> m2 <- subset(Notas.2grupos.v2, grupo=="Moodle")
> g2 <- subset(Notas.2grupos.v2, grupo=="Google Apps")
Al colocar estos dos
comandos en la consola se crearon dos nuevas variables: Moodle (m2) y Google Apps (g2).
Para obtener la representación gráfica utilice el
siguiente comando, que abarca el sexo, el grupo y la nota.
> plot(Notas.2grupos.v2$grupo,Notas.2grupos.v2$nota,xlab="Grupos",
ylab="Notas", type="n")
Para la
realización del Análisis Diferencial Estadísticamente Significativa Entre Las Calificaciones,
se prosigue a:
Escribir el
siguiente comando:
> t.test(m2$nota,
g2$nota)
Welch Two Sample t-test
data: m2$nota and g2$nota
t = -1.7514, df = 36.284,
p-value = 0.08832
alternative hypothesis: true
difference in means is not equal to 0
95 percent confidence interval:
-1.5103499
0.1103499
sample estimates:
mean of x mean of y
6.55 7.25
Los resultados demuestran que no hay una diferencia
significativa entre ambos grupos de
estudiantes, puesto que p-value=0.08832→8.832%, destacando una posibilidad de adquirir resultados
diferente si se lleva a cabo el mismo procedimiento para igual cantidad de
alumnos, destacando que mayor que el permitido por la comunidad científica que
es de 5%.
Este análisis de interpretación de datos para mi
significó un reto, puesto que como no soy de la área de tecnología, los
comandos utilizados en el mismo eran de desconocimiento para mí, tuve que leer
bastante, ver algunos tutoriales, reunirme en muchas ocasiones con compañeros y
en un momento quise tirar la toalla, pero no me di por vencida.
Me queda la
satisfacción de haber salido a camino, el conocer a más profundidad el R studio
y su valor que tiene el cual no sabía, pude darlo a conocer a otras personas de
mi centro educativo y aprendí a utilizar el lenguaje tecnológico un poco más.
0 comentarios:
Publicar un comentario