Redalyc.CLUSTER INFORMÁTICO PARA MODELAR LA

Lincoln Williams | Download | HTML Embed
  • Jan 1, 1970
  • Views: 53
  • Page(s): 8
  • Size: 1.02 MB
  • Report

Share

Transcript

1 SABER. Revista Multidisciplinaria del Consejo de Investigacin de la Universidad de Oriente ISSN: 1315-0162 [email protected] Universidad de Oriente Venezuela Quintero, Vernica; Muoz, Miguel; Martnez, Claudia; Daz Ramrez, Arnoldo CLUSTER INFORMTICO PARA MODELAR LA CORRELACIN DE LAS TIC Y LOS RESULTADOS ACADMICOS EN LA PRUEBA ENLACE SABER. Revista Multidisciplinaria del Consejo de Investigacin de la Universidad de Oriente, vol. 27, nm. 2, 2015, pp. 293-299 Universidad de Oriente Cuman, Venezuela Disponible en: http://www.redalyc.org/articulo.oa?id=427742245011 Cmo citar el artculo Nmero completo Sistema de Informacin Cientfica Ms informacin del artculo Red de Revistas Cientficas de Amrica Latina, el Caribe, Espaa y Portugal Pgina de la revista en redalyc.org Proyecto acadmico sin fines de lucro, desarrollado bajo la iniciativa de acceso abierto

2 Saber, Universidad de Oriente, Venezuela.Vol. 27 N 2: 293-299. (2015) ISSN: 2343-6468 Digital / ISSN: 1315-0162 Impreso / Depsito Legal pp 198702SU187 CLUSTER INFORMTICO PARA MODELAR LA Correlacin DE LAS TIC Y LOS RESULTADOS ACADMICOS EN LA PRUEBA ENLACE INFORMATIC CLUSTER FOR MODELING CORRELATION BETWEEN ICT AND ACADEMIC RESULTS OF THE ENLACE TEST Vernica Quintero1, Miguel Muoz2, Claudia Martnez1, Arnoldo Daz R amrez1 1 Instituto Tecnolgico de Mexicali, 2Centro de Bachillerato Tecnolgico Industrial y de Servicios, Mexicali, Baja California, Mxico. E-mail: [email protected] / [email protected] RESUMEN En el marco de las nuevas tecnologas de informacin y comunicacin (TIC) en la Educacin Media Superior se realiza un estudio del impacto que estas nuevas tecnologas tienen respecto al rendimiento acadmico de los estudiantes. El estudio se realiza a travs de un algoritmo de correlacin y una aplicacin informtica que permite analizar y evaluar la relacin de variables que existe entre el uso de estas herramientas y el desempeo obtenido en cada una de las competencias acadmicas. El aporte metodolgico del presente estudio se inscribe en un anlisis cuantitativo utilizando el mtodo y algoritmo matemtico de correlacin lineal estadstica a travs de un cluster informtico. Palabras clave: Competencias, tecnologas, comunicacin, informacin. ABSTRACT Within the framework of the new information and communication technologies (ICT) in the high school, this study is performed to evaluate the impact of these new technologies on the academic performance of students. The study was conducted through a correlation algorithm and a computer program to analyze and evaluate the relationship between variables using these tools and the performance obtained in each of the academic competences. The methodological contribution of this study is performed by a quantitative analysis using the method and mathematical algorithm of statistical linear correlation by means of an informatic cluster. K ey words: Competences, technology, communication, information. INTRODUCCIN confidenciales de estudiantes en diferentes regiones del pas y solo a muestras proporcionadas por las mismas En Mxico anualmente se aplica una evaluacin autoridades escolares sujetas al estudio estadstico nacional de logro acadmico en centros escolares que permitan hasta cierto grado determinar la relacin (ENLACE), es una prueba del sistema educativo existente entre ambos parmetros. nacional que se aplica a planteles pblicos y privados del pas. La prueba ENLACE se usa en educacin bsica La propuesta de esta investigacin se centr en (primaria y secundaria) y en Educacin Media Superior. la correlacin que puede existir entre dos parmetros Esta evaluacin cubre las competencias disciplinarias esenciales de la educacin media superior, uno es bsicas de los campos de comunicacin y matemticas el uso de las nuevas tecnologas de informacin y y cuyo propsito es generar una sola escala de carcter comunicacin (TIC) y el segundo parmetro son los nacional que proporcione informacin comparable de los resultados acadmicos obtenidos por los estudiantes conocimientos y habilidades que tienen los estudiantes en en la prueba ENLACE a nivel nacional. Los datos los temas evaluados clasificndolos en cuatro diferentes requeridos por cada uno de los parmetros son de libre tipos de nivel de dominio los cuales son Insuficiente, acceso, el uso e indicadores de las TIC se obtienen del Elemental, Bueno y Excelente. Instituto Nacional de Geografa Estadstica e Informtica de Mxico (INEGI 2014) y los resultados acadmicos a Anteriormente se han realizado algunos estudios de nivel nacional se obtienen de ENLACE (SEPM 2014). los resultados de la prueba ENLACE con respecto a la influencia que pudiesen tener otros parmetros como Aunque se puede tener acceso libre a los datos de los las calificaciones escolares independientes del sondeo parmetros planteados, la relacin de los datos es muy ENLACE (Campos Vzquez y Urbina Romero 2011), el compleja y se requiere de un mtodo manual para sorteo alcance de este tipo de estudios se limita al uso de datos y filtrado de informacin ya sea para un anlisis global o Recibido: noviembre 2014. Aprobado: febrero 2015. Versin final: abril 2015. 293

3 Quintero et al. regional y esto conlleva a una gran cantidad de manejo de ALGORITMO DE CORRELACIN datos que pueden generar errores muy significativos. Para dar solucin a esta problemtica, en esta investigacin En una distribucin bidimensional puede ocurrir que se ha propuesto un cluster informtico para modelar las dos variables guarden algn tipo de relacin entre s, la correlacin existente entre los parmetros antes el coeficiente correlacin mide el grado de intensidad de mencionados utilizando un algoritmo de correlacin de esta posible relacin entre las variables cuantitativas y se datos en combinacin con algoritmos de calendarizacin calcula aplicando la siguiente frmula (Pita Fernndez y (Berman et al. 2003), para el manejo de gran cantidad Prtega Daz 1997): de informacin as como para la optimizacin de tiempo maquina con el uso de procesamiento paralelo. VARIABLES DE LA PRUEBA ENLACE Y LAS TIC ENLACE clasifica los resultados obtenidos por nivel de dominio, cada uno de los indicadores se clasifica en cuatro diferentes niveles los cuales son Insuficiente, Donde, Elemental, Bueno y Excelente, evaluando as mismo las - n es el nmero de muestras a correlacionar habilidades de comunicacin y matemticas; considrese - Xi, Yi son nmeros reales positivos entonces los cuatro niveles de dominio anteriores como las variables Yi1, Yi2, Yi3, Yi4, respectivamente. - j, k definen el tipo de indicador a correlacionar En lo que respecta al uso de las TIC, los indicadores ms significativos de acuerdo a ICT (Doriska 2009), son el Los valores que puede tomar el coeficiente de uso de la computadora para la seccin de Tecnologas de correlacin r son: -1 < r < 1 Informacin, el uso del telfono celular para la seccin de Tecnologa de Telecomunicaciones y el uso del Internet - Si r > 0, la correlacin lineal es positiva (si sube el para la seccin de Tecnologa de Redes; considrese valor de una variable sube el de la otra). La correlacin entonces estos tres indicadores como las variables Xi1, es tanto ms fuerte cuanto ms se aproxime a 1. Xi2, Xi3, respectivamente. - Si r < 0, la correlacin lineal es negativa (si sube Para realizar el anlisis de la relacin entre las el valor de una variable disminuye el de la otra). La variables, se requiere conocer con que fuerza influye una correlacin negativa es tanto ms fuerte cuanto ms se variable con el comportamiento de la segunda variable, aproxime a -1. es decir, que tan importante es una variable y que tanto influye en el resultado de una correlacin estadstica; en - Si r = 0, no existe correlacin lineal entre las trminos generales la correlacin estadstica determina la variables. relacin o dependencia que existe entre las dos variables que intervienen en una distribucin bidimensional. La Los valores de Xi son porcentajes de uso de las TIC relacin de variables planteadas anteriormente se observa en Mxico y los valores de Yi son porcentajes obtenidos en la Tabla 1. de los alumnos ubicados por nivel de dominio segn resultados obtenidos en la prueba ENLACE en cada Tabla 1. Relacin de variables TIC y ENLACE. una de las entidades federativas del pas. La Figura 1 muestra un ejemplo de datos estadsticos factibles TIC Variables Xi ENLACE Variables Yi para un anlisis de grado de correlacin en el rea de Xi1 Computadora Yi1 Insuficiente Matemticas teniendo como referente el uso de Internet Xi2 Celular Yi2 Elemental (Xi3) en relacin a los niveles de dominio de ENLACE: Xi3 Internet Yi3 Bueno Insuficiente, elemental, bueno, excelente (Yi1, Yi2, Yi3, Yi4). Yi4 Excelente 294

4 Cluster informtico para modelar la correlacin de las TIC... Figura 1. Datos estadsticos para las variables de las TIC y ENLACE (Fuente: INEGI 2012). REPARTICIN DE TAREAS EN EL CLUSTER Previamente el algoritmo se ejecut en un procesador normal (computadora HP Pavilion, procesador 3.4 GHz, El mtodo para modelar la correlacin de las TIC 4 GB SDRAM, 1024 GB 7200 rpm de disco duro). y la prueba ENLACE en Bachillerato es a travs de un Este algoritmo, se volvi muy pesado, con una latencia algoritmo de calendarizacin utilizando un clster de excesiva, y un tiempo de respuesta muy lento, esto se hizo tres computadoras configuradas con el sistema operativo analizando la respuesta de master slave dependiendo de Red Hat de Linux. Para la distribucin de tareas se utiliz la respuesta que dio en cada corrida, es decir, llamaremos el mtodo Messaging Program Intarce (MPI)/Parallel muestra 1 cuando el proceso solo arroje una tarea Virtual Machine (PVM). Es importante destacar que terminada, muestra 2 cuando el proceso arroje dos tares se pueden configurar una mayor cantidad de nodos terminadas y as sucesivamente. La respuesta del modelo (Casanova 2001), el servidor principal lo reconocer y de correlacin fue lenta pero despus de la iteracin le asignar tareas, la configuracin propuesta se muestra (iteracin = milisegundo) cuarenta y uno, empez a tener en la Figura 2. una latencia muy grande, como se muestra en la Figura 3. Figura 2. Arquitectura del algoritmo de calendarizacin Figura 3. Anlisis del modelo de correlacin por iteracin en CPU 295

5 Quintero et al. El siguiente paso fue analizar el comportamiento de balanceo de carga en el Cluster: este mismo algoritmo utilizando el clster propuesto. La planificacin consisti entonces en el despliegue de las - Administrar la disponibilidad de los nodos. tareas de un trabajo sobre nodos del sistema, en nuestro caso fueron nicamente dos nodos de tal forma que el - Configurar atributos de los nodos que sean importantes rendimiento final depender de los siguientes factores: para el balanceo de cargas. - Configurar y disear polticas. - Concurrencia: uso del mayor nmero de procesadores - Administrar reservaciones y recursos dedicados. simultneamente. - Monitorear y registrar un historial de uso de recursos - Grado de paralelismo: el grado ms fino en el que se para usuarios y grupos. pueda descomponer la tarea. En el presente caso, no se incluyeron credenciales - Costes de comunicacin: diferentes entre procesadores de autentificacin o seguridad ya que es interno, sin dentro del mismo nodo y procesadores en diferentes nodos. embargo esto debe de implementarse si se requiere que el cluster tome datos de internet, como lo es base de datos - Recursos compartidos: uso de recursos comunes para del INEGI, en este caso el candado y seguridad lo tendra varios procesadores dentro del mismo nodo. el nodo principal es decir el servidor. El anexo A muestra En cuanto a las reglas para la administracin y la metodologa utilizada de la asignacin de tareas en el cluster. ANEXO A (Asignacin de tareas en cluster informtico) cexec Ejecuta un comando en todos los nodos. # cexec ps | grep ps.txt cget Copia archivos de una cierta ubicacin en los nodos. Ignora enlaces y directorios. Si existe un nombre de archivo con el mismo nombre lo renombra con un sufijo formado por el nombre del nodo del cluster. # cget /etc/rc.d/rc.local ckill Permite finalizar un proceso en ejecucin en los nodos del cluster. Para utilizarlo se utiliza el nombre del proceso, y no su ID de proceso debido que en cada nodo el ID es diferente. # ckill u talkd log.txt cpush Permite mover archivos de una cierta ubicacin en los nodos. # cget /home/local /home/rc.bk crm Permite eliminar archivos y directorios en los nodos. Su funcionamiento es similar al comando rm, con las opciones de interactivo y recursivo. # crm iR /home/dafa/ver1/ cshutdown Permite apagar, reiniciar o suspender un nodo. Las opciones son las mismas del comando shutdown en un sistema Linux. Adiciona el uso de la opcin t para especificar el tiempo que tomar para ejecutar la accin. # cshutdown r t 0 clist , cget , cnum Son utilizados para hacer consultas de archivos de configuracin Se utiliz una planificacin esttica y no dinmica debido a que no se defini el equilibrio de cargas ya que son solo dos nodos y no existe el equilibrio de conexiones ni migracin de datos. La definicin de la toma de archivos en la base de datos para la correlacin esta dada por: chost# clzonecluster show -v sczone chost# clresource delete -F -Z sczone hasp-rs chost# clzonecluster configure sczone czone> remove dataset name=HAzpool czone> commit chost# clzonecluster show -v sczone 296

6 Cluster informtico para modelar la correlacin de las TIC... Finalmente los resultados en el modelado de la inmediato a los procesos requeridos, en este caso no correlacin en el cluster fueron ms estables con respecto existieron tiempos muertos o fueron casi nulos como se al mtodo anterior ya que el tiempo de respuesta fue casi muestra en la Figura 4. Figura 4. Anlisis del modelo de correlacin ejecutado en cluster informtico. RESULTADOS o fuerza con la que influye una variable con respecto a la otra se denota por el valor numrico obtenido por el La ejecucin de los algoritmos con el uso del cluster coeficiente. Las figura 5, 6 y 7 muestran los coeficientes informtico arrojaron datos interesantes en el modelo de correlacin obtenidos para cada uno de los indicadores de correlacin estadstica representado por coeficientes. de las TIC con relacin en las variables de la prueba Los coeficientes fueron el resultado de la relacin entre ENLACE. las dos variables planteadas en la seccin dos y el grado Figura 5. Coeficientes de correlacin entre la variable Xi1(computadora) y variables de la prueba ENLACE. 297

7 Quintero et al. Figura 6. Coeficientes de correlacin entre la variable XI2 (celular) y variables de la prueba ENLACE. Figura 7. Coeficientes de correlacin entre la variable Xi3 (Internet) y variables de la prueba ENLACE. CONCLUSIONES el modelo informtico se debi a que, a travs del procesamiento paralelo, el resultado se define mediante Se ha propuesto un cluster informtico para modelar el clculo simultneo de una ecuacin con mltiples la correlacin de los resultados acadmicos de ENLACE datos a procesar. De manera que el tiempo para resolver en Educacin Media Superior y con relacin al porcentaje un problema se reduce a la asignacin de las tareas a de uso de las TIC de los estudiantes. Cabe mencionar que los recursos de cmputo con lo cual asegura que se los algoritmos planteados en esta investigacin no estn satisfagan y a todas las relaciones de precedencia en limitados al uso exclusivo de los resultados de ENLACE, las tareas (ecuacin). As mismo el cluster informtico cualquier otro indicador de resultados acadmicos tales deja abierta la posibilidad para ser utilizada con como (PISA, EXCALE, entre otros) son factibles para aplicaciones mviles las cuales requieren de tiempos de modelarse en el cluster informtico. Con relacin a procesamiento menores para ser funcionales. los datos acadmicos, el modelo proporciona datos de correlacin estadstica que pueden auxiliar como REFERENCIAS BIBLIOGRFICAS indicadores confiables segn el grado de correlacin obtenido en cada variable para la distribucin y uso Campos Vzquez R, Urbina Romero F. 2011. Desempeo eficiente de las nuevas tecnologas de informacin y educativo en Mxico: La prueba enlace. Estudios comunicacin en las distintas regiones del pas acorde Econmicos. 26(2):249-292. al impacto y necesidades arrojados por los resultados acadmicos. Casanova H. 2001. SimGrid: for simulation of application A toolkit scheduling. IEEE/ACM International La principal caracterstica por la cual fue utilizado Symposium on Cluster Computing and the 298

8 Cluster informtico para modelar la correlacin de las TIC... Grid. Dept. of Comp. Sci. & Eng., California Chichester, USA, pp. 1060. Univ., San Diego, La Jolla, CA. DOI: 10.1109/ CCGRID.2001.923223 INEGI (Instituto Nacional de Geografa Estadstica e Informtica de Mxico). 2012. Gobierno de Doriska MW. 2009. Partnership on Measuring for Mxico. Disponible en lnea en: http://www.inegi. Development. Revisions and Additions to the org.mx (Acceso 03.03.2014). Core List of ICT Indicators. Statistic Commission Background document. INEGI (Instituto Nacional de Geografa Estadstica e Informtica de Mxico). 2014. Gobierno de Pita Fernndez S, Prtega Daz S. 1997. Relacin entre Mxico. Disponible en lnea en: http://www.inegi. variables cuantitativas. Cad. Aten. Primaria. org.mx (Acceso 03.03.2014). 4:141-144. SEPM (Secretaria de Educacin Pblica de Mxico). Berman F, Rey G, Fox C, Hey T. 2003. The Grid: 2014. ENLACE: Evaluacin Nacional para el past, present, future. In: Berman F, Fox G, Hey Logro Acadmico. Disponible en lnea en: http:// T. (Ed). Grid Computing: Making the Global www.elance.sep.gob.mx (Acceso 05.03. 2014). Infrastructure a Reality. John Wiley & Sons Inc, 299

Load More