Minería de datos educativaLa minería de datos educativa es la utilización de la minería de datos en el ámbito de la enseñanza. La minería de datos, también conocida como Descubrimiento de Conocimiento en Bases de datos (sus siglas en inglés son KDD, por Knowledge Discovery in Databases), es el campo que nos permite descubrir información nueva y potencialmente útil de macrodatos o grandes cantidades de datos. Se ha empleado en numerosos campos, incluyendo desde los ya conocidos casos de cesta de la compra hasta la bioinformática o investigaciones contra el terrorismo. Recientemente, se ha incrementado el interés en utilizar la minería de datos en el estudio educacional, centrándose en el desarrollo de métodos de descubrimiento que utilicen los datos de plataformas educacionales y en el uso de esos métodos para comprender mejor a los estudiantes y el entorno en el que aprenden. Los métodos empleados en la minería de datos en la educación suelen diferir de los métodos más generalistas, explotando explícitamente los múltiples niveles de jerarquía presentes en los datos. Métodos psicométricos suelen ser integrados con métodos de aprendizaje máquina y textos de minería de datos para lograr los objetivos. Por ejemplo, obteniendo datos sobre cómo los estudiantes eligen utilizar el software educacional, puede ser realmente útil considerar datos a distintos niveles sobre las pulsaciones de teclas, nivel de respuestas, del alumno, de la clase o de la escuela entera. Otros temas como el tiempo, secuencia o incluso el contexto juegan papeles importantes en el estudio de datos educacionales.[1] DefiniciónLa minería de datos educativos (EDM) hace referencia a las técnicas, herramientas y la investigación diseñados para extraer automáticamente el significado de grandes repositorios de datos generados por o relacionados con las actividades de aprendizaje en los centros educativos. Muy a menudo, estos datos son extensos y muy precisos. Por ejemplo, varios sistema de gestión de aprendizaje rastrean información como cuando cada estudiante accede a cada objeto de aprendizaje, cuántas veces accede a él y cuántos minutos se visualiza el objeto de aprendizaje en la pantalla del ordenador del usuario. Otro ejemplo son los sistema inteligentes de tutoría, que registran datos cada vez que un alumno presenta una solución a un problema; pueden recoger el momento de la presentación, si la solución coincide con la solución esperada, la cantidad de tiempo que ha pasado desde la última presentación, el orden en que se introdujeron en la interfaz los componentes de la solución, etc. La precisión de estos datos es tal que incluso una sesión bastante corta con un entorno de aprendizaje basado en computadoras puede producir una gran cantidad de datos de proceso para el análisis. En otros casos, los datos son menos precisos. Por ejemplo, una universidad puede contener una lista temporal ordenada de los cursos a los que asiste un estudiante, la titulación que el estudiante obtuvo en cada curso y cuándo el estudiante selecciona o cambia de carrera. La minería de datos educativos aprovecha ambos tipos de datos para descubrir información significativa sobre los diferentes tipos de alumnos y cómo aprenden, la estructura de dominio de conocimiento y el efecto de las estrategias de enseñanza integrados dentro de diversos ambientes de aprendizaje. Estos análisis proporcionan nueva información que sería difícil de discernir fijándonos únicamente en los datos en bruto. Por ejemplo, el análisis de los datos de un LMS puede revelar una relación entre los objetos de aprendizaje a los que un estudiante accede durante el curso y su calificación final. Del mismo modo, el análisis de los de un estudiante puede revelar una relación entre la calificación de un estudiante en un curso particular y su decisión de cambiar su especialidad académica. Esta información proporciona una visión en el diseño de ambientes de aprendizaje, lo que permite a los estudiantes, profesores, administradores escolares y responsables de las políticas educativas tomar decisiones informadas sobre la forma de interactuar, proveer y administrar los recursos educativos. HistoriaMientras que el análisis de los datos de estudios no es en sí mismo una nueva práctica, los avances recientes en tecnología educativa, incluyendo el aumento de la potencia de cálculo y la capacidad de registrar los datos precisos sobre el uso de un entorno de aprendizaje basado en computadoras de los estudiantes, han dado lugar a un creciente interés en el desarrollo de técnicas para el análisis de grandes cantidades de datos generados en los centros educativos. Este interés se tradujo en una serie de talleres de celebrados del 2000 al 2007 en el marco de varias conferencias internacionales.[2] En 2008, un grupo de investigadores estableció lo que se ha convertido en una conferencia internacional de investigación anual sobre EDM, la primera de las cuales tuvo lugar en Montreal , Canadá.[3] Como el interés en EDM siguió aumentando, los investigadores crearon una revista académica de EDM en 2009, el Diario de la minería de datos educativos, para el intercambio y la difusión de resultados de investigación. En 2011, los investigadores crearon la Sociedad Internacional para la de minería de datos educativos para conectar investigadores en EDM y que este campo siga su crecimiento. Con la introducción de los repositorios de datos educativos públicos en 2008, tales como la Pittsburgh Science of Learning’s Centre, Datashop y el National Center for Education Statistics, los conjuntos de datos públicos han hecho que la minería de datos educativos sea más accesible y habitual, lo que contribuye a su crecimiento.[4] ObjetivosBaker y Yacef[5] identificaron los siguientes objetivos del EDM:
TécnicasLas técnicas de minería de datos son también conocidas como técnicas de análisis, y se emplean para encontrar un significado a la gran cantidad de datos que se dispone. Son las que permiten realizar la interpretación de los datos para darle significado que podamos comprender. Aunque pueden darse diferentes tipos de análisis, estos suele ser ser predictivos o perceptivos. En el campo educativo, se han usado para pronosticar fracaso escolar y poner en práctica acciones que permitan evitarlo.[6] Las numerosas investigaciones han dado como resultado las técnicas de minería de datos. Esta evolución se inicia cuando toda la información y datos obtenidos se empiezan a almacenar en ordenadores, con continuas mejoras tanto en el acceso a los datos como en la tecnología. A día de hoy esto a generado que los usuarios naveguen y comprueben datos en tiempo real. El almacenamiento de grandes bases de datos es crítica para la minería de datos.[7] Herramientas para analíticas de aprendizajesLos miles de datos de los que se dispone se consideran un factor trascendental de información que debe ser analizada con las debidas técnicas de minería de datos, ya que si no quedaría oculta entre todo el mar de datos, sin conexión entre ellos, aislados. El desarrollo de las analíticas de aprendizaje en el ámbito educativo se ha apoyado en las ciencias de la computación, de la estadística y de las teorías del aprendizaje y el campo de la educación. En este campo se han distinguido dos aspectos de las analíticas de datos educativos:[8]
Usuarios y participantesHay cuatro usuarios y participantes implicados en la minería de datos educativos:
Fases de la minería de datos educativosComo la investigación en el campo de la minería de datos educativos ha seguido creciendo, una gran variedad de técnicas de minería de datos se han aplicado a diversos contextos educativos. En cada caso, el objetivo es traducir los datos en bruto en información significativa sobre el proceso de aprendizaje con el fin de tomar mejores decisiones sobre el diseño y la trayectoria de un ambiente de aprendizaje. Por lo tanto, el EDM generalmente consta de cuatro fases:[15][16] La primera fase del proceso de EDM (sin contar el pre-procesamiento) es el descubrimiento de las relaciones entre los datos. Esto implica la búsqueda a través de un repositorio de datos de un entorno educativo con el objetivo de encontrar relaciones consistentes entre variables. Se usan varios algoritmos para la identificación de este tipo de relaciones, incluyendo la clasificación estadística, el análisis de regresión, el análisis de agrupaciones, el análisis de redes sociales, la aplicación de reglas de asociación y la extracción de secuencias. Las relaciones descubiertas deben ser entonces validadas con el fin de evitar errores. Las relaciones validadas se aplican para hacer predicciones eventos futuros en el ambiente de aprendizaje. Las predicciones se utilizan para apoyar los procesos de toma de decisiones. Durante las fases 3 y 4, los datos se visualizan de manera diseminada para facilitar la emisión del juicio humano. Mucho se ha estudiado para llevar a cabo en las mejores visualizaciones de datos con este fin. Principales enfoquesDe las categorías generales de los métodos mencionados, la predicción, el análisis de agrupaciones y la extracción de relaciones se consideran los métodos universales en todos los tipos de minería de datos. Sin embargo, el descubrimiento con modelos y la diseminación de datos para el juicio humano se consideran aproximaciones más prominentes dentro de la minería de datos educativa.[4] Descubrimientos con modelosEn el método de descubrimiento con modelos, un modelo se desarrolla a través de la predicción, la agrupación o la ingeniería del conocimiento del razonamiento humano, y luego es usado como un componente de otro análisis, más concretamente, en la predicción y la extracción de relaciones. En la predicción, las predicciones del modelo creado se utilizan para predecir unas nuevas variables dependientes e independientes. Para el uso la extracción de relaciones, el modelo creado permite el análisis entre las nuevas predicciones y variables adicionales en el estudio. En muchos casos, el descubrimiento de los modelos utiliza modelos de predicción validados que han demostrado su generalización a través de contextos diversos. Las aplicaciones clave de este método incluyen el establecimiento de relaciones entre las conductas de los estudiantes, sus características y las variables contextuales en el ambiente de aprendizaje.[4] Diseminación de datos para el juicio humanoLos seres humanos pueden hacer inferencias acerca de los datos que pueden ir más allá del ámbito en el que la minería de datos automatizada proporciona. Para el uso de la minería de datos educativos, los datos se diseminan para el juicio humano con dos propósitos fundamentales: su identificación y su clasificación. En lo concerniente a la identificación, los datos se diseminan para permitir que las personas identifiquen patrones bien conocidos, que de lo contrario pueden ser difíciles de interpretar. Por ejemplo, la curva de aprendizaje, clásica de los estudios educativos, es un patrón que refleja claramente la relación entre el aprendizaje y la experiencia a través del tiempo. Los datos también se diseminan a los efectos de su clasificación. La clasificación estadística se utiliza, en la minería de datos educativos, para apoyar el desarrollo del modelo de predicción. La clasificación ayuda a acelerar el desarrollo del modelo de predicción tremendamente. El objetivo de este método es resumir y presentar la información de una manera interactiva y atractivo a la vista, de manera que sea útil para comprender las grandes cantidades de datos de educativos. En particular, este método es beneficioso para los educadores en la comprensión de la información del uso por parte de los alumnos y la eficacia de las actividades del curso. Las aplicaciones clave para la diseminación de los datos para el juicio humano incluyen la identificación los patrones de aprendizaje de los estudiantes, el comportamiento, las oportunidades para la colaboración y los datos de etiquetado para futuros usos en los modelos de predicción.[4] AplicacionesCristóbal Romero y Sebastián Ventura[16] elaboraron una lista de aplicaciones primarias del EDM. En su taxonomía, las áreas de aplicación del EDM son las siguientes:
Las últimas investigaciones sobre entornos de aprendizaje en el teléfono móvil sugieren que la minería de datos puede ser útil. La minería de datos se puede utilizar para ayudar a proporcionar contenido personalizado para los usuarios móviles, a pesar de las diferencias en la gestión de contenidos entre dispositivos móviles y dispositivos estándar como PCs y sus navegadores web.[14] Las nuevas aplicaciones de EDM se centrarán en que los usuarios no técnicos utilicen las herramientas y realicen lactividades de minería de datos, de manera que la recopilación de datos y su procesamiento sea más accesible para todos los usuarios de EDM. Algunos ejemplos incluyen las herramientas estadísticas y de visualización que analizan las redes sociales y su influencia en los resultados del aprendizaje y la productividad.[17] Costes y retosJunto a los avances tecnológicos, tenemos los costos y los desafíos asociados con la implementación de aplicaciones de EDM. Estas incluyen los costos de almacenar los datos registrados y los costos asociados con la contratación de personal dedicado a la gestión de los sistemas de datos. Además, los sistemas de datos no siempre pueden integrarse a la perfección entre sí e incluso con el apoyo de herramientas estadísticas y de visualización, la creación de una versión simplificada de los datos puede ser difícil. Por otra parte, la elección de qué datos extraer y analizar también puede ser un reto, por lo que las etapas iniciales son largas y el trabajo es muy intensivo. De principio a fin, la estrategia y la ejecución de la EDM requiere que se defienda la privacidad en Internetde para todos los actores involucrados.[18] Pese a que las predicciones y el mercado laboral demandan profesionales especializados en minería de datos, es una incógnita lo que puede suceder con dicho ámbito profesional en el futuro. La ciencia de datos se encuentra en un estado de crecimiento muy alto, con una alta exigencia para dichos profesionales, lo que supone una gran inversión económica tanto a nivel formativo como laboral, tanto a nivel empresarial como en el ámbito concreto de la educación.[19] Ventajas respecto a los paradigmas tradicionales de investigación educacionalLa minería de datos educacionales ofrece numerosas ventajas comparándola con los paradigmas más tradicionales de investigación relativa a la educación, como experimentos de laboratorio, estudios sociológicos o investigación de diseño. En particular, la creación de repositorios públicos de datos educacionales ha creado una base que hace posible la minería de datos educacionales. En particular, los datos de estos repositorios son totalmente válidos (ya que son datos reales sobre el rendimiento y aprendizaje de estudiantes reales, en ambientes educacionales, tomados en tareas de aprendizaje), y cada vez más fácilmente accesibles para comenzar una investigación. Estos puntos permiten a los investigadores ahorrar mucho tiempo en tareas como la búsqueda de individuos (tales como escuelas, profesores y alumnos), organización de los estudios y recopilación de datos, ya que estos se encuentran directamente accesibles. Aunque el uso de datos previamente recogidos limita los análisis a las cuestiones que conciernen a estos datos, una investigación previa puede resultar extremadamente útil para analizar cuestiones poco relacionadas con los datos tomados, como por ejemplo atributos de los estudiantes tales como comportamiento estratégico o motivación. La disponibilidad de estos datos ha supuesto un gran avance. Una vez definido un modelo de interés educativo sobre los datos, puede probarse con nuevos conjuntos de datos. La transferencia de estos modelos puede no ser trivial, pero el proceso de desarrollo y validación de un modelo para un nuevo contexto es mucho más rápido. Gracias a esta faceta, muchos análisis se han podido repetir sobre distintos sistemas o contextos de aprendizaje. Además, la existencia de miles de alumnos que usan herramientas de aprendizaje similares, aunque sea en distintos contextos, aporta una posibilidad nueva de estudiar la influencia de factores contextuales en profesores y alumnos. Históricamente, ha sido muy difícil estudiar cómo las diferencias entre grupos de profesores o clases influencian en aspectos específicos del aprendizaje. Este tipo de análisis resulta mucho más fácil con la minería de datos. De manera similar, el impacto de diferencias individuales ha sido difícil de estudiar estadísticamente con métodos tradicionales. La minería de datos aplicada al ambiente educativo posee el potencial de extender un conjunto de herramientas mucho más amplio para el análisis de cuestiones importantes sobre diferencias individuales.[1] Críticas
Referencias
|