Más que información momentánea, los datos son, en cierto modo, activos atemporales: mantener su relevancia histórica en el tiempo los convierte en un referente constante y en el punto de partida esencial de futuras investigaciones. Por su parte, las colecciones de datos obtenidas del alumnado permiten orientar con precisión las políticas de educación superior y apoyar distintos análisis que contribuyen a la mejora del proceso educativo. Bajo este principio opera el Data Hub del Instituto para el Futuro de la Educación del Tecnológico de Monterrey.
El IFE Data Hub brinda acceso a colecciones de datos institucionales accesibles para la comunidad educativa del Tecnológico de Monterrey, así como para investigadores nacionales e internacionales que busquen llevar a cabo proyectos de investigación en innovación educativa. De igual manera, facilita datos abiertos y comparte hallazgos derivados de sus convocatorias y contribuciones académicas institucionales. La publicación de estos datos y hallazgos es clave para su validación y posterior reutilización por otros expertos del área, asegurando el rigor científico al ejecutar optimizaciones en los programas o líneas de acción formativas.
Su labor encuentra su motor en la calidad de la educación y la eficiencia en los procesos dentro de la universidad para apoyar a los estudiantes, quienes son el eje central. El equipo aporta a las estrategias institucionales propuestas para mitigar desafíos educativos diversos, como el abandono, e impulsar la retención estudiantil, el sentido de pertenencia o el compromiso social.
Este esfuerzo es encabezado por Joanna Alvarado-Uribe, líder del IFE Data Hub; Paola G. Mejía Almada, coordinadora de operaciones de datos; Ubaldo Martínez, coordinador de aseguramiento de calidad de datos; y Alma Rosa Mena Martínez, especialista de proyecto. Sus acciones están siempre alineadas con contemplar el entorno y el contexto de cada alumno, tomando en cuenta factores como la institución y la experiencia académica de los aprendices que son variables en la investigación.
Tener esta información curada y bajo métricas de calidad documentadas es valioso para estudios posteriores, garantizando que se tiene un trasfondo de los datos recolectados a fin de evitar sesgos o ambigüedades.
Prácticas efectivas en la curación de datos
Joanna Alvarado-Uribe comparte algunos hallazgos clave del IFE Data Hub derivados de su proceso de investigación. Estos aprendizajes son un estándar de buenas prácticas para la tarea de custodia y aseguramiento de la calidad de los datos académicos.
Primero que nada, establece que es importante hacer del conocimiento de los estudiantes del Tecnológico de Monterrey que los datos que se recaban tienen un propósito. La información finalmente es de utilidad para los alumnos, pues su uso tiene como objetivo aportar a la calidad de su aprendizaje y velar por que puedan continuar con sus estudios. Por ejemplo, uno de los resultados fue el valor de su involucramiento en actividades LiFE, las cuales unen a la comunidad estudiantil con atracciones culturales, artísticas y deportivas. Los participantes destacaron que durante las mismas hacían amigos siendo foráneos, tenían acceso a mejores oportunidades y se sentían más comprometidos con la universidad y su entorno, motivándolos a seguir formando parte de la institución. Más allá de una consulta, se fomenta un espacio para analizar y modelar estos datos con el fin de proponer iniciativas y co-diseñar las soluciones que transforman su propia experiencia.
Otros factores que influyen en la retención o el abandono estudiantil incluyen las becas otorgadas, ya que su impacto depende tanto del porcentaje como del tipo de apoyo recibido. Asimismo, la situación de ser estudiante foráneo añade un nivel adicional de complejidad. Para estos estudiantes, suele ser más difícil continuar con sus estudios durante el primer año, etapa en la que comúnmente ocurre el abandono. Incluso se ha detectado que este fenómeno puede presentarse desde el proceso de inscripción en los primeros y segundos años y no únicamente durante el desarrollo de las clases.
Por otro lado, Alvarado-Uribe indica que es fundamental revisar y guiarse por los avisos de privacidad que son expuestos a todos los usuarios de la institución, los cuales aceptan y firman, pues estos establecen las finalidades de la recolección de datos. Por tanto, en este caso, es primordial garantizar que se haya obtenido el consentimiento para acceder a la información del estudiante con fines de investigación, así como asegurarse de que el uso y la publicación de dichos datos se ajusten a las métricas y los lineamientos institucionales.
Lo anterior es de vital relevancia para determinar en qué momento puede recopilarse esta información. Sin embargo, también es posible considerar los lineamientos de gobernanza de datos, tanto a nivel institucional como global. Esta orientación permite delimitar la gestión de datos personales y la normatividad aplicable a información sensible desde una perspectiva legal, lo que facilita identificar qué información puede proporcionarse y de qué manera.
Además, expresa que es primordial que los datos sean anonimizados. Esta práctica contribuye a disociarlos, evitando la reidentificación de las personas involucradas, ya sean estudiantes o profesores analizados. No obstante, surge el desafío de que, en caso de existir información sensible, lo más sencillo sería eliminarla, pero implicaría la pérdida de datos valiosos. Entonces, se opta por definir cómo se presentará dicha información, por ejemplo, mediante la creación de nuevas categorías o rangos.
Gracias al equipo de Techvolution del Tecnológico de Monterrey, que unifica las experiencias digitales de atención y servicio para hacerlas más claras, ágiles y efectivas, la información llega al Data Hub con un identificador anonimizado. Sin embargo, es fundamental cuidar el cruce de datos y asegurarse de que no se filtren datos sensibles, particularmente, si existe un alumno proveniente de un país del que no hay otros registros, podría volverse identificable; en esos casos, se activa un protocolo adicional de calidad que procesa la información para evitar cualquier posibilidad de asociación.
A pesar de que no se tiene control absoluto sobre quién tendrá acceso final a los datos, estos se resguardan y protegen mediante las medidas mencionadas. Asimismo, el equipo puede dar seguimiento a los actores identificados a quienes se les otorga acceso. Definir los fines para los que se utilizará esta información permite monitorear su uso. Por esta razón, se diseñó un proceso de validación de perfiles mediante un registro y se elaboró un documento de Términos de Uso de Datos y Condiciones, en conjunto con el área Legal y de Gobierno de Datos. En los casos en que la solicitud tenga fines empresariales o económicos, el acceso se rechaza categóricamente, ya que el propósito principal es de carácter académico y de investigación.
Desafíos en la sistematización de información estudiantil
El IFE Data Hub tiene un proceso de sistematización que aplica técnicas estadísticas y de análisis exploratorio de datos. Dichos métodos examinan la calidad de la información mediante la identificación de frecuencias, la detección de valores faltantes o atípicos (outliers, en inglés) y la revisión de datos inconsistentes. Este estudio resulta esencial para identificar registros que están fuera de rangos lógicos, ya sea por errores de captura o por inconsistencias, como valores desproporcionados que no corresponden a la realidad.
Alvarado-Uribe explica que una vez emitida esta primera validación, se requiere una verificación adicional en colaboración con las áreas responsables de la recolección de datos. Este paso es clave para asegurar que las definiciones, valores y características de cada variable se interpreten y representen correctamente. De igual forma, se integra la perspectiva de gobierno de datos, lo que añade un nivel significativo de complejidad al garantizar la consistencia y la adecuada gestión de la información a nivel institucional.
Uno de los principales retos radica en la heterogeneidad de los datos, puesto que la información proviene de múltiples fuentes y es entregada en diversos formatos, tanto estructurados como no estructurados. Lo anterior obliga a aplicar técnicas específicas según el tipo de dato. Un ejemplo es que el tratamiento de las variables cuantitativas difiere sustancialmente del de las variables cualitativas. A ello se suma la necesidad de estandarizar los formatos, como en el caso de fechas o valores numéricos, a fin de evitar inconsistencias que comprometan la validez del análisis.
Otro desafío relevante es la evolución temporal de los datos, describe Alvarado-Uribe. Existen variables recolectadas durante determinados periodos que posteriormente son modificadas, dejan de capturarse o cambian de formato. Esto exige una revisión cuidadosa para identificar equivalencias, cambios estructurales o vacíos de datos, así como una comunicación constante con las áreas generadoras para comprender el contexto de los cambios.
Por otro lado, la documentación constituye un elemento vital dentro de este ecosistema. Si bien los equipos de análisis pueden proponer definiciones para cada variable de la colección de datos, es indispensable contar con la validación de los expertos de cada área, quienes tienen conocimiento específico sobre los datos. Esto cobra especial relevancia cuando existen variables con diferencias sutiles pero significativas que deben ser claramente distinguidas para evitar ambigüedades en su interpretación.
En cuanto a lo operativo, el tratamiento de datos incluye la generación de estadísticas descriptivas, como promedios, desviaciones estándar, porcentajes y tablas cruzadas, así como la visualización de distribuciones mediante gráficos. También conlleva procesos de limpieza y estandarización con el objetivo de asegurar la homogeneidad de los datos. En casos como éste, se determina si la información puede recuperarse o corresponde clasificarla como “no aplicable”, documentando adecuadamente las razones.
La utilización de los datasets
El valor del trabajo del IFE Data Hub se refleja no sólo en la mejora de la calidad de los datos, sino también en su impacto en la generación de conocimiento. A partir de estos procesos, se han derivado múltiples investigaciones académicas, así como mecanismos de transferencia de conocimiento hacia áreas administrativas, mediante talleres y espacios colaborativos en los que se comparten hallazgos y mejores prácticas.

Los despliegues a partir de los conjuntos de datos proporcionados por el IFE Data Hub han permitido analizar el impacto de las políticas educativas institucionales en la comunidad de alumnos, reconociendo que cada contexto y perfil del alumno requieren intervenciones específicas y oportunas. En este marco, destacan estudios vinculados a programas como la iniciativa Líderes del Mañana, enfocados en comprender cómo los estudiantes de alto desempeño combinan excelencia académica con compromiso social con el propósito de identificar metodologías replicables que fortalezcan la retención y el bienestar estudiantil.
Asimismo, se han desarrollado análisis comparativos entre modelos educativos y evaluaciones longitudinales que abarcan datos desde las admisiones hasta el rendimiento académico (competencias). Hallazgos que contribuyen directamente a áreas como Desarrollo de Vivencia y Experiencia Educativa y Analítica e Inteligencia de Negocios, ayudando a mejorar modelos predictivos, identificar a estudiantes en riesgo de abandono y fortalecer programas cuya efectividad ha sido respaldada (Modelo Tec21).
Otro aporte relevante ha sido la generación de recomendaciones que van desde la investigación hasta la práctica institucional, incluyendo optimizaciones en los instrumentos de seguimiento, la incorporación de variables no cognitivas (rasgos de personalidad o motivación) y el refuerzo de estrategias integrales de acompañamiento estudiantil. Estos esfuerzos se extenderán al nivel de posgrado, ampliando el alcance del análisis.
En conjunto, estos estudios reflejan un enfoque multifactorial que reconoce la diversidad de los estudiantes y utiliza los datos como base para diseñar intervenciones más precisas, con el objetivo de incrementar la permanencia y enriquecer la experiencia educativa en su totalidad.
Contar con información a lo largo del tiempo permite hacer comparaciones entre los modelos, conocer los aspectos favorables o con oportunidades para que puedan evolucionar. Desde este panorama, los datos adquieren un papel central en la toma de decisiones institucionales. Por tanto, contar con información confiable y de alta calidad habilita el sustento de estrategias, reduce la incertidumbre y fortalece la planeación. Una gestión adecuada de los datos contribuye a mejorar los procesos educativos, elevar la calidad académica y generar beneficios tanto para la institución como para su comunidad.
Para mayor información, conoce más del IFE Data Hub aquí.
¿Te gustó esta publicación? ¿Te gustaría publicarla en un sitio web, revista, blog o repositorio? Todos nuestros contenidos son de acceso abierto. Para dudas sobre cómo reutilizar este y otros contenidos del Observatorio, contacta a nuestra editora en jefe: karinafuerte@tec.mx