Primer egreso del Programa de Estudios de Posgrado de Pyxis Research

Luego de 2 años de mucho trabajo, desde Pyxis Research celebramos la primera tesis de maestría sobre Predicción de la Edad en Redes Sociales, realizada con el apoyo de nuestro Programa de Estudios de Posgrado.

Los invitamos a conocer más detalles acerca del Programa, cómo fue el proceso, de qué se trató la investigación y cuáles fueron los resultados.  

 

Programa de Estudios de Posgrado de Pyxis Research

La idea del Programa de Estudios de Posgrado que impulsamos desde Pyxis Research es facilitar a quienes trabajan en Pyxis la preparación de sus estudios de maestría, doctorado, etc., brindándoles apoyo. El postulante debe contar con un tema de trabajo que sea de su interés, pero que además lo sea para Pyxis y le dé un valor agregado al ecosistema. 

La promoción de estudios de posgrado tiene múltiples objetivos, entre ellos el incentivar la formación continua de las personas que conforman Pyxis, fomentar la integración con la academia y mejorar la adquisición de conocimiento de punta por parte de todo el ecosistema pyxiano.

El apoyo consiste en brindar una bolsa de horas de trabajo que puede utilizar el estudiante para su proyecto. La cantidad de horas depende de la carga horaria que tenga cada uno dentro de Pyxis, de la duración del programa de estudios y su grado de avance al momento de dar la beca.

El proceso de desarrollo que demanda una tesis no es lineal. Existen momentos de mayor dedicación que otros. Compilar eso con lo irregular que es normalmente el trabajo en software, donde los proyectos tienen picos de exigencia, implica un gran desafío. 

Primer proyecto: Predicción de la edad en Redes Sociales

Para el primer proyecto impulsado desde el programa, buscamos un tema de tesis que tuviera cierto impacto e interés dentro del ámbito de trabajo de Pyxis. Surgió la idea de hacer algo sobre procesamiento de lenguaje natural y big data.

El objetivo de esta tesis fue explorar el problema de predecir la edad para completar el perfil de los individuos, en el contexto particular de la región con una fuerte especialización en el idioma español, para lo cual se dispone de un importante corpus de datos y las herramientas de análisis de probada utilidad práctica.   

La idea principal fue analizar diferentes enfoques y verificar qué era lo que más servía. En comparación con algunos trabajos parecidos en donde se llegó a un 48% de acierto, en este proyecto se alcanzó un 63%.

Otro elemento importante para mencionar sobre el proyecto es que no hay muchos experimentos similares en español. Este implicó un corpus de datos en español. La mayoría de los papers y estudios existentes son en inglés.

Así que podemos decir que nos aproximamos bastante. Exploramos varias opciones y generamos avances. Además, sabemos que cualquier estudio, ya sea en español o en inglés, no supera 70% de acierto.