Cerrar
CONACYT

Maestría en Ciencias en Ciencia de Datos

Conoce nuestra maestría en Ciencias en Ciencia de Datos, la cual forma especialistas en el manejo de grandes volúmenes de datos e información de los sectores productivos, públicos y privados.


Presentación

La importancia de la información y los datos como ciencia se debe a que cada vez más existen grandes cúmulos de información y se hace necesario formar expertos que analicen, experimenten, exploren y combinen los datos para comprenderlos y encontrar posibilidades diversas de explicación, aplicación y uso de la información. Tener acceso a información a gran escala tiene la ventaja de permitir cruzarla para analizarla pero no basta con organizar los datos sino estructurarlos para acceder a ellos de manera fácil, rápida y confiable.

INFOTEC desarrolla un proyecto de investigación denominado “Analítica Computacional de Grandes Cúmulos de Información (Big Data)” ello le ha permitido agrupar a un grupo interdisciplinario de investigadores para desarrollar tareas encaminadas a la creación de un laboratorio de Big Data. Así mismo, es responsable del Laboratorio Nacional de Internet del Futuro, que aborda temáticas relacionadas con el cómputo en la nube y las tecnologías de Big Data.

Se tiene conocimiento de la cada vez mayor demanda de científicos de datos en el país, lo que hace necesario darle atención al tema y es el punto de partida para la creación de posgrados a nivel maestría y doctorado en Información y Ciencia de Datos.

La experiencia en el diseño curricular de programas de maestría y su operación en el marco del Programa Nacional de Posgrados de Calidad, que junto con un grupo de académicos internos y externos expertos en diseño curricular y el desarrollo de planes y programas de estudio en colaboración con científicos especializados en la materia, acompañados de instituciones educativas y otros centros de investigación, hacen posible el desarrollo de una propuesta académica sólida.

Para garantizar la calidad de un Programa de posgrado INFOTEC puso especial énfasis para que desde su diseño se tomaran en cuenta las necesidades de la sociedad, de la profesión, del campo de conocimiento y del empleo. Gracias a ello, los planes de estudio en Ciencia de Datos consta de cuatro fases:

  • Análisis del contexto y de la necesidad de formación del perfil profesional, realizado mediante el análisis de los principales factores científico-tecnológicos asociados a la creación del puesto; así como la exploración de la oferta educativa existente. Esta fase será desarrollada por el personal de INFOTEC.
  • Identificación de las competencias y perfil del profesionista, resultado de la investigación documental del personal de INFOTEC.
  • Construcción del perfil de egreso, mediante la consulta con especialistas de la academia y la industria siguiendo el enfoque funcional de construcción de un perfil de referencia para una especialidad.
  • Elaboración de la estructura curricular, realizado en forma colegiada entre el personal de INFOTEC, los empleadores y la academia para la derivación de las unidades de competencia tanto de las genéricas como de las profesionales; identificación y selección de saberes correspondientes a las competencias a desarrollar; definición de los cursos y construcción de los trayectos formativos y de la malla curricular.

Modalidad: Presencial (Tiempo completo).

Sedes: Ciudad de México y Aguascalientes.

Costo total del programa: $240,000.00 (DOSCIENTOS CUARENTA MIL PESOS 00/100 M.N.)
Para mayor información acerca de becas, escríbenos a unidaddeposgrados@infotec.mx

  MCCD MCDI
TIEMPO DE DEDICACIÓN Tiempo completo Tiempo Parcial
MODALIDAD Presencial En línea
ORIENTACIÓN Investigación: Generación de conocimientos. Profesionalizante: Aplicación del conocimiento.
TIPO DE TITULACIÓN Tesis Proyecto Terminal
OBJETIVO.
Especialistas con las siguientes competencias:
  • Crear modelos analíticos de datos e información.
  • Diseñar herramientas computacionales para manejo de grandes cúmulos de datos.
  • Desarrollar o proponer modelos matemáticos para la representación de los datos y aplicación de métodos analíticos.
  • Aplicar la metodología de investigación científica en el análisis de datos.
  • Utilizar modelos analíticos para proceso de grandes volúmenes de datos e información.
  • Analizar y procesar datos e información mediante herramientas computacionales.
  • Aplicar métodos matemáticos para solucionar problemáticas asociadas al manejo y análisis de datos e información.
  • Generar alternativas de solución a las problemáticas en el manejo de grandes volúmenes de datos e información.
MCD

Perfil de ingreso

La Maestría en Ciencias en Ciencia de datos con orientación a la investigación, está dirigida a estudiantes que pueden dedicar tiempo completo a los estudios. Esta maestría se complementa con materiales y espacios digitales de información.

La población objetivo de la maestría se puede dividir en dos grandes grupos:

  • Personas que se encuentran en el campo profesional que buscan actualización para resolver y mejorar su acercamiento a las problemáticas de grandes volúmenes de datos en campos como el sector financiero, Biología, Bioinformática, Salud, Demografía, Ciudades inteligentes, Documentación y bibliotecas digitales, Inteligencia pública y tecnológica, Geografía, Mercadotecnia y toma de decisiones en Políticas públicas; y
  • Los egresados de licenciaturas que tienen una base matemática y necesidades de aplicación de Ciencia de datos como son: Física, Matemáticas, Ciencias de la Tierra, Actuaría, Ciencias de la computación, Ingenierías, Biología y Ciencias de la salud, Economía y Finanzas.

Requisitos de ingreso

  • Título profesional o de grado con promedio mínimo de ocho
  • Aprobar el proceso de admisión
  • Presentar la documentación que solicite Infotec
  • Trabajar en la industria o áreas afines
  • Carta de exposición de motivos
  • Constancia de comprensión de idioma inglés

Perfil de egreso

Maestría en Ciencias en Ciencia de datos (con orientación a la investigación)

Las competencias se desarrollan en la maestría con dos estrategias principales:

  • Los casos que se estudian y resuelven en las asignaturas.
  • La investigación de tesis que se realiza en función de proyectos que están realizando los tutores y donde concurren varios alumnos de maestría.

Competencias de la maestría (con orientación a la investigación)

Colaborar en la investigación en el desarrollo de modelos analíticos, herramientas computacionales y matemáticas de Ciencia de datos para el manejo de grandes volúmenes de datos de las organizaciones de los sectores productivos, públicos y privados.

No. Competencias de egreso de la maestría con orientación Saberes / asignaturas
1. Identificar y plantear las problemáticas de información y datos en los diversos escenarios que presentan las organizaciones en el manejo de grandes volúmenes de datos. Procesamiento de Información Cómputo de alto rendimiento
2. investigación
Aplicar la metodología de investigación científica en el análisis de datos.
Seminarios de investigación Procesamiento de información Análisis Exploratorio de Datos Aprendizaje Computacional
3. Seleccionar, adaptar y utilizar herramientas computacionales y matemáticas pertinentes para la recolección, extracción, almacenamiento, integración y manejo de distintos tipos de datos masivos e información conducentes a la resolución del problema. Cómputo de alto rendimiento Procesamiento de información
Algoritmos y estructuras de datos masivos
Matemáticas para la ciencia de datos
4. Identificar las características de los datos para determinar y establecer criterios y métricas para la correcta evaluación de la calidad de los datos en el contexto del problema. Procesamiento de Información
Algoritmos y estructuras de datos masivos
5. Modelar la información y los datos con base en estrategias de pre procesamiento y representación de datos. Matemáticos para ciencia de datos
Procesamiento de la Información
6. Aplicar criterios para el acceso a la información y protección de datos personales con base en principios éticos y la normatividad vigente. Seminarios de proyectos
7. Seleccionar, adaptar y utilizar modelos analíticos y herramientas computacionales, estadísticas y matemáticas aplicadas a grandes volúmenes de datos, estructurada y no estructurada, como máquinas de aprendizaje; heurística, redes neuronales, aprendizaje computacional, entre otras, en distintos dominios de aplicación. Computo de alto rendimiento
Algoritmos y estructuras de datos masivos
Estadística Aprendizaje Computacional
Análisis Exploratorio de Datos
8. Participar en el desarrollo e innovación de modelos analíticos y herramientas para el manejo de datos masivos en el contexto de proyectos de investigación. Seminario de investigación
9. Comunicar de manera efectiva y en los términos del dominio específico del campo de aplicación los resultados de la investigación. Análisis Exploratorio de Datos
10. Diseñar modelos de valor para la investigación en Ciencia de datos. Seminarios de investigación
11. Colaborar en grupos de investigación multidisciplinarios para la integración de soluciones para el manejo de grandes volúmenes de datos. Seminarios de investigación

Plan de estudios

Mapa curricular

Semestre 1 Semestre 2 Semestre 3 Semestre 4
Procesamiento de Información Análisis exploratorio de datos Optativa Seminario de Tesis
Matemáticas para la ciencia de datos Estadística Seminario de Investigación III
Análisis de algoritmos y estructuras para datos masivos Aprendizaje Computacional
Cómputo de alto rendimiento Seminario de Investigación II
Seminario de Investigación I

Admisión

Convocatoria anual (abierta), consulta nuestro calendario de fechas.

¡No olvides llenar tu solicitud de admisión en línea!

Proceso de admisión

El proceso de admisión comprende diferentes etapas para asegurar que el estudiante cuenta con el perfil de ingreso deseado:

Ver la Alternativa textual para la infografía de proceso de admisión a posgrados

Proceso de admisión a posgrados Proceso de admisión a posgrados movil

Alternativa textual para la infografía de proceso de admisión a posgrados

  1. Consulta la convocatoria.
  2. Captura en línea tu solicitud de admisión.
  3. Espera la validación de tus documentos.
  4. Realiza el pago del examen o de la inscripción a tu curso propedéutico.
  5. Presenta y aprueba el examen o curso propedéutico.
  6. Asiste a las entrevistas que te realizarán.
  7. Recibe por correo tu dictamen de admisión.
  8. Preséntate a la hora y día asignado para tu inscripción.

Productos académicos

En el posgrado de Ciencia de Datos se cuenta con cuatro Líneas de Generación y Aplicación del Conocimiento (LAGC) asociadas a la temática del programa y a las áreas de investigación asociadas a la Ciencia de Datos.

  • Inteligencia computacional en la ciencia de datos
  • Analítica de grandes cúmulos de información
  • Combinatoria, modelado y análisis de algoritmos
  • Cómputo de alto rendimiento

Inteligencia computacional en la Ciencia de Datos.

La inteligencia computacional es una rama del área de inteligencia artificial que se encarga del desarrollo de métodos que exhiben un comportamiento inteligente. En particular, desde la perspectiva de ciencia de datos, los métodos son aplicados al análisis de datos masivos con los objetivos de emular las acciones realizadas por un experto, aprender y descubrir patrones que no son evidentes mediante un análisis manual.

Esta línea tiene como objetivo aplicar, desarrollar y proponer técnicas de inteligencia computacional aplicadas en la Ciencia de Datos para resolver tareas como: clasificación, regresión, agrupación de elementos similares, modelización automática de problemas basados en ejemplos, etc. Estas tareas se resuelven mediante la aplicación de campos tales como: cómputo evolutivo, procesamiento del lenguaje natural, reconocimiento de patrones, visión artificial, redes neuronales artificiales, sistemas expertos, aprendizaje computacional y extracción de conocimiento.

Analítica de grandes cúmulos de información

La Analítica de Grandes Cúmulos de Información (Big Data Analytics) implica nuevas capacidades en el uso estratégico del análisis de datos. Producto del desarrollo tecnológico acelerado de las TIC, la generación masiva de datos y el proceso de apropiamiento tecnológico de las organizaciones hacen plausible la generación de valor mediante el procesamiento de grandes volúmenes de información (datos estructurados, no estructurados o semiestructurados).

El enfoque de esta línea se centra en los métodos analíticos para la generación de información valiosa (valor agregado) que de manera oportuna asistan a la toma de decisiones. Muchos de los métodos analíticos de grandes cúmulos de información involucran la aplicación de técnicas de la inteligencia computacional para la realización de tareas, que no serían posibles realizar con el enfoque tradicional de bases de datos relacionales y análisis estadístico multivariado. Las técnicas de ciencia de datos utilizadas para este fin son: análisis exploratorio de datos, análisis topológico de datos, minería de textos, minería de datos, minería de opinión, aprendizaje computacional, visualización de datos e información, recuperación de información, análisis estadístico, análisis geoespacial y análisis espacio-temporal.

Combinatoria, modelado y análisis de algoritmos

El estudio de los problemas básicos en un área del conocimiento es vital para la fundamentación y el cultivo mismo del área del conocimiento. La combinatoria es una rama de las matemáticas discretas que estudia la enumeración, construcción y existencia de estructuras discretas que satisfacen ciertas condiciones establecidas. En su ámbito de estudio se encuentra la agrupación, los órdenes, el conteo, y la construcción de configuraciones, entre otras; las cuales son herramientas matemáticas fundamentales para la construcción y el análisis de algoritmos que sean a su vez eficaces y eficientes para el análisis de grandes cúmulos de información. Como tal la interacción entre la combinatoria y la construcción y análisis de algoritmos es un proceso simbiótico y cíclico inseparable.

El análisis de algoritmos se encarga del estudio de la factibilidad de un algoritmo para resolver una tarea dada. De manera más detallada, la factibilidad viene dada por la determinación de los costos computacionales de la ejecución de un algoritmo, tanto en tiempo de cómputo como la memoria necesaria en función de la entrada. Diseñar algoritmos para el manejo de grandes cantidades de datos en una arquitectura de cómputo con limitaciones físicas reales es una tarea ardua que requiere una estrecha articulación entre el análisis teórico y la experimentación. Esta línea tiene el propósito de generar conocimiento en ciencia básica y de frontera en las áreas relacionadas a: Algoritmos aproximados, modelado de sistemas, aplicaciones de teoría de gráficas y sus generalizaciones, tal como la topología combinatoria.

Cómputo de alto rendimiento

En los últimos años, los equipos de cómputo de universidades y empresas han sido renovados con el propósito de contar con una infraestructura adecuada para el tratamiento de BigData. Este tipo de súper computadoras, necesarias para el procesamiento eficiente de grandes cúmulos de información en el área de Ciencia de Datos, son pocas veces utilizadas a su máxima capacidad debido a la falta de capital humano de alta calidad especializado en el desarrollo, análisis e implementación de algoritmos paralelizables que aprovechen al máximo las capacidades de este tipo de dispositivos considerando también su correcta configuración y administración.

El cómputo de alto rendimiento es una herramienta para la solución de problemas que requieren una gran cantidad de recursos computacionales. Con este fin, se enfoca en el uso eficiente de arquitecturas de cómputo paralelas y distribuidas; esto incluye, en diseñar algoritmos específicamente para dichas arquitecturas así como el estudio de las arquitecturas en sí mismas. Los temas pertinentes a esta línea son: cómputo paralelo y distribuido, arquitecturas de alto rendimiento, algoritmos distribuidos, lenguajes de programación y sistemas operativos. arquitecturas de alto rendimiento, algoritmos distribuidos, lenguajes de programación y sistemas operativos.

Datos de contacto:

Dirección Adjunta de Innovación y Conocimiento | Gerencia de Capital Humano | Mtra. Patricia Ávila Muñoz
Escríbenos a: unidaddeposgrados@infotec.mx
Ing. Guillermo Morales | Tel: (55) 5624-2800 ext. 6138

o a través de nuestras redes sociales:
Facebook: PosgradosINFOTEC | Twitter: @posgradoInfotec | Youtube: Upinfotec