Guía docente de la asignatura
(6423) MINERÍA DE DATOS

Curso académico 2025/2026

  1. Identificación

    1. De la asignatura

      Curso Académico
      2025/2026
      Titulación
      MÁSTER UNIVERSITARIO EN TECNOLOGÍAS DE ANÁLISIS DE DATOS MASIVOS: BIG DATA
      Nombre de la asignatura
      MINERÍA DE DATOS
      Código
      6423
      Curso
      PRIMERO
      Carácter
      OBLIGATORIA
      Número de grupos
      1
      Créditos ECTS
      4.5
      Estimación del volumen de trabajo
      112.5
      Organización temporal
      2º Cuatrimestre
      Idiomas en que se imparte
      Español
      Curso Académico 2025/2026
      Titulación

      MÁSTER UNIVERSITARIO EN TECNOLOGÍAS DE ANÁLISIS DE DATOS MASIVOS: BIG DATA

      Nombre de la asignatura MINERÍA DE DATOS
      Código 6423
      Curso PRIMERO
      Carácter OBLIGATORIA
      Número de grupos 1
      Créditos ECTS 4.5
      Estimación del volumen de trabajo 112.5
      Organización temporal 2º Cuatrimestre
      Idiomas en que se imparte Español
    2. Del profesorado: Equipo docente

      • PALMA MENDEZ, JOSE TOMAS Docente: GRUPO 1 Coordinación de los grupos: GRUPO 1 Coordinador de la asignatura

        Categoría

        PROFESORES TITULARES DE UNIVERSIDAD

        Área

        CIENCIA DE LA COMPUTACIÓN E INTELIGENCIA ARTIFICIAL

        Departamento

        INGENIERÍA DE LA INFORMACIÓN Y LAS COMUNICACIONES

        Correo electrónico / Página web / Tutoría electrónica

        jtpalma@um.es http://perseo.dif.um.es/~jpalma Tutoría electrónica:

        Teléfono, horario y lugar de atención al alumnado

        Duración:
        A
        Día:
        Lunes
        Horario:
        09:30-12:30
        Lugar:
        (Sin Extensión), Facultad de Informática B1.1.041
        Observaciones:
        Despacho 1.29 (1ª planta) Se debe pedir cita para establecer cómo llevar a cabo la tutoría. Si es necesario se puede solicitar tutorías fuera de esa franja.
  2. Presentación

    En la actualidad son muy pocas las actividades que realiza el ser humano que son ajenas a la utilización de las TICs Si a este hecho le unimos la capacidad que tiene la sociedad en al que vivimos de generar gran cantidades de datos procedente de distintas fuentes: economía, deportas, sanidad, ciencia¿ nos encontramos muchas veces con grandes cantidades de datos, recopilados a lo largo de los años, a los que no se les da utilidad alguna Sin embargo, una análisis exhaustivo de dichos datos puede revelar información sumamente útil Dada la gran cantidad de información disponible se requieren de procedimientos automáticos para extraer información relevante de dichos datos La minería de datos tiene como objetivo la extracción de información generalmente implícita, previamente desconocida y potencialmente útil de los datos Para ello se requerirán de programas que detecten patrones y regularidades en dichos datos Estos programas nos permitirán adquirir descripciones estructurales a partir de los ejemplos que pueden ser usados para predecir una respuesta ante una nueva situación, utilizando métodos originados en los campos de la Inteligencia Artificial, Estadística e investigación en Bases de Datos

    Por lo tanto, el objetivo de esta materia consistirá en que el alumno comprenda la importancia del proceso de minería de datos y sea capaz de preparar los datos para su posterior procesamiento, aplicar técnicas propias de la materia e interpretar y evaluar los resultados obtenidos Para ello, se presentarán las técnicas básicas de prepocesamiento de datos, técnicas de clasificación y agrupamiento y métodos de evaluación de modelos Esta asignatura se complementará con los contenidos de la asignatura Aprendizaje Estadístico

  3. Condiciones de acceso a la asignatura

    1. Incompatibilidades

      No constan

    2. Requisitos

      No constan

    3. Recomendaciones

      No existen recomendaciones para esta asignatura.
  4. Competencias

    1. Competencias básicas

      • CB6: Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación
      • CB7: Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio
      • CB9: Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades
      • CB10: Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.

    2. Competencias de la titulación

      • G2: Capacidad de trabajo autónomo y toma de decisiones
      • G4: Capacidad analítica, crítica y de síntesis
      • G5.: Creatividad
      • E13: Capacidad para entender los beneficios de la minería de datos y los elementos que intervienen en el proceso, así como de aplicarlos en la resolución de problemas, para elegir las técnicas más adecuadas a cada problema, y para aplicar de forma correcta las técnicas de evaluación y saber interpretar los modelos y resultados.

    3. Competencias transversales y de materia

      • T3 Dominio de la expresión oral y escrita en lengua materna
      • T4 Conocimiento de otras lenguas, sobre todo la inglesa
      • T5 Capacidad de analizar la calidad de las soluciones propuestas
      • CE1 Ser capaz de entender de entender los beneficios de la minería de datos y los elementos que intervienen en el proceso, así como de aplicarlos en la resolución de problemas, elegir las técnicas más adecuada a cada problema, aplicar de forma correcta las técnicas de evaluación y saber interpretar los modelos y resultados

  5. Contenidos

    1. Teoría

      Tema 1: Introducción. Preprocesamiento

      • Introducción
      • Limpieza de datos: Datos ausentes, con ruido, inconsistencias y discrepancias
      • Transformaciones de datos: Normalización, discretización y transformación numérica de variables categóricas
      • Técnicas para el tratamiento de datos desbalanceados

      Tema 2: Selección de Características

      • Técnicas para el tratamiento de datos desbalanceados Introducción
      • Generación de subconjuntos
      • Métodos basados en Filtros
      • Métodos basados en envoltura (wrappers)

      Tema 3: Evaluación

      1. Introducción
      2. Medidas de Calidad
      3. Estimación de la eficacia de los modelos
      4. Comparación de modelos
        • Análisis de curvas ROC
        • Tests estadísticos

      Tema 4: Técnicas de Agrupamiento

      1. Introducción
      2. Distancia y Similaridad
      3. Agrupamiento Jerárquico
      4. Agrupamiento Particional
      5. Evaluación de Agrupamientos

      Tema 5: Reglas de asociación

      1. Introducción
      2. Soporte y Confianza
      3. Descubrimiento de Reglas de Asociación
      4. Evaluación de Reglas de Asociación
      5. Elementos avanzados de Reglas de Asociación

      Tema 6: Deep Learning

      1. Introducción
      2. Algoritmos básicos de entrenamiento y regularización
      3. Redes convolucionales
      4. Redes recurrentes (LSTM)
      5. Redes generativas
      6. Lenguajes de programación y aplicaciones

    2. Prácticas

      • Práctica 1: Preprocesamiento

        Tutorial sobre las distintas técnicas de preprocesamiento de datos aplicados a un conjunto de datos de ejemplo

        Relacionado con:
        • Tema 1: Introducción. Preprocesamiento
      • Práctica 2: Selección de características, construcción, evaluación, evaluación y comparación de modelos predictivos

        Tutorial en el que se abordarán las fases de selección de características, construcción de modelos predicitvos, así como su evaluación y comparación.

        Relacionado con:
        • Tema 2: Selección de Características
        • Tema 3: Evaluación
      • Práctica 3: Agrupamiento

        Tutorial sobre técnicas de agrupamiento. Se verán diferentes librerías para realizar agrupamiento jerárquico, particional y basado en densidad, así como técnicas para determinar el agrupamiento óptimo y medidas de calidad de los mismos

        Relacionado con:
        • Tema 4: Técnicas de Agrupamiento
      • Práctica 4: Reglas de asociación

        Tutorial sobre el descubrimiento de reglas de asociación, evaluación y visualización de las mismas

        Relacionado con:
        • Tema 5: Reglas de asociación
      • Práctica 5: Deep Learning

        Tutorial sobre Deep Learning en el que mostrará como entrenar diferentes tipos arquitecturas de redes neuronales profundas.

        Relacionado con:
        • Tema 6: Deep Learning

  6. Actividades Formativas

    Actividad Formativa Metodología Horas Presencialidad
    CP: Clases prácticas de laboratorio, resolución de problemas y casos prácticos 12.0 100.0
    CT: Clases teóricas: impartidas por el profesor y exposición de seminarios 18.0 100.0
    EP: Entrevista de prácticas, examen y defensa del trabajo final 3.0 100.0
    TP: Tutorías programadas: orientación para la realización de los trabajos individuales o en grupo, resolución de dudas y actividades de evaluación contínua 3.0 100.0
    TPA: Trabajo personal del alumno: consulta de bibliografía, estudio autónomo, desarrollo de actividades programadas, preparación de presentaciones y trabajos 76.5 0.0
    Totales 112,50

  7. Horario de la asignatura

    https://www.um.es/web/estudios/masteres/big-data/2025-26#horarios

  8. Sistemas de Evaluación

    Identificador Denominación del instrumento de evaluación Criterios de Valoración Ponderación
    EX Evaluación de Pruebas periódicas y/o Prueba final

    El examen final de la asignatura sobre la TEORÍA será mixto test/desarrollo, con contenidos teórico-prácticos

    • Las preguntas pueden referirse a conceptos teóricos, desarrollos matemáticos y algoritmos, y resolución de problemas
    • Parte del examen consistirá en preguntas tipo test (entre 20 y 50)
    • Parte del examen podrá consistir en preguntas de desarrollo Habrá grupos de preguntas breves, otras cortas y quizá alguna larga
    • Para las preguntas tipo test el criterio básico de evaluación es el propio en exámenes de este tipo:
      • Las respuestas correctas suman puntos
      • Las respuestas no correctas o no respondidas restarán puntos
    • En las preguntas que requieran justificación o desarrollo se usará como criterios:
      • Las respuestas son coherentes y pertinentes
      • Se contesta y explica con precisión a las preguntas planteadas
      • La presentación es clara, estructurada, ordenada y bien expresada
      • Correlación precisa entre las cuestiones planteadas y las respuestas entregadas
      • Los ejercicios están bien resueltos, correctamente justificados y detalladamente explicados
    • El alumno podrá ser convocado a una entrevista oral en la que demuestre el dominio completo en las respuestas y la resolución de los problemas planteados en las preguntas antes de publicar su nota
    • El resultado de la entrevista podrá condicionar la evaluación de sus respuestas a las preguntas planteadas

    Se deberá sacar una puntuación mínima de 50 para superar el examen y que se considere aprobada la parte de TEORÍA

    40.0
    RP Evaluación de prácticas realizadas

    En lo que respecta a los contenidos prácticos, éstos se evaluarán a través de la realización de una serie de tareas que desarrollará el alumno individualmente de forma autónoma para las que tendrá que presentar un informe técnico sobre el desarrollo de las mismas y respuesta a las preguntas planteadas El profesor valorará cada tarea de forma ponderada siendo necesario superar una calificación mínima de 5 en cada una de ellas Por lo tanto, para superar los contenidos teóricos es necesario superar todas las tareas calificables y obtener una nota final ponderada superior a 5

    La realización de las taras calificables será obligatoria Las tareas se entregarán a través de la herramienta "Tareas" del Aula Virtual En las convocatorias de Junio y Julio, los alumnos podrán recuperar las tareas no superadas o entregadas

    Para la evaluación de las tareas calificables, se tendrán en cuenta

    • Corrección de las cuestiones planteadas
    • Claridad en la solución aportada y en la elaboración del informe
    • Comprensión de los instrumentos teóricos/prácticos aportados
    • La entrega de las tareas con retraso puede suponer una penalización aplicable a la nota obtenida en cada tarea

    45.0
    SEG Seguimiento continuado y objetivable de una participación activa

    En lo que respecta al seguimiento continuado, este se evaluará teniendo en cuenta los siguientes criterios:

    • Participación en clase
    • Respuesta a cuestiones
    5.0
    TAD Evaluación de trabajos académicamente dirigidos

    Adicionalmente a los instrumentos anteriores el alumno podrá realizar trabajos académicamente dirigidos que serán evaluados de acuerdo con los siguientes criterios:

    • Claridad en la exposición de los contenidos y la presentación de resultados
    • Corrección en la aplicación de los contenidos teóricos y prácticos impartidos en la asignatura
    • Adecuada aproximación metodológica en la elaboración del trabajo
    • Coherencia de las conclusiones
    10.0

  9. Fechas de exámenes

    https://www.um.es/web/estudios/masteres/big-data/2025-26#examenes

  10. Resultados del Aprendizaje

    • Comprender los beneficios que aporta la Minería de datos, así como los elementos que intervienen en el proceso
    • Comprender y saber aplicar las principales técnicas de preprocesamiento de datos
    • Comprender y saber aplicar las principales técnicas de clasificación y agrupamiento
    • Comprender y saber aplicar las principales técnicas de evaluación de modelos
    • Ser capaz de aplicar de forma completa un proceso de minería de datos y de elegir las técnicas más adecuadas para cada situación
  11. Bibliografía

    Bibliografía complementaria

  12. Observaciones

    Para poder superar la asignatura en una determinada convocatoria (febrero, junio, julio), el alumno deberá aportar al profesor todas aquellas evidencias necesarias para poder realizar una evaluación global. Para esta asignatura se entiende por evidencias:

    1. Presentarse físicamente al examen final de teoría en la fecha y hora establecidos en el pertinente llamamiento, rellenar sus datos, firmar y entregar el examen al profesor, o realizar los trabajos periódicos correspondientes y entregarlos en los plazos establecidos para los mismos (El cauce para esta asignatura será mediante el aula virtual, SAKAI)
    2. Realizar la entrega de los boletines de prácticas El cauce para esta asignatura será mediante el aula virtual, SAKAI
    3. En los casos de copia o plagioen alguna de las actividades evaluables de la asignatura se aplicará la normativa vigente de la Universidad de Murcia

    En este caso y para cada convocatoria solo si el estudiante NO ha aportado NINGUNA de las evidencias de evaluación que permitan una calificación global de la asignatura, se consignará en el acta la calificación de "No Presentado"

    Aplicación de la asignatura a los Objetivos de Desarrollo Sostenible

    Esta asignatura se encuentra vinculada de forma directa con los siguientes Objetivos de Desarrollo Sostenible (ODS):

    • ODS nº 3 "Salud Y Bienestar".Machine Learning se puede utilizar en el diagnóstico y tratamiento de enfermedades, optimizando recursos en salud pública y mejorando la precisión de los diagnósticos. Por ejemplo, algoritmos de ML pueden analizar imágenes médicas para detectar cáncer en etapas tempranas, mejorar el seguimiento de enfermedades crónicas mediante wearables, y optimizar la asignación de recursos en hospitales.
    • ODS nº 4 "Educación de calidad", en particular con la Meta 44 "Aumento de las competencias para acceder al empleo". El Machine Learning puede personalizar el aprendizaje y mejorar la calidad de la educación. Los sistemas de recomendación pueden sugerir contenidos específicos para estudiantes según su progreso y necesidades, ayudando a cerrar brechas educativas.
    • ODS nº 7 "Energia Asequible y no Contaminante". Las técnicas de Machine Learning puede mejorar la eficiencia energética y promover el uso de energías renovables. Los sistemas inteligentes pueden predecir la demanda energética, optimizar la distribución y almacenamiento de energía, y aumentar la eficiencia de las redes eléctricas.
    • ODS 9: “Industria, Innovación e infraestructuras”,en particular con la meta 5 Aumentar la investigación científica y mejorar la capacidad tecnológica de los sectores industriales de todos los países, en particular los países en desarrollo, entre otras cosas fomentando la innovación y aumentando considerablemente, de aquí a 2030, el número de personas que trabajan en investigación y desarrollo por millón de habitantes y los gastos de los sectores público y privado en investigación y desarrollo”. La contribución de esta asignatura a esta meta está justificada por tratar contenidos relacionados con la Inteligencia Artificial, tecnología con una alta capacidad innovadora.
    • ODS nº 11 "Ciudades y Comunidades Sostenibles".Las técnicas de Machine Learning pueden optimizar el tráfico, mejorar la gestión de residuos, y aumentar la eficiencia de los servicios públicos. Los algoritmos de Machine Learning pueden analizar patrones de tráfico para reducir congestiones y emisiones, y mejorar la seguridad pública mediante análisis predictivo de delitos.

    NECESIDADES EDUCATIVAS ESPECIALES

    Aquellos estudiantes con discapacidad o necesidades educativas especiales podrán dirigirse al Servicio de Atención a la Diversidad y Voluntariado (ADYV - https://www.um.es/adyv) para recibir orientación sobre un mejor aprovechamiento de su proceso formativo y, en su caso, la adopción de medidas de equiparación y de mejora para la inclusión, en virtud de la Resolución Rectoral R-358/2016. El tratamiento de la información sobre este alumnado, en cumplimiento con la LOPD, es de estricta confidencialidad.

    REGLAMENTO DE EVALUACIÓN DE ESTUDIANTES

    El artículo 8.6 del Reglamento de Evaluación de Estudiantes (REVA) prevé que "salvo en el caso de actividades definidas como obligatorias en la guía docente, si el o la estudiante no puede seguir el proceso de evaluación continua por circunstancias sobrevenidas debidamente justificadas, tendrá derecho a realizar una prueba global".

    Se recuerda asimismo que el artículo 22.1 del Reglamento de Evaluación de Estudiantes (REVA) estipula que "el o la estudiante que se valga de conductas fraudulentas, incluida la indebida atribución de identidad o autoría, o esté en posesión de medios o instrumentos que faciliten dichas conductas, obtendrá la calificación de cero en el procedimiento de evaluación y, en su caso, podrá ser objeto de sanción, previa apertura de expediente disciplinario".