Informació general


Tipus d'assignatura: Optativa

Coordinador: Rosa Herrero Antón

Trimestre: Segon trimestre

Crèdits: 6

Professorat: 

Sandra Obiol Madrid

Idiomes d'impartició


  • Castellano

L'assignatura s'impartirà en castellà. Els alumnes podran adreçar-se al professor en l'idioma que els sigui més còmode. Alguns continguts, transparències i bibliografia estaran en anglès.

Competències


Competències bàsiques
  • B2_Que els estudiants sàpiguen aplicar els seus coneixements a la seva feina o vocació d'una forma professional i tinguin les comptències que demostren mitjançant l'elaboració i defensa d'arguments i la resolució de problemes dins de la seva àrea d'estudi

  • B3_Que els estudiants tinguin la capacitat de reunir i interpretar dades rellevants (normalment dins de la seva àrea d'estudi), per emetre judicis que incloguin una reflexió sobre temes rellevants de caire social, científica o ètica

  • B4_Que els estudiants puguin transmetre informació, idees, problemes i solucions a un públic tan especialitzat com no especialitzat

  • B5_Que els estudiants hagin desenvolupat aquelles habilitats d'aprenentatge necessàries per emprendre estudis posteriors amb un alt grau d'autonomia

Descripció


En aquest curs s'introdueixen els mètodes bàsics de Classificació (aprenentatge supervisat) i de Clustering (aprenentatge no supervisat) en el context del Big Data. Els estudiants seguiràn un estudi de cas per cadascun dels mètodes d'aprenentatge amb l'ajuda del professor. Els estudiants desenvoluparan un projecte que consistirà en l'anàlisi d'unes dades emprant les eines vistes durant el curs. A més hauran d'explicar la informació que han pogut extreure de les dades. El projecte s'haurà de presentar de forma oral a un tribunal.

Continguts


PART I

1 Història de la ciència de dades. Del Business Intelligence al Big Data

2 Qualitat i visualització de les dades. Informes i quadres de comandament

3 Classificació

3.1 GLM

3.2 Arbres

3.3 Altres mètodes

PART II

4 Mètodes Clustering

4.1 Mesures de distància

4.2 Kmeans

4.3 Clustering jeràrquic

4.4 Gaussian Mixture Models

4.5 Optics

5 Regles d'Associació

6 Anàlisi de text

7 Sistemes de Recomanació i Aprenentatge per Reforç

8 Avaluació del model

9 Projecte

Sistema d'avaluació


La nota final es calcularà com la mitja ponderada de les diferents activitats:

20 % Prova de classificació (Examen)

20 % Prova de clustering (Examen)

45 % Projecte final (amb presentació oral)

15 % Participació a classe de pràctiques.

Només s'avaluarà l'assignatura a partir del 80% de l'assistència

Recuperació

Es podrà recuperar la part del projecte final

Normes de realització de les activitats

Per a cada activitat, els docents n'informaran de les normes i condicions particulars que les regeixin.

Les activitats unipersonals pressuposen el compromís de l'estudiant de realitzar-les de manera individual. Es consideraran suspeses totes aquelles activitats en què l'estudiant no s'ajusti a aquest compromís, independentment del seu paper (emissor o receptor). Igualment, les activitats que s'hagin de realitzar en grups pressuposen el compromís per part dels estudiants que l'integren de realitzar-les en el si del grup. Es consideraran suspeses totes aquelles activitat en què el grup no hagi respectat aquest compromís amb independència del seu paper (emissor o receptor).

En les activitats realitzades en grup el docent pot, en base a la informació de què disposi, personalitzar la qualificació per a cada integrant del grup.

És potestatiu dels docents acceptar o no lliuraments fora dels terminis que s'indiquin. En el cas que aquests lliuraments fora de termini s'acceptin, és potestatiu del docent decidir si aplica alguna penalització i la quantia d'aquesta

Bibliografia


Bàsic

Gareth, James y otros autores (2017), An introduction to Statistical Learning: with Applications in R. Springer