Que estàs buscant?
L'assignatura s'impartirà en castellà. Els alumnes podran adreçar-se al professor en l'idioma que els sigui més còmode. Alguns continguts, transparències i bibliografia estaran en anglès.
B2_Que els estudiants sàpiguen aplicar els seus coneixements a la seva feina o vocació d'una forma professional i tinguin les comptències que demostren mitjançant l'elaboració i defensa d'arguments i la resolució de problemes dins de la seva àrea d'estudi
B3_Que els estudiants tinguin la capacitat de reunir i interpretar dades rellevants (normalment dins de la seva àrea d'estudi), per emetre judicis que incloguin una reflexió sobre temes rellevants de caire social, científica o ètica
B4_Que els estudiants puguin transmetre informació, idees, problemes i solucions a un públic tan especialitzat com no especialitzat
B5_Que els estudiants hagin desenvolupat aquelles habilitats d'aprenentatge necessàries per emprendre estudis posteriors amb un alt grau d'autonomia
En aquest curs s'introdueixen els mètodes bàsics de Classificació (aprenentatge supervisat) i de Clustering (aprenentatge no supervisat) en el context del Big Data. Els estudiants seguiràn un estudi de cas per cadascun dels mètodes d'aprenentatge amb l'ajuda del professor. Els estudiants desenvoluparan un projecte que consistirà en l'anàlisi d'unes dades emprant les eines vistes durant el curs. A més hauran d'explicar la informació que han pogut extreure de les dades. El projecte s'haurà de presentar de forma oral a un tribunal.
PART I
1 Història de la ciència de dades. Del Business Intelligence al Big Data
2 Qualitat i visualització de les dades. Informes i quadres de comandament
3 Classificació
3.1 GLM
3.2 Arbres
3.3 Altres mètodes
PART II
4 Mètodes Clustering
4.1 Mesures de distància
4.2 Kmeans
4.3 Clustering jeràrquic
4.4 Gaussian Mixture Models
4.5 Optics
5 Regles d'Associació
6 Anàlisi de text
7 Sistemes de Recomanació i Aprenentatge per Reforç
8 Avaluació del model
9 Projecte
La nota final es calcularà com la mitja ponderada de les diferents activitats:
20 % Prova de classificació (Examen)
20 % Prova de clustering (Examen)
45 % Projecte final (amb presentació oral)
15 % Participació a classe de pràctiques.
Només s'avaluarà l'assignatura a partir del 80% de l'assistència
Recuperació
Es podrà recuperar la part del projecte final
Normes de realització de les activitats
Per a cada activitat, els docents n'informaran de les normes i condicions particulars que les regeixin.
Les activitats unipersonals pressuposen el compromís de l'estudiant de realitzar-les de manera individual. Es consideraran suspeses totes aquelles activitats en què l'estudiant no s'ajusti a aquest compromís, independentment del seu paper (emissor o receptor). Igualment, les activitats que s'hagin de realitzar en grups pressuposen el compromís per part dels estudiants que l'integren de realitzar-les en el si del grup. Es consideraran suspeses totes aquelles activitat en què el grup no hagi respectat aquest compromís amb independència del seu paper (emissor o receptor).
En les activitats realitzades en grup el docent pot, en base a la informació de què disposi, personalitzar la qualificació per a cada integrant del grup.
És potestatiu dels docents acceptar o no lliuraments fora dels terminis que s'indiquin. En el cas que aquests lliuraments fora de termini s'acceptin, és potestatiu del docent decidir si aplica alguna penalització i la quantia d'aquesta
Gareth, James y otros autores (2017), An introduction to Statistical Learning: with Applications in R. Springer