Počkejte prosím...
Data pro 2019/2020

Předzpracování dat

Kredity 4
Rozsah 2 / 1 / 0
Examinace Z+Zk
Jazyk výuky čeština
Úroveň []
Garant doc. RNDr. Ing. Marcel Jiřina, Ph.D.

Anotace

Studenti se naučí připravit surová data pro další zpracování a analýzu. Získají znalosti algoritmů pro extrakci parametrů z různých datových zdrojů, jako jsou obrázky, texty, časové řady, apod, a získají dovednosti tyto teoretické znalosti aplikovat při řešení daného problému, např. extrakce parametrů z obrazových dat nebo z Internetu.

Sylabus

1. Průzkum dat, techniky exploratorní analýzy, vizualizace surových dat.
2. Deskriptivní statistika.
3. Metody určování významnosti příznaků.
4. Problémy v datech - dimenzionalita, šum, odlehlé hodnoty, nekonzistence, chybějící hodnoty, nenumerická data.
5. Čištění dat, transformace dat, imputing, diskretizace, binning.
6. Redukce dimenzionality dat.
7. Redukce objemu dat, balancování tříd.
8. Extrakce příznaků z textu.
9. Extrakce příznaků z dokumentů, webu, předzpracování strukturovaných dat.
10. Extrakce příznaků z časových řad.
11. Extrakce příznaků z obrazu.
12. Případové studie přípravy dat.
13. Automatizace předzpracování dat.

Literatura

Z:Pyle, D. ''Data Preparation for Data Mining''. Morgan Kaufmann, 1999. ISBN 1558605290.
Z:Guyon, I., Gunn, S., Nikravesh, M., Zadeh, L. A. ''Feature Extraction: Foundations and Applications (Studies in Fuzziness and Soft Computing)''. Springer, 2006. ISBN 3540354875.

VŠCHT Praha
Technická 5
166 28 Praha 6 – Dejvice
IČO: 60461373
DIČ: CZ60461373

Datová schránka: sp4j9ch

Copyright VŠCHT Praha 2014
Za informace odpovídá Oddělení komunikace, technický správce Výpočetní centrum
zobrazit plnou verzi