MAD3
Přednášky
- Základní informace
- Dolování vzorů a pravidel
- Explorativní analýza
- Shlukování pomocí reprezentantů
- Hierarchické shlukování, shlukování na základě hustoty a validace shluků
- Speciální shlukovací metody, Detekce odlehlých hodnot
- Redukce dimenze, Klasifikace, Výběr atributů a rozhodovací stromy
- Rozhodovací stromy, pravidlové systémy, pravděpodobnostní klasifikace, hodnocení klasifikačních algoritmů.
- Support Vector Machines
- Neuronové sítě
- Regrese a Pokročilé přístupy v klasifikaci
- Ensemble metody
Cvičení
- Dolování vzorůZobrazit/Skýt
- Vygenerujte všechny kombinace bez opakování o délce 3 z 6 možných.
- Na jednom z testovacích souborů (chess, connect) vygenerujte četné vzory z vypočtěte Support.
- Z vygenerovaných četných vzorů vypište pravidla a jejich Confidence
- Explorativní analýzaZobrazit/Skýt
- Dle pokynů cvičícího si stáhněte datovou sadu.
- Vyzkoušejte si analýzu datasetu, jak jednotlivých vlastností, tak i korelaci.
- Vyzkoušejte si transformaci jednotlivých atributů.
- Aglomerativní shlukování Zobrazit/Skýt
- Cílem bude implementovat dvě varianty aglomerativního shlukování a to single a complete linkage.
- Obě metody vychází z matice vzdáleností.
- Cílem bude provést shlukování, které se zastaví buď při vhodné příležitosti, nebo po kompletním shlukování.
- Při kompletním shlukování sestupte po dendrogramu shluků a nalezněte ty správné shluky.
- k-means shlukovací algoritmus (nepovinný úkol)
- Načtěte jeden z uvedených datasetů.
- Za pomocí Euklidovy vzdálenosti realizujte/vyzkoušejte k-means algoritmus.
- Projděte si výsledky algoritmu v krocích.
- Shlukovací metody Zobrazit/Skýt
- Cílem cvičení je vyzkoušet různé metody pro shlukování nad příklady z kolekce.
- Vyzkoušejte jak metody založené na reprezentantech, tak i hierarchické (s různými nastaveními), tak i metody založené na hustotě.
- Redukce dimenze (26.10.2020) Zobrazit/Skýt
- Načtěte dataset pro redukci dimenzi.
- Proveďte redukci dimenze na několik hodnot a změřte si Frobeniovu normu mezi originální a rekonstruovanou maticí.
- Redukci proveďte pomocí SVD a NMF.
- O obou algoritmů si vytiskněte nové bázové vektory.
- Např. v Pythonu je možné obě metody nalézt v Scikit-Learn, Accord.Net pro C#.
- Klasifikace rozhodovacím stromem Zobrazit/Skýt
- Načtěte dataset pro klasifikaci.
- Sestrojte klasifikační rozhodovací strom s optimálním dělením.
- Proveďte klasifikaci bodů v datasetu.
- Support Vector Machines (9.11.2020) Zobrazit/Skýt
- Experimentování s SVM klasifikací
- Na adrese knihovny LibSVM nalezněte canvas SVM.
- Otestujte nastavení knihovny na různých zadání bodů a volby kernelů.
- Otestujte různé nastavení kernelů, zejména konstantu C.
- Pomocí knihovny SK-Learn nebo jiné vhodné otestujte použití SVM nad reálnými datasety.
- Otestuje lineární i RBF kernely.
- Neuronové sítě Zobrazit/Skýt
- Vyzkoušejte implementaci neuronových sítí (MLP) v rámci knihoven.
- Otestujte různé sítě pro datasety pro klasifikaci.
- Regrese Zobrazit/Skýt
- Načtěte regresní data.
- Předzpracujte si je tak, aby jste odstranili datum a převedli na den v roce (např.).
- Naučte regresní model na rozdělení dat.
- Ensamble metody Zobrazit/Skýt
- Vyzkoušejte si využití ensemble metod pro klasifikaci/regresi.
- Porovnejte výkonnost těchto metod s klasickým přístupem.
Datasety
- Dolování vzorů: Zobrazit/Skýt
- Shlukování: Zobrazit/Skýt
- Redukce dimenze Zobrazit/Skýt
- BAR dataset - 10 000 obrázků 8x8 uložených jako 64 bytů v textovém formátu.
- BAR Noise 20% dataset - 10 000 obrázků 8x8 uložených jako 64 bytů v textovém formátu spolu s 20% bílého šumu
- BAR Noise 50% dataset - 10 000 obrázků 8x8 uložených jako 64 bytů v textovém formátu spolu s 50% bílého šumu
- MNIST dataset - 60 000 obrázků 28x28 uložených jako 784 bytů v textovém formátu
- Klasifikace Zobrazit/Skýt
- Regrese Zobrazit/Skýt
- Forrest Fires. Informace: zde. Formát: CSV
- Wine Quality dataset. Informace: zde. Formát: CSV (červené víno) a CSV (bíle víno)
- Bike sharing. Informace: zde. Formát: CSV
- YearPredictionMSD Data Set (500MB velký). Informace: zde. Formát: CSV
Data jsou uložena ve formátu DAT, což je čistě textový formát, který na každém řádku/transakci zachycuje seznam nakoupeného zboží/přítomnosti zboží v transakci.
3 kruhové shluky: CSV![]() |
5 kruhových shluků: CSV![]() |
5 překrývajících se shluků: CSV![]() |
Soustředné kruhy: CSV![]() |
Obdélníky: CSV![]() |
Husté vlnovky: CSV![]() |




5 překrývajících se shluků: CSV![]() |
Soustředné kruhy: CSV![]() |
Obdélníky: CSV![]() |
Husté vlnovky: CSV![]() |
Iris dataset se 4 atributy a 3 třídami: Informace CSV, Original![]() |
Separabilní 2D dataset. Dataset obsahuje 2 třídy (+1,-1), a jedná se o body v rovině. Každá třída má 50 bodů a mají mezi sebou oddělující pásmo. CSV![]() |
Neseparabilní 2D dataset. Dataset obsahuje 2 třídy (+1,-1), a jedná se o body v rovině. Každá třída má 50 bodů, které mají mezi sebou oddělující pásmo a navíc každá třída dalších 20 bodů, které jsou zamíchány v druhé skupině. CSV![]() |
Tic-Tac-Toe dataset s 9 atributy a 2 třídami. Informace. CSV, Original |
ARD
Přednášky
- Základní informace
- Neuronové sítě
- Neuronové sítě - parametry
- Konvoluční neuronové sítě.
- Autoencodér
- Variační autoenkodér
- Rekurentní neuronové sítě
- Klasifikace textu - reprezentace slov
- Modelování jazyka pomocí RNN
- Zpracování vektorových dat - Explorativní analýza a klasifikace
- Lokalizace a rozpoznání objektů v obraze
- Generativní metody - GAN
Cvičení
- Základy Google Collaboratory, Tensorflow a nastavení modelu Zobrazit/Skýt
- Cílem bude nastavit na počítači Tensorflow nebo se naučit pracovat s nástrojem Google Colaboratory.
- Na základním příkladě se podíváme na možnosti nastavení a vytvoření modelů pro analýzu datasetu.
- Vyzkoušme si jednak základní modely tak i použítí validačních množin, regularizace a další vlastnosti.
- Základní pracovní sešit naleznete zde
- Ukládání modelu a transfer learning Zobrazit/Skýt
- Cílem bude nastavit na počítači Tensorflow nebo se naučit pracovat s nástrojem Google Colaboratory.
- Vyzkoušíme si analýzu těžšího datasetu.
- Vyzkoušme si jednak ukládání modelů, jejich průběžné sledování a ukládání nejlepších výsledků a transfer learning.
- Základní pracovní sešit naleznete zde
- Konvoluční neuronové sitě Zobrazit/Skýt
- Vyzkoušíme si analýzu obrazů pomocí Konvolučních sítí.
- Vyzkoušíme si nastavení jednotlivých parametrů sítí k dosažení maximální efektivity.
- Základní pracovní sešit naleznete zde
- Autoencodér Zobrazit/Skýt
- Vyzkoušíme si vytvoření autoenkodéru.
- Vyzkoušíme si použití autoencodéru pro detekci anomálií a odstranění šumu.
- Dále si vyzkoušíme transfer learning předučených modelů.
- Základní pracovní sešit naleznete zde
- Variační autoencodér Zobrazit/Skýt
- Vyzkoušíme si použití variačního autoencodéru generování dovu typů obrázků dle použitých sad.
- Základní pracovní sešit naleznete zde
- Rekurentní neuronové sítě Zobrazit/Skýt
- Vyzkoušíme si použití rekuretních sítí pro predikci ceny akcií.
- Základní pracovní sešit naleznete zde
- Klasifikace textových dat Zobrazit/Skýt
- Vyzkoušíme si práci s texty pomocí neuronových sítí a práci se slovy.
- Základní pracovní sešit naleznete zde
- Modelování textu Zobrazit/Skýt
- Vyzkoušíme si modelování jazyka pomocí rekurentních sítí.
- Základní pracovní sešit naleznete zde
- Vektorová data Zobrazit/Skýt
- Na tomto cvičení zkusíte zpracovat standartní vektorová data.
- Základní pracovní sešit naleznete zde
- Lokalizace objektů v obrazech Zobrazit/Skýt
- Na tomto cvičení zkusíte lokalizovat objekty v obrazech a klasifikovat je do správných kategorií.
- Základní pracovní sešit naleznete zde
- Generativní modely Zobrazit/Skýt
- Na tomto cvičení zkusíte vytrénovat generativní model GAN.
- Základní pracovní sešit naleznete zde
MAD4
Přednášky
- Základní informace
- Predikce v časových řadách
- Predikce v časových řadách II.
- Neuronové sítě a Konvoluční neuronové sítě
- Autoencodér a Variační autoencodér
- Rekurentní neuronové sítě a Reprezentace výzamu slov
- Modelování jazyka
- Síť typu Transfomer a BERT
Cvičení
- Předvídání v časových řadách Zobrazit/Skýt
- Cílem cvičení bude vyzkoušet si predikci v časových řadách.
- Odkaz na cvičení je ZDE
- Základy Tensorflow Zobrazit/Skýt
- Cílem cvičení bude vyzkoušet si práci s frameworkem Tensorflow.
- Odkaz na cvičení je ZDE
- Konvoluční neuronové sítě Zobrazit/Skýt
- Cílem cvičení bude vyzkoušet si práci s frameworkem Tensorflow a konvolučními neuronovými sítěmi.
- Odkaz na cvičení je ZDE
- Autoencodér Zobrazit/Skýt
- Cílem cvičení bude vyzkoušet si práci s frameworkem Tensorflow a autoencodérem.
- Odkaz na cvičení je ZDE
- Rekurentní sítě - sentiment analýza Zobrazit/Skýt
- Cílem cvičení bude vyzkoušet si práci s frameworkem Tensorflow a rekurentními sítěmi pro zpracování textu.
- Odkaz na cvičení je ZDE
- Rekurentní sítě - modelování jazyka Zobrazit/Skýt
- Cílem cvičení bude vyzkoušet si práci s frameworkem Tensorflow a rekurentními sítěmi pro modelování jazyka.
- Odkaz na cvičení je ZDE
- Předvídání v časových řadách pomocí DNN Zobrazit/Skýt
- Cílem cvičení bude vyzkoušet si predikci v časových řadách pomocí neuronových sítí.
- Odkaz na cvičení je ZDE
ZSU/MFL
Přednášky / Lectures
- Základní informace / Course overview
- Motivace / Motivations
- Data a jejich vlastnosti / Data and their properties
- Statistické vlastosti / Statistial Data Properties
- Vzdálenost a podobnost / Distance and Similarity
- Reprezentace znalostí / Knowledge Representation
- Základní algoritmy / Basic algorithms
- Důvěryhodnost a evaluace algoritmů /Credibility and Algorithm Evaluation
- Pokročilé algoritmy - Rozhodovací strom / Decision Tree
- Pokročilé algoritmy - Regrese / Extended Linear Models and Regression
- Datové transformace / Data transformation
Cvičení / Exercises
Všechna cvičení jsou uvedena na stránkách Radka Svobody.