155IN4G Informatika 4: Porovnání verzí

VizuálníWikitext

Aktuální verze z 6. 10. 2023, 21:01

Základní údaje o předmětu

Aktuální a kompletní informace jsou na této stránce
Kód předmětu: 155IN4G
Garant předmětu:

Ing. Jan Pytel, Ph.D.

Přednášející:

Ing. Jan Pytel, Ph.D.

Rozsah: 2+2
Počet kreditů: 5
Ukončení: z, zk

Anotace

V rámci předmětu jsou studenti seznámeni s technikami zpracování velkého množství dat. Nejprve se naučí jak předzpracovávat data v příkazovém řádku před importem do DB. Důraz je kladen na relační databáze a témata, která nebyla zmíněna během předmětu Informatika 2: indexy, exekuční plány, partitioning. Poté studenti dostanou základní informace o NoSQL databázích, ElasticSearch, R a cloudu.

Doporučená literatura

Harmonogram

Vyučující: Ing. Jan Pytel, Ph.D.

BigData - vývoj a koncept
Preprocesing dat v příkazovém řádku
Preprocesing dat v příkazovém řádku 2
Relační databáze - indexy, partitioning, ladění výkonu ACID
NoSQL databáze - koncept, odlišný přitup oproti relačním databázím
NoSQL databáze - Apache Cassandra
NoSQL databáze - grafové databáze (Neo4j), dokumentově orientované databáze
Základy cloudu
Instalace NoSQL databáze do cloudu - praktická ukázka redundance, CAP Theorem
Apache ekosystém I: Hadoop, HBase, Sparc, Pig
Fultextový vyhledávač ElasticSearch
Statistický jazyk R - využití při zpracování velkého množství dat
Statistický jazyk R - spojení s Apache Spark, praktické ukázky

Odkazy

Apache Cassandra/Hadoop/HBase/Sparc/Pig - http://www.apache.org/
Neo4j - https://neo4j.com/
ElasticSearch - https://www.elastic.co/
Language R - https://www.r-project.org

@@ Řádek 1: / Řádek 1: @@
+== Základní údaje o předmětu==
+* '''Aktuální a kompletní informace jsou na této stránce'''
+* Kód předmětu: 155IN4G
+* Garant předmětu: {{Lidé|Ing. Jan Pytel, Ph.D.}}
+* Přednášející: {{Lidé|Ing. Jan Pytel, Ph.D.}}
+* Rozsah: 2+2
+* Počet kreditů: 5
+* Ukončení: z, zk
 == Anotace ==