155IN4G Informatika 4: Porovnání verzí

Z GeoWikiCZ
mBez shrnutí editace
mBez shrnutí editace
 
(Nejsou zobrazeny 2 mezilehlé verze od stejného uživatele.)
Řádek 1: Řádek 1:
== Základní údaje o předmětu==
* '''Aktuální a kompletní informace jsou na této stránce'''
* Kód předmětu: 155IN4G
* Garant předmětu: {{Lidé|Ing. Jan Pytel, Ph.D.}}
* Přednášející: {{Lidé|Ing. Jan Pytel, Ph.D.}}
* Rozsah: 2+2
* Počet kreditů: 5
* Ukončení: z, zk
== Anotace ==
== Anotace ==



Aktuální verze z 6. 10. 2023, 21:01

Základní údaje o předmětu

  • Aktuální a kompletní informace jsou na této stránce
  • Kód předmětu: 155IN4G
  • Garant předmětu:

Ing. Jan Pytel, Ph.D.

  • Přednášející:

Ing. Jan Pytel, Ph.D.

  • Rozsah: 2+2
  • Počet kreditů: 5
  • Ukončení: z, zk

Anotace

V rámci předmětu jsou studenti seznámeni s technikami zpracování velkého množství dat. Nejprve se naučí jak předzpracovávat data v příkazovém řádku před importem do DB. Důraz je kladen na relační databáze a témata, která nebyla zmíněna během předmětu Informatika 2: indexy, exekuční plány, partitioning. Poté studenti dostanou základní informace o NoSQL databázích, ElasticSearch, R a cloudu.

Doporučená literatura

Harmonogram

Vyučující: Ing. Jan Pytel, Ph.D.

  1. BigData - vývoj a koncept
  2. Preprocesing dat v příkazovém řádku
  3. Preprocesing dat v příkazovém řádku 2
  4. Relační databáze - indexy, partitioning, ladění výkonu ACID
  5. NoSQL databáze - koncept, odlišný přitup oproti relačním databázím
  6. NoSQL databáze - Apache Cassandra
  7. NoSQL databáze - grafové databáze (Neo4j), dokumentově orientované databáze
  8. Základy cloudu
  9. Instalace NoSQL databáze do cloudu - praktická ukázka redundance, CAP Theorem
  10. Apache ekosystém I: Hadoop, HBase, Sparc, Pig
  11. Fultextový vyhledávač ElasticSearch
  12. Statistický jazyk R - využití při zpracování velkého množství dat
  13. Statistický jazyk R - spojení s Apache Spark, praktické ukázky

Odkazy