153ZODH / 10. cvičení: Porovnání verzí

Verze z 6. 12. 2008, 21:13

Klasifikace obecně, neřízená klasifikace

Tento článek není dokončen nebo potřebuje upravit

< Stránky předmětu • Předchozí cvičení • Další cvičení

Osnova

Teorie

Klasifikací označujeme třídění objektů do jednotlivých skupin (tříd). Tzv. příznakovou klasifikace (tj. metoda klasifikace operující v tzv. příznakovém prostoru) patří mezi základní metody DPZ. Na základě multispektrálního obrazu jsou sestaveny spektrální příznaky (tj. charakteristické změny radiační veličiny v závislosti na změně druhového či stavového parametru), dochází tak ve své podstatě ke třídění obrazových pixelů do jednotlivých skupin o podobných vlastnostech - ke klasifikaci dat na základě určitého rozhodovacího pravidla (klasifikátoru).

Počet pixelů pokrývající stejné uzemí (v geografickém smyslu slova) závisí na počtu pásem (obrazových vrstev) družicového snímku vstupujících do procesu klasifikace. Tato množina pixelů se často označuje jako spektrální vektor. Algoritmus klasifikace se obecně snaží separovat jednotlivé spektrální vektory do předem definovaných tříd (např. půda, vegetace, vodní plochy, atd.). Výsledná tematická mapa tak odráží počet a proporce těchto tříd.

Rozlišujeme dva základní typy příznakové klasifikace:

neřízenou (unsupervised) a
řízenou (supervised) klasifikaci.

Klasifikace jako taková vyžaduje dva kroky. Nejprve je analyzována podobnost spektrálních vektorů v ohledu na spektrální odrazivost (naplnění příznakového prostoru), v druhém kroku následuje vlastní klasifikace, tj. přiřazení k jednotlivým třídám.

V případě neřízené klasifikace je tento proces plně automatizován, je založen na statistice obrazu. Nejprve se vytvoří tzv. shluky, dojde k naplnění příznakového prostoru. Výsledkem této klasifikace jsou nicméně čistě abstraktní třídy. Základní otázkou je tedy nalezení smysluplného počtu tříd, které by vhodně popsaly dané území.

V případě řízené klasifikace je naopak vyžadován vstup od uživatele, konkrétně výběr tzv. trénovacích ploch, tzn. jakýchsi vzorů pro jednotlivé třídy. Následuje výpočet příznakového prostoru a pak vlastní klasifikace. Statistika obrazových dat je tak přímo ovlivněna výběrem trénovacího souboru, uživatel má tak možnost ovlivnit nejen počet výsledných tříd ale i jejich význam.

GRASS nabízí dva obecné klasifikátory:

Maximum Likelihood classifier (MLC) - je založen na předpokladu, že rozdělení bodů tvořících jednu třídu tréninkových dat má Gaussovo, tedy normální rozdělení. Lze tak určit statistickou pravděpodobnost dané hodnoty pixelu jako člena vybrané třídy. Pixel je nakonec zařazen do třídy s největší určenou pravděpodobností.
Sequential Maximum A Posteriori classifier (SMAP)

Omezíme-li se na implementaci v GRASSu, můžeme rozlišit dvě hlavní skupiny (viz tab. č.1):

radiometrická klasifikace
- neřízená klasifikace (i.cluster, i.maxlik)
- řízená klasifikace a kombinovaná částečně řízená klasifikace (i.class, i.gensig, i.maxlik)
kombinovaná radiometrická/geometrická klasifikace (i.gensigset, i.smap)

Tab č.1: Přehled metod klasifikace v GRASSu
	radiometrická	radiomerická		radiometrická/geometrická
	neřízená	řízená		řízená
předzpracování	i.cluster	i.class (monitor)	i.gensig (mapa)	i.gensigset
výpočet	i.maxlik	i.maxlik	i.maxlik	i.smap

Jedním z problémů klasifikace jsou tzv. smíšené pixely, tj. ty které odrážejí hned několik objektů (např. hranice les-pole, zástavba, atd.). V této situaci je pixel přiřazen k dominantní třídě s nízkou pravděpodobností tohoto přiřazení. Často je tak vhodné problémové oblasti před vlastní klasifikací nejprve maskovat.

Za poznámku stojí fakt, že další klasifikátory jako je Artificial Neural Networks (ANN), k-Nearest Neighbor classification (kNN), Support Vector Machines (SVM) a řada dalších je dostupná v R (program pro statistické výpočty a generování grafů). Tato aplikace může být propojena s GRASSem přes speciální rozhraní GRASS/R.

Poznámka: Jedním z problémů klasifikace jsou lokální diference (způsobené změnou míry a expozice svahu, atmosferických podmínek). Nejprve je tak vhodné aplikovat radiometrické korekce pro minimalizaci těchto nežádoucích vlivů.

Hodnocení výsledků klasifikace

Otázka hodnocení výsledků klasifikace není vůbec jednoduchá, nejčastěji se využívá porovnání v testovacích plochách, které jsou známy z jiných testovacích dat. Ve vyjímečných případech se zkoumá celý výsledek klasifikace, což je přirozeně finančně i časově velmi náročné.

Úpravy po klasifikaci

Výsledkem klasifikace jsou často díky spektrální variabilitě nepříliš homogenní plochy, což nemusí být, např. pro účel prezentace výsledků, úplně optimální stav. V takovýchto případech je nutno výsledný obraz vyhladit.

Postklasifikační filtr je založen na logickém operátoru a nikoliv na operacích aritmetickým (potom by mohly vznikat hodnoty neexistujících tříd). Často se využívá majoritní filtr, který přiřadí středovému pixelu kernelu hodnotu majoritní třídy.

< Stránky předmětu • Předchozí cvičení • Další cvičení

@@ Řádek 8: / Řádek 8: @@
 __TOC__
 == Osnova ==
+== Teorie ==
+Klasifikací označujeme třídění objektů do jednotlivých skupin (''tříd''). Tzv. ''příznakovou'' klasifikace (tj. metoda klasifikace operující v tzv. ''příznakovém prostoru'') patří mezi základní metody DPZ. Na základě multispektrálního obrazu jsou sestaveny ''spektrální příznaky'' (tj. charakteristické změny radiační veličiny v závislosti na změně druhového či stavového parametru), dochází tak ve své podstatě ke třídění obrazových pixelů do jednotlivých skupin o podobných vlastnostech - ke klasifikaci dat na základě určitého ''rozhodovacího pravidla'' (klasifikátoru).
+Počet pixelů pokrývající stejné uzemí (v geografickém smyslu slova) závisí na počtu pásem (obrazových vrstev) družicového snímku vstupujících do procesu klasifikace. Tato množina pixelů se často označuje jako ''spektrální vektor''. Algoritmus klasifikace se obecně snaží separovat jednotlivé spektrální vektory do předem definovaných tříd (např. půda, vegetace, vodní plochy, atd.). Výsledná ''tematická mapa'' tak odráží počet a proporce těchto tříd.
+Rozlišujeme dva základní typy příznakové klasifikace:
+* '''neřízenou''' (''unsupervised'') a
+* '''řízenou''' (''supervised'') klasifikaci.
+Klasifikace jako taková vyžaduje dva kroky. Nejprve je analyzována podobnost spektrálních vektorů v ohledu na spektrální odrazivost (naplnění příznakového prostoru), v druhém kroku následuje vlastní klasifikace, tj. přiřazení k jednotlivým třídám.
+V případě ''neřízené'' klasifikace je tento proces plně automatizován, je založen na statistice obrazu. Nejprve se vytvoří tzv. ''shluky'', dojde k naplnění příznakového prostoru. Výsledkem této klasifikace jsou nicméně čistě abstraktní třídy. Základní otázkou je tedy nalezení smysluplného počtu tříd, které by vhodně popsaly dané území.
+V případě ''řízené'' klasifikace je naopak vyžadován vstup od uživatele, konkrétně výběr tzv. ''trénovacích ploch'', tzn. jakýchsi vzorů pro jednotlivé třídy. Následuje výpočet příznakového prostoru a pak vlastní klasifikace. Statistika obrazových dat je tak přímo ovlivněna výběrem trénovacího souboru, uživatel má tak možnost ovlivnit nejen počet výsledných tříd ale i jejich význam.
+GRASS nabízí dva obecné ''klasifikátory'':
+* ''Maximum Likelihood classifier'' (MLC) - je založen na předpokladu, že rozdělení bodů tvořících jednu třídu tréninkových dat má Gaussovo, tedy normální rozdělení. Lze tak určit statistickou pravděpodobnost dané hodnoty pixelu jako člena vybrané třídy. Pixel je nakonec zařazen do třídy s největší určenou pravděpodobností.
+* ''Sequential Maximum A Posteriori classifier'' (SMAP)
+Omezíme-li se na implementaci v GRASSu, můžeme rozlišit dvě hlavní skupiny (viz tab. č.1):
+* ''radiometrická klasifikace''
+** ''neřízená klasifikace'' ({{GrassPrikaz|i.cluster}}, {{GrassPrikaz|i.maxlik}})
+** ''řízená klasifikace'' a ''kombinovaná částečně řízená klasifikace'' ({{GrassPrikaz|i.class}}, {{GrassPrikaz|i.gensig}}, {{GrassPrikaz|i.maxlik}})
+* ''kombinovaná radiometrická/geometrická klasifikace'' ({{GrassPrikaz|i.gensigset}}, {{GrassPrikaz|i.smap}})
+<center>
+{|class="border"
+|+Tab č.1: Přehled metod klasifikace v GRASSu
+|-
+|&nbsp;|| style="text-align: center" | radiometrická || colspan="2" style="text-align: center" |  radiomerická || style="text-align: center" | radiometrická/geometrická
+|-
+|&nbsp;|| style="text-align: center" | neřízená || colspan="2" style="text-align: center" | řízená || style="text-align: center" | řízená
+|-
+| předzpracování || {{GrassPrikaz|i.cluster}} || {{GrassPrikaz|i.class}} (monitor) || {{GrassPrikaz|i.gensig}} (mapa) || {{GrassPrikaz|i.gensigset}}
+|-
+| výpočet || {{GrassPrikaz|i.maxlik}} || {{GrassPrikaz|i.maxlik}} || {{GrassPrikaz|i.maxlik}} || {{GrassPrikaz|i.smap}}
+|-
+|}
+</center>
+Jedním z problémů klasifikace jsou tzv. ''smíšené pixely'', tj. ty které odrážejí hned několik objektů (např. hranice les-pole, zástavba, atd.). V této situaci je pixel přiřazen k dominantní třídě s nízkou pravděpodobností tohoto přiřazení. Často je tak vhodné problémové oblasti před vlastní klasifikací nejprve maskovat.
+Za poznámku stojí fakt, že další klasifikátory jako je ''Artificial Neural Networks (ANN)'', ''k-Nearest Neighbor classification (kNN)'', ''Support Vector Machines (SVM)'' a řada dalších je dostupná v&nbsp;[http://www.r-project.org R] (program pro statistické výpočty a&nbsp;generování grafů). Tato aplikace může být propojena s GRASSem přes speciální rozhraní [http://r-spatial.sourceforge.net GRASS/R].
+''Poznámka: Jedním z problémů klasifikace jsou lokální diference (způsobené změnou míry a expozice svahu, atmosferických podmínek). Nejprve je tak vhodné aplikovat radiometrické korekce pro minimalizaci těchto nežádoucích vlivů.''
+=== Hodnocení výsledků klasifikace ===
+Otázka hodnocení výsledků klasifikace není vůbec jednoduchá, nejčastěji se využívá porovnání v ''testovacích plochách'', které jsou známy z jiných testovacích dat. Ve vyjímečných případech se zkoumá celý výsledek klasifikace, což je přirozeně finančně i časově velmi náročné.
+=== Úpravy po klasifikaci ===
+Výsledkem klasifikace jsou často díky spektrální variabilitě nepříliš homogenní plochy, což nemusí být, např. pro účel prezentace výsledků, úplně optimální stav. V takovýchto případech je nutno výsledný obraz ''vyhladit''.
+''Postklasifikační filtr'' je  založen na ''logickém operátoru'' a nikoliv na operacích aritmetickým (potom by mohly vznikat hodnoty neexistujících tříd). Často se využívá ''majoritní filtr'', který přiřadí středovému pixelu kernelu hodnotu majoritní třídy.