Info    Expertensystem    Waldgesellschaften    Baumarten    Intern    Home


Up- & download

Termine

Kapitelübersicht

Beschreibung der Waldgesellschaften

Baumarten

Tutorial

Arbeitsplan

Report Ei

Report Bu

Report Na

Report SF

Report So

Report all

Report all print


> Verwendete Klassifikationssysteme

Letzte Änderung: Thursday 30 November 2006 9:06:29 pm

Modellerstellung
Für das Expertensystem wurde ein statistisches Entscheidungsmodell konzipiert. Es wurde also kein Regelwerk aus Expertenwissen erstellt, sondern basierend auf empirischen Daten (Vegetationsaufnahmen mit Standortsangaben) ein Regressionsmodell für jede der 20 Waldgesellschaften ermittelt. Die Entwicklung dieser Modelle wurde von Johannes Kobler durchgeführt.

Als statistische Methode wurde nach der Durchführung eines Expertenworkshops die binäre logistische Regression gewählt, die zur Gruppe der Generalized Linear Models (GLMs) gezählt wird. Im Gegensatz zur traditionellen multiplen linearen Regressionsanalyse weist die abhängige Variable bei dieser statistischen Methode eine binäre Ausprägung (z.B.: 0, 1) auf. Zudem können Variablen mit nominalem Datenniveau als unabhängige Variable berücksichtigt werden.
Als Grundlage für die Erstellung der Modelle wurde die im Projekt erstellte Datenbank mit 1687 Aufnahmen zur Verfügung gestellt, die die Ansprachen der Vegetation (Zuordnung zu einer Waldgesellschaft) und der Standortmerkmale (u. a. Boden, Geologie, Seehöhe, Exposition, Neigung, Wasserhaushalt, Relief) auf diesen Aufnahmeflächen enthielt. Da nicht für alle Aufnahmen eine PNWG bestimmt werden konnte, umfasste diese Tabelle nur 1263 Aufnahmen. Daneben wurden noch die Zeigerwerte der Pflanzen (Bildung von Bodentypengruppen und geologischen Gruppen, Rekonstruktion von Bodentypen, geologischen Ausgangsmaterialien und Wasserhaushaltsklassen) und die digitalen geologischen Karten des Untersuchungsgebietes (Rekonstruktion von geologischen Ausgangsmaterialien) bei der Erstellung des Datensatzes berücksichtigt.
Die PNWGs dienten bei der Erstellung der statistischen Modelle als abhängige Variable. Da die binäre logistische Regression als statistische Methode gewählt wurde, gingen nicht alle 20 PNWGs gleichzeitig in die Modellbildung ein. Es wurde vielmehr für jede der 20 PNWGs ein eigenes Modell erstellt. Als unabhängige Variablen gingen die Standortmerkmale Seehöhe, Neigung, Boden, Geologie und Wasserhaushalt in die Modellbildung ein.
Ein Ergebnis der binären logistischen Regression war die Berechnung der Eintrittswahrscheinlichkeit der modellierten PNWG für jedes Element des Modelldatensatzes. Durch die Festlegung eines Trennwertes, der normalerweise bei 50% (0.5) liegt, wurden die Eintrittswahrscheinlichkeiten wieder in eine binäre Variabel umgewandelt. Dabei wurde angenommen, dass bei allen Aufnahmen des Modelldatensatzes, bei denen die Eintrittswahrscheinlichkeit größer als dieser Trennwert ist, die modellierte PNWG auftritt. Im vorliegenden Projekt wurde für jede PNWG ein eigener Trennwert (Kappa) bestimmt, der die Unterschiede in den relativen Häufigkeiten der PNWGs und der Qualität der Modelle berücksichtigt. Da die Ergebnisse aufgrund dieser unterschiedlichen Trennwerte nicht direkt vergleichbar waren, wurde für die Vergleichbarkeit der Modelle ein eigener Index entwickelt.
Zudem wurde mit Nagelkerkes R2 ein Gütekriterium berechnet, das jenen Anteil der Varianz der abhängigen Variablen angibt, der durch die unabhängigen Variablen erklärt wird und somit mit dem Bestimmtheitsmaß der linearen Regressionsanalyse vergleichbar ist. Da jedoch Nagelkerkes R2 aufgrund des Algorithmus, mit dem die Regressionskoeffizienten berechnet werden, immer optimiert wird, wurden die Ergebnisse dieses Gütekriteriums mit Hilfe eines Bootstrap Ansatzes relativiert und diese Ergebnisse mit Hilfe von Box Plot – Diagrammen und Maßen der deskriptiven Statistik dargestellt.
Das Ergebnis ist eine Tabelle, die die Regressionskoeffizienten sowie die Trennwerte (Kappa)der 20 Modelle. Diese Tabelle ist die Berechnungsgrundlage für das Online-Expertensystem für die Ableitung der Waldgesellschaften anhand von Standortsdaten.
Weiterführende Informationen sind dem technischen Endbericht (Kirchmeir, Kobler & Jungmeier 2006) zu entnehmen.