Optimaler Entscheidungsbaum: Pflichtenheft
Warning: preg_match(): Compilation failed: group name must start with a non-digit at offset 8 in /www/htdocs/w0102873/mediawiki/includes/MagicWord.php on line 739
Aus It2010-g1
Segr (Diskussion | Beiträge) (→Über) |
Bepf (Diskussion | Beiträge) (→Einleitung) |
||
Zeile 17: | Zeile 17: | ||
== Einleitung == | == Einleitung == | ||
=== Allgemeines === | === Allgemeines === | ||
− | Ein Entscheidungsbaum ist ein speziell aufgebauter Baum aus der Graphentheorie. Im Gegensatz zu einem "normalen" Baum ist ein Entscheidungsbaum geordnet und gerichtet und dient dem Zweck Entscheidungsregeln darzustellen. Ein Entscheidungsbaum kann durch Algorithmen | + | Ein Entscheidungsbaum ist ein speziell aufgebauter Baum aus der Graphentheorie. Im Gegensatz zu einem "normalen" Baum ist ein Entscheidungsbaum geordnet und gerichtet und dient dem Zweck Entscheidungsregeln darzustellen. Ein Entscheidungsbaum kann durch Algorithmen auf Basis von tabellarischen Daten erstellt werden. Aufgrund der Tatsache, dass diese Bäume Entscheidungsprobleme lösen bzw. vereinfachen können, wird diese Methode in vielen Bereichen angewandt. Hauptsächlich benutzt, wird ein Entscheidungsbaum beim Data-Mining, also der umfassenden Theroie der Datenauswertung; aber auch in der Betriebswirtschaftslehre, um effektives Marketing zu betreiben, oder Investment-Geschäfte zu bewerten. Darüber hinaus gibt es viele denkbare Einsatzbereiche, da Entscheidungen fast überall getroffen werden müssen. |
− | Ein Entscheidungsbaum besteht aus Knoten und Blättern | + | Ein Entscheidungsbaum besteht aus Knoten und Blättern. Er muss einen Wurzelknoten besitzen und wird durch Kanten verbunden. |
− | Ein Knoten repräsentiert ein Attribut(-namen), Kanten die zulässigen Attributwerte und die Blätter zeigen die Attributwerte (meistens klassifiziert) | + | Ein Knoten repräsentiert ein(en) Attribut(-namen), Kanten die zulässigen Attributwerte und die Blätter zeigen die Attributwerte (meistens klassifiziert) des Zielattributs an. |
− | In diesem Pflichtenheft wird nun ein Programm beschrieben, dass einen Entscheidungsbaum auf Basis | + | In diesem Pflichtenheft wird nun ein Programm beschrieben, dass einen Entscheidungsbaum auf Basis einer Tabelle konstruieren kann. Dieses Programm ist als Auftragsarbeit von Hr. Prof. Dr. Höhne und Fr. Prof. Dr. Monett-Diaz zu sehen, bestimmte Funtktionen und Kriterien sind bereits vorgegeben. |
=== Abgrenzungen === | === Abgrenzungen === | ||
==== Ausgangssituation ==== | ==== Ausgangssituation ==== | ||
Im Auftrag von Hr. Prof. Dr. Höhne und Fr. Prof. Dr. Monett-Diaz wird ein Programm, im Rahmen des Moduls SWE-2, entwickelt, welches dazu dienen soll Entscheidungsbäume zu konstruieren und darzustellen. Als Datenbasis dienen Excel- und CSV-Dateien. | Im Auftrag von Hr. Prof. Dr. Höhne und Fr. Prof. Dr. Monett-Diaz wird ein Programm, im Rahmen des Moduls SWE-2, entwickelt, welches dazu dienen soll Entscheidungsbäume zu konstruieren und darzustellen. Als Datenbasis dienen Excel- und CSV-Dateien. | ||
Mit Hilfe dieser Daten soll dann ein "optimaler Entscheidungsbaum" aufgebaut werden, wobei zu beachten ist, dass der Begriff "optimal" nur relativ gesehen kann, und abhängig von gewähltem Algorhitmus und Art des Datenbestands abhängig ist. | Mit Hilfe dieser Daten soll dann ein "optimaler Entscheidungsbaum" aufgebaut werden, wobei zu beachten ist, dass der Begriff "optimal" nur relativ gesehen kann, und abhängig von gewähltem Algorhitmus und Art des Datenbestands abhängig ist. | ||
− | ==== Systemname | + | ==== Systemname === |
− | Aufgrund der Tatsache, dass ein Entscheidungsbaum nach bestimmten Regeln ''aufgebaut'' wird und der Anwender einen | + | Aufgrund der Tatsache, dass ein Entscheidungsbaum nach bestimmten Regeln ''aufgebaut'' wird und der Anwender einen ''Lerneffekt'' aus diesem Baum ziehen kann, in dem Entscheidungen vereinfacht werden, wurde beschlossen das Projekt und das Programm "Baumschule - Optimale Entscheidungsbäume" zu nennen. |
==== Allgemeine Systembeschreibung ==== | ==== Allgemeine Systembeschreibung ==== | ||
Das System bzw. das Programm bietet hauptsächlich drei grobe Funtkionen an: | Das System bzw. das Programm bietet hauptsächlich drei grobe Funtkionen an: | ||
− | * Laden eines Datenbestands durch eine Datei (Excel bzw. CSV) | + | * Laden/Editieren eines Datenbestands durch eine Datei (Excel bzw. CSV) |
− | * Erstellen eines Entscheidungsbaumes durch einen gegebenen Algorithmus | + | * Erstellen eines Entscheidungsbaumes durch einen gegebenen Algorithmus, oder einer Nutzervorgabe |
* Präsentation des Ergebnisses | * Präsentation des Ergebnisses | ||
Diese 3 Hauptfunktionen lassen sich näher beschreiben: | Diese 3 Hauptfunktionen lassen sich näher beschreiben: | ||
* Es gibt eine graphische Benutzeroberfläche mit der der Endandwender alle Funktionen des Programms benutzen kann | * Es gibt eine graphische Benutzeroberfläche mit der der Endandwender alle Funktionen des Programms benutzen kann | ||
− | * Es gibt eine Funktion zum Laden | + | * Es gibt eine Funktion zum Laden/Speichern einer Excel- oder CSV-Datei |
− | + | ||
* Geladene Tabellendaten können editiert werden. | * Geladene Tabellendaten können editiert werden. | ||
* Ein Baum kann automatisch generiert werden, ein ZielAttribut kann vorher gewählt werden. | * Ein Baum kann automatisch generiert werden, ein ZielAttribut kann vorher gewählt werden. | ||
− | * Es können detaillierte Informationen über einen Baum angezeigt werden | + | * Ein Baum kann teilweise manuell erstellt werden, in dem für jeden Knoten die nächste Attributebene selbst gewählt werden kann. |
− | + | * Es können jederzeit detaillierte Informationen über einen Baum bzw. dessen Tabellendaten angezeigt werden. | |
+ | |||
==== Vorteile und Nutzen ==== | ==== Vorteile und Nutzen ==== | ||
− | Das System bietet | + | Das System bietet eine Bearbeitung eines Datenbestandes an, und arbeitet nach dem Laden einer Datei formatunabhängig. Ist ein Datenbestand bearbeitet worden, ist dieser auch wieder exportierbar. |
− | Die Oberfläche bietet die Möglichkeit einen, gemäß des Algorithmus, optimalen Baumes darzustellen. Die Stärke liegt hierbei einerseits auf der Präsentation und andererseits die leichte Editierbarkei, denn der Baum kann durch | + | Die Oberfläche bietet die Möglichkeit einen, gemäß des Algorithmus, optimalen Baumes darzustellen. Die Stärke liegt hierbei einerseits auf der Präsentation und andererseits die leichte Editierbarkei, denn der Baum kann durch Mausklicks bearbeitet und untersucht werden. Ein manuelles zeichnen und berechnen des Baumes entfällt. |
− | Ein manuelles | + | Gerade bei großen Daten ist ein Baum nur durch ein Programm wie dieses erstellbar. Arbeitet der Algorithmus fehlerfrei, kann ''immer wieder'' und ''reprodzuzierbar'' ein Baum aufgebaut werden. |
=== Überblick über den Rest des Dokuments === | === Überblick über den Rest des Dokuments === | ||
+ | |||
+ | Die nachfolgenden Abschnitte befassen sich detaillierter und gründlicher mit den Funktionen des Programms. Es werden Vereinbarungen festgelegt, welches Verhalten das Programm leisten kann und muss. | ||
== Fachbegriffe, Akronyme und Abkürzungen == | == Fachbegriffe, Akronyme und Abkürzungen == |