Studienarbeit aus dem Jahr 2020 im Fachbereich Informatik - Wirtschaftsinformatik, Note: 1, Universitat Wien (Betriebswirtschaftslehre), Veranstaltung: Advanced Topics in Business Informatics (MA) - Business Intelligence, Sprache: Deutsch, Abstract: Das Ziel dieser Seminararbeit ist es, einen Uberblick uber den aktuellen Forschungsstand der Datenintegration mithilfe von ETL zu schaffen. Im ersten Teil werden wichtige Konzepte, Nutzungsszenarien und Funktionalitaten von ETL anhand einer Literaturrecherche aufgezeigt und diskutiert. Daruber hinaus werden gangige Fehlerquellen bei der Durchfuhrung von ETL zusammengefasst. Auerdem soll eine Ubersicht uber diverse Open Source Tools zur Datenintegration mit ETL gegeben werden und auf deren Vor- und Nachteile hingewiesen werden. Neben dieser Literaturrecherche wird die Anwendung von ETL anhand eines konkreten Fallbeispiels demonstriert und diskutiert. Die Ausarbeitung soll dazu dienen, anhand eines Praxisbeispiels einen tieferen Einblick in die Implementierung von ETL zu erhalten, sowie Probleme bei derDurchfuhrung dieses Vorgangs festzustellen. Seitdem es die Digitalisierung gibt, hat sich die Menge der erzeugten Daten drastisch erhoht. Es herrscht ein exponentielles Wachstum an strukturierten und unstrukturierten Daten, welche Unternehmen zur Verfugung stehen und bei richtiger Auswertung Wettbewerbsvorteile versprechen. Doch woher kommen die relevanten Daten und welche Voraussetzungen sind zu erfullen, um diese zu analysieren? Hier kommt die Datenintegration ins Spiel. Darunter versteht man die Kombination von technischen Prozessen und Geschaftsprozessen. Diese werden verwendet, um Daten aus unterschiedlichen Quellen zu neuen Informationen zu kombinieren, welche wertvoll und aussagekraftig sind. Extract, Transform & Load (ETL) ist einer der Prozesse, mit dem Daten integriert werden konnen. Diese Technik spielt eine zunehmend wichtige Rolle im Unternehmen, wenn es darum geht, Geschaftsablaufe zu unterstutzen. Ein weiterer Treiber fur die Verwendung von Datenintegrations-Tools ist der dringende Bedarf an erweiterter Datenintegration, Hybrid-/Multi-Cloud-Datenmanagement, sowie Design von Datenstrukturen. Aufgrund des steigenden Interesses an ETL und der Notwendigkeit der Datenintegration in der Praxis, soll sich die Seminararbeit mit den Fragestellungen beschaftigen, was man unter dem Begriff ETL versteht, welche Open Source Tools zur Anwendung von ETL zur Verfugung stehen und wie ETL anhand eines Fallbeispiels angewendet wird.