Studienarbeit aus dem Jahr 2022 im Fachbereich Informatik - Kunstliche Intelligenz, Note: 1,0, FOM Essen, Hochschule fur Oekonomie & Management gemeinnutzige GmbH, Hochschulleitung Essen fruher Fachhochschule, Veranstaltung: E-Business, Sprache: Deutsch, Abstract: In dieser Hausarbeit wird die Frage erlautert, welche Faktoren fur den Erfolg und die Qualitat eines Text-zu-Bild-Generators verantwortlich sind. Welche technischen Voraussetzungen muss ein neurales Modell erfullen, wie ist der Stand der aktuellen Entwicklung und wo liegen die Grenzen? Zur Beantwortung dieser Fragestellung wird im Rahmen der Arbeit eine Literaturrecherche herangezogen. Auerdem wurde im Juni 2022 durch eine Einladung ein Zugang zum modernen Text-zu-Bild-Generator DALL-E 2 von Open AI erlangt, um eine stichprobenhafte Evaluation der Outputs zu ermoglichen. Mithilfe der Literaturrecherche sowie Stichproben innerhalb von aktuellen Bildgeneratoren sollen folgende Hypothesen untersucht werden: H1: Aktuelle Text-zu-Bild-Generatoren sind in der Lage, Bilder in einer Qualitat zu generieren, wie Menschen es in der Fotografie und der Bildkunst konnen. H2: Text-zu-Bild-Generatoren sind durch ihren Trainingsdatensatz begrenzt und konnen keine Werke erstellen, fur die sie nicht mit genugend Referenzen trainiert wurden. Menschen haben ein starkes visuelles Vorstellungsvermogen. Wenn Menschen uber sensorische Charakteristiken nachdenken, vermitteln sie sie selbst uber Bilder, die sie sich in ihrem Bewusstsein vorstellen. Dieses Vorstellungsvermogen spielt eine wichtige Rolle dabei, Erinnerungen zu verarbeiten und Zusammenhange herzustellen. Bildverarbeitungstechnologien, die in Computerspielen oder Anwendungen wie Photoshop eingesetzt werden, haben in den letzten Jahren stark von der Maschine-Learning-Technologie profitiert. Einer der neuen Felder ist die Synthese von Bildmaterial durch Text-zu-Bild-Generatoren. Die Grundlagen hierfur legten Godfellow et al. 2014, indem sie neuralen Netzwerken beibrachten, sich selbst zu trainieren. Dafur trainierten sie zwei Modelle. Beide Modelle wurden mit Bildern aus einem Datensatz trainiert. Allerdings sollte das erste Modell, das Generative Model, daraus neue Bilder kreieren und das zweite Modell, das Discriminative Model, feststellen, ob das erste Modell die Bilder aus dem Datensatz nur kopiert oder tatsachlich ein neues Bild generiert hat. Im statistisch besten Sinne gab das zweite Modell die Wahrscheinlichkeit, ob die Ausgabe ein neues Bild ist, mit einem Koeffizienten an. So wurde der Weg zu einem Bildgenerator, der neue Bilder generiert, die es zuvor so noch nicht gegeben hatte, zu einem Spiel mit zwei Spielern.