tldr; Warum KI sehen muss, um zu verstehen
Vision und Illusion
20.10.2024
33min
In dieser Episode zeigen wir, warum Künstliche Intelligenz sehen muss, um wirklich zu verstehen. Vision-Modelle sind der Schlüssel zur nächsten Stufe der KI-Entwicklung, denn nur mit Bildern lässt sich ein umfassendes Weltbild schaffen – Bilddaten übertreffen Text in Menge und Tiefe. Doch das ist nicht alles: Wir sprechen auch über die 'Diffusion Illusion' – eine coole Technik, bei der Stable Diffusion-Modelle mehrere Perspektiven und Subjekte gleichzeitig in einem einzigen Bild abbilden können.