”Die University of California, Los Angeles (UCLA) hat in Zusammenarbeit mit dem Office of Advanced Research Computing (OARC) ein innovatives AI-Mikroservicesystem zur Unterstützung der immersiven Produktion des Musicals \”Xanadu\” entwickelt. Diese Produktion erlaubte es dem Publikum, aktiv Medien zu erstellen, indem sie mit mobilen Telefonen Zeichnungen auf großen LED-Bildschirmen, sogenannten \”Shrines\”, anfertigten. Die gesammelten Zeichnungen wurden mit Hilfe von AWS-Services verarbeitet, um AI-generierte 2D-Bilder und 3D-Modelle für die Bühnenbilder zu erstellen. \n\nDie OARC-Lösung ermöglichte nahezu Echtzeit-Inferenzen während der Aufführungen mit spezifischen Anforderungen, wie z.B. einer Mindestanzahl von 80 Benutzern, einer maximalen Reaktionszeit von 2 Minuten und einer hohen Verfügbarkeit der GPU-Ressourcen. Eine serverlose Architektur wurde eingesetzt, um die Effizienz der Verarbeitung zu maximieren, wobei AWS-Tools wie Amazon SageMaker und Amazon Bedrock für die KI-Modelle genutzt wurden.\n\nDie technische Architektur umfasste einen Messaging-Pipeline-Ansatz, bei dem Benutzerzeichnungen über AWS-Dienste wie SQS und Lambda verarbeitet wurden, um die inferenzierten Mediendateien zu erstellen. Eine weitere wichtige Komponente war die Verwendung von Amazon EFS für große Python-Abhängigkeiten, die neueste Techniken zur Generierung von Inhalten implementierten.\n\nDas Projekt war alles in allem erfolgreich, beschränkte jedoch die Kosten durch die Implementierung automatisierter Shutdown-Prozesse, um ungenutzte Ressourcen zu minimieren. Die Autoren des Artikels erwogen zukünftige Verbesserungen, darunter die Verwendung von AWS CloudFormation, um Updates und Deployments zu automatisieren. Der Einsatz von AWS-Managed Services stellte sich als vorteilhaft heraus, um komplexe architektonische Herausforderungen in der Echtzeit-Inferenz während der Aufführungen zu bewältigen und neue Formen der Unterhaltung zu unterstützen.