Stability.AI erweitert seine Basismodelle und hat kürzlich einen neuen KI-Video-Generator namens Stable Video Diffusion vorgestellt.
Dies ist ein logischer Schritt in der Entwicklung des Unternehmens, denn die Erzeugung von KI-Videos ist das nächste unmittelbare Ziel im Bereich der künstlichen Intelligenz, um neue Multimedia-Inhalte erstellen zu können.
Das neue Tool nutzt die Stable Diffusion-Technologie, mit der Bilder in kurze Videos umgewandelt werden. Und das gelingt sehr gut und ist nur der Anfang zahlreicher zukünftiger Anwendungen im Bereich KI-Video.
Es scheint jedoch, dass Stable Video Diffusion ähnliche Risiken bezüglich potenziell schädlicher Nutzung und Urheberrechtsverletzungen birgt, wie schon Stable Diffusion.
Die jüngste Entwicklung, Stable Video Diffusion, wurde vor kurzem vom Unternehmen angekündigt, obwohl das Tool noch nicht komplett fertig und auch noch nicht für die kommerzielle Nutzung verfügbar ist.
Stable Video Diffusion ist ein grundlegendes Modell für generative KI-Videos, das auf dem Flaggschiff des Unternehmens, dem Text-zu-Bild-Modell Stable Diffusion, basiert und Standbilder in Kurzfilme umwandeln kann.
Das neue Tool besteht aus zwei Bild-zu-Video-Modellen, SVD und SVD-XT, die 4 bzw. 25 Bilder bei anpassbaren Bildraten zwischen 3 und 30 Bildern pro Sekunde erzeugen. Damit können 2- bis 5-Sekunden lange Videos aus einem Referenz-Standbild erstellt werden. Die Modelle sollen in der ersten Phase mit Datensätzen von Millionen von Bildern und Videos und dann in einer zweiten Phase mit einer kuratierten Auswahl von bis zu einer Million Dateien trainiert werden.
Sie können jetzt schon auf die neuen generativen KI-Videomodelle auf dem GitHub-Repository des Unternehmens zugreifen.
Das Unternehmen gibt an, dass sein neuestes generatives Videomodell in den Bereichen Medien, Unterhaltung, Bildung und Marketing Anwendung findet.
Eine Möglichkeit, die Sie bereits testen können, ist die Erstellung von Videos mit mehreren Ansichten aus einem einzigen Referenzbild, ähnlich wie 360°-Videos.
Das Unternehmen hat jedoch weitere Anwendungen im Sinn und beabsichtigt, ein Ökosystem aufzubauen, genauso wie beim generativen Bildmodell Stable Diffusion. Eine der kommenden Funktionen ist die immer wieder gewünschte Text-zu-Video-Generierung, für die es bereits eine Warteliste gibt.
Was die aktuellen Anwendungen in der Praxis betrifft, so zeigt Stable Video Diffusion recht hochwertige Ergebnisse, die mit denen früherer Tools vergleichbar oder sogar besser sind. Allerdings ist das Modell derzeit noch nicht in der Lage, menschliche Gesichter korrekt zu synthetisieren oder lesbaren Text zu erzeugen, um nur einige Beispiele zu nennen.
Da es sich bei Stable Video Diffusion um eine Forschungsvorschau handelt, müssen Sie den Nutzungsbedingungen des Unternehmens zustimmen, die besagen, dass die Technologie nur für pädagogische und künstlerische Zwecke bestimmt ist und die Lizenz nicht-kommerziell ist
In der Vereinbarung werden auch nicht erlaubte Verwendungszwecke genannt. So wird eine „sachliche oder wahrheitsgetreue Darstellungen von Personen oder Ereignissen“ gefordert. Wie The Verge feststellte, scheint die Software jedoch über keine eingebauten Sicherheitsvorkehrungen zu verfügen, die diese und andere potenziell schädliche Anwendungen verhindern könnten.
Darüber hinaus hat Stability.AI die Herkunft der Daten, mit denen das neue Modell trainiert wurde, nicht offengelegt. Es gibt genügend Anhaltspunkte für den Verdacht, dass die Datensätze zumindest teilweise aus Inhalten stammen, die aus dem Internet gescrapt wurden, wie es auch beim Bildgenerator Stable Diffusion der Fall war. Es besteht daher keine Gewissheit über den urheberrechtlichen Status der Modelle und der von ihnen generierten Inhalte.
Die Bedenken beruhen auf Erfahrungen: Stable Diffusion war im Dark Web weit verbreitet und wurde für mehr als nur fragwürdige, wenn nicht offen böswillige Zwecke verwendet – zum Beispiel für Fehlinformationen durch Deepfake-Bilder. Unternehmen wie beispielsweise Getty Images verklagen derzeit Stability.AI aufgrund der unerlaubten Verwendung von geistigem Eigentum bzw. Datensätzen, um KI-Modelle zu trainieren.
Ohne das Potenzial des neuen Modells für kreative Workflows und kommerzielle Unternehmungen schmälern zu wollen, gilt es, die vorstehend genannten Punkte vor Nutzung zu berücksichtigen.
Haben Sie vor, das neue Stable Video Diffusion-Modell auszuprobieren? Wie würden Sie es in Zukunft für Ihren Workflow einsetzen? Teilen Sie uns doch gern Ihre Meinung mit!
AUTOR
Ralf Koll
Ralf Koll ist ein erfahrener Autor und Experte mit den Schwerpunkten KI, Stock Media, Design und kreative Designtools. Ralf berichtet über KI-Software von der ersten Stunde an und schreibt über Entwicklungen im Bereich Künstliche Intelligenz, insbesondere für Stockfotos und Grafiken auf Fotoskaufen.de.
AI Secrets ist eine Informationsplattform für Tech-Entscheider, die sich über KI-Technologie informieren möchten. Zu unserem Team gehören Experten wie Amos Struck und Ralf Koll sowie Ivanna Attie mit über 20 Jahren Erfahrung im Bereich KI, Stockfotografie und Medienlizenzierung.
Get AI news in your inbox & join thousands of engineers and managers using AI to boost sales and grow market share