Abacus AI
Ich habe mit alten Familienfotos und verschiedenen KIs bzw. den LLM (Large Language Model) getestet, was diese Text basierten Modelle zu leisten im Stande sind.
Anforderungen habe ich hierfür bewusst niedrig gewählt und einen einfachen Prompt (quasi der Text als Befehlsanweisung) benutzt und denselben Prompt für alle LLM benutzt.
Zu sehen ist meine Mutter um 1960 herum.
Dabei habe ich die Plattform Abacus AI (https://apps.abacus.ai) genutzt, welche auf mehrere LLM verschiedener Hersteller zugreifen kann. Die Plattform ist nicht kostenlos, aber das günstigste, wenn man wirklich etwas Rumtesten will. Es kostet 10 USD im Monat, was 10.000 Credits entspricht.
Man kann Credits hinzukaufen, wenn man seinen Monatsvorrat aufgebraucht hat, was ehrlich gesagt schnell passieren kann, wenn man in Probierlaune kommt.
Über andere Plattformen kann man diese hier genutzten LLM vielleicht auch teilweise kostenlos nutzen, doch dafür müsst Ihr diese Plattformen suchen und mit mehr Einschränkungen rechnen, als bei Abacus AI. Die Anforderungen und Einstellungsmöglichkeiten unterscheiden sich natürlich ebenfalls.
Die LLM welche ich hier verwendet habe in der Reihenfolge, wie ich sie verwendet habe:
- Veo 3.1 (kostenpflichtig, 6400 Credits, das teuerste )
- Wan V2.5 (kostenpflichtig, 3000 Credits)
- Kling V2.5 (kostenpflichtig, 700 Credits)
- Seedance Pro (kostenpflichtig, 1464 Credits)
- Hailuo V2 (kostenpflichtig, 450 Credits)
- Runway (kostenpflichtig, 500 Credits)
- Luma Labs (kostenpflichtig, 400 Credits)
Veo 3.1 gefällt mir am besten, allerdings ist es auch teilweise bis zu 10 mal teurer es zu benutzen, als andere LLM.
Sora 2 hat zum Beispiel seinen Dienst verweigert, weil es bedenkliche Inhalte im Foto (oder Prompt) erkannt haben will.
Ich habe es dann nicht verwendet, obwohl es im Netz bejubelt wird.
Meine alten Kinderfotos (auch über 60 Jahre alt) werden auch oft von Sora oder Veo (über die Gemini Seite) verweigert zu bearbeiten. Sie haben sehr strenge und sehr konservative Einstellungen.
Der Prompt für alle LLM:
| Ein altes Familienfoto. Alle Personen sollen mit Gesichtern und Kleidung übernommen werden. Der Stil ist 70er Jahre. Die Person bewegt sich etwas und schaut am Ende lächelnd in die Kamra. Der Kameraschwenk ist langsam und zoomt am Ende der Szene etwas hinein. Das Video basiert auf die Personen und der Umgebung wie auf dem Foto zu sehen. |
Bei allen LLM habe ich immer die maximale Länge und maximale Aufösung gewählt.
Mag sein, dass die Modelle bei anderen Abo-Modellen oder Portalen bessere Werte erreichen können.
Das Ergebnis
Das Ergebins zusammengefasst in einem zusammengeschitteten Video.
Abacus AI: Aktuelle Modellparameter für Videogenerierung (Oktober 2025)
| Modell | Start Frame (Bild) | Audiofile | Prompt (Textanweisung) | Negative Prompt | Schalter/Optionen | Videolänge | Auflösung/Format | Besonderheiten |
|---|---|---|---|---|---|---|---|---|
| Wan 2.5 | Hochladen | Hochladen | Textfeld | Textfeld | "Modify the input prompt", "Enhanced Motion", "Vivid Visuals", "Audio Sync" | Bis 30 Sekunden | 720p, 1080p (je nach Plan) | Native Audio-Integration, verbesserte Bewegung, lebendige Farben, Upload von Startbild und Audio. |
| Sora 2 | Hochladen | Nein | Textfeld | Textfeld | "Cinematic Style", "Realistic Motion", "Multi-Shot", "Video Remix" | Bis 60 Sekunden | 720p, 1080p | Fokus auf realistische Szenen, komplexe Kamerafahrten, keine native Audio-Integration. |
| Seedance Pro | Hochladen | Hochladen | Textfeld | Textfeld | "Character Consistency", "Scene Transition", "Lip Sync", "Fast Render" | Bis 60 Sekunden | 720p | Ideal für Musik- und Tanzvideos, automatische Charakterkonsistenz, Lip-Sync mit Audio. |
| Hailuo 2 | Hochladen | Hochladen | Textfeld | Textfeld | "Action Director", "Smooth Motion", "High Fidelity", "Live2D Mode" | Bis 60 Sekunden | 768p, 512p | Präzise Bewegungssteuerung, hohe Detailtreue, native Audio-Integration, Live2D-Unterstützung. |
| Kling AI v2.5 | Hochladen | Hochladen | Textfeld | Textfeld | "Emotional Depth", "Cinematic Composition", "Motion Precision", "Turbo Mode" | Bis 120 Sekunden | 1080p | Fokus auf emotionale Tiefe, präzise Komposition, native Audio-Unterstützung, Turbo-Modus. |
| Luma Labs | Hochladen | Nein | Textfeld | Textfeld | "Photorealistic", "Fast Render", "Lightweight", "Dream Machine" | Bis 30 Sekunden | 720p, 1080p | Schnelle Rendering-Zeiten, fotorealistische Ergebnisse, keine native Audio-Integration. |
| Runway | Hochladen | Hochladen | Textfeld | Textfeld | "Advanced VFX", "Detailed Text-to-Video", "Customizable Scenes", "Gen-4 Turbo" | Bis 60 Sekunden | 720p, 1080p | Professionelle VFX-Optionen, detaillierte Szenenanpassung, native Audio-Integration. |
