|

Veo 3.1 Video-Erweiterungs-API meistern: Vollständiger Leitfaden zur Generierung 148 Sekunden langer Videos durch 7-sekündige inkrementelle Verlängerungen

Sie möchten mit KI Videos erstellen, die länger als 8 Sekunden sind, stellen aber fest, dass die Einzelgenerierung zeitlich begrenzt ist? Dies ist ein häufiges Hindernis für KI-Videokünstler. In diesem Artikel analysieren wir die Video-Erweiterungsfunktion (Extend) von Google Veo 3.1 im Detail. Wir zeigen Ihnen die vollständige technische Lösung, um mithilfe der API ein kurzes 8-Sekunden-Video auf bis zu 148 Sekunden zu verlängern.

Kernnutzen: Nach der Lektüre dieses Artikels werden Sie die Veo 3.1 Extend-API beherrschen, den inkrementellen 7-Sekunden-Mechanismus verstehen und in der Lage sein, eigenständig KI-Videos mit einer Länge von bis zu 148 Sekunden zu generieren.

veo-3-1-extend-video-api-guide-de 图示


Veo 3.1 Video-Erweiterungs-API: Kernpunkte

Bevor wir in die technischen Details eintauchen, werfen wir einen Blick auf die wichtigsten Parameter und Einschränkungen der Veo 3.1 Extend-Funktion.

Parameter Wert Beschreibung
Einzeldauer der Erweiterung 7 Sekunden Jeder Extend-Aufruf fügt dem Video fest 7 Sekunden hinzu
Maximale Anzahl der Erweiterungen 20 Mal Ein Originalvideo kann maximal 20 Mal erweitert werden
Maximale Gesamtdauer 148 Sekunden 8 Sek. Original + 20 × 7 Sek. Erweiterung = 148 Sekunden
Eingabeauflösung 720p / 1080p Unterstützt zwei Qualitätsstufen bei der Eingabe
Ausgabeauflösung 720p Die Erweiterungsausgabe ist derzeit auf 720p beschränkt
Unterstützte Seitenverhältnisse 16:9 / 9:16 Sowohl Quer- als auch Hochformat werden unterstützt
Bildfrequenz-Anforderungen 24 fps Das Eingangsvideo muss zwingend 24 Bilder/Sekunde haben
Dateiformat MP4 Sowohl Eingabe als auch Ausgabe erfolgen im MP4-Format

Funktionsweise der Veo 3.1 Video-Erweiterung im Detail

Die Scene-Extension-Funktion von Veo 3.1 nutzt einen ausgeklügelten kontinuierlichen Generierungsmechanismus:

  1. Sampling der letzten Sekunde: Das System extrahiert visuelle Merkmale aus der letzten Sekunde (24 Frames) des Eingangsvideos.
  2. Kontinuitätsmodellierung: Basierend auf diesen Merkmalen wird der Inhalt der folgenden 7 Sekunden vorhergesagt.
  3. Nahtloses Zusammenfügen: Die neu generierten 7 Sekunden werden mit dem Originalvideo zu einer vollständigen Datei kombiniert.
  4. Iterative Akkumulation: Die Ausgabe einer Erweiterung kann als Eingabe für die nächste Erweiterung dienen.

Dieses Design stellt sicher, dass das Video auch nach mehreren Erweiterungen seine visuelle Kontinuität bewahrt, einschließlich:

  • Fließende Übergänge bei Bewegungen von Personen
  • Natürliche Übergänge der Lichtverhältnisse in der Szene
  • Konsistenz der Hintergrundelemente
  • Kontinuität des Audios (falls vorhanden)

🎯 Technischer Tipp: Wenn Sie die Veo 3.1 Video-Erweiterungs-API aufrufen möchten, können Sie über die Plattform APIYI (apiyi.com) auf eine einheitliche Schnittstelle zugreifen, die den einfachen Aufruf der Google-Videoserien-Modelle unterstützt.


Technische Spezifikationen der Veo 3.1 Extend-API

Eingabebeschränkungen

Bevor Sie die Veo 3.1 Extend-API aufrufen, müssen Sie sicherstellen, dass das Eingangsvideo den folgenden Spezifikationen entspricht:

Einschränkung Anforderung Verhalten bei Nichtbeachtung
Quelle Muss ein von Veo generiertes Video sein Rückgabe eines Validierungsfehlers
Format MP4 Fehler wegen nicht unterstütztem Format
Dauer 1–30 Sekunden Fehler bei Überschreitung des Bereichs
Bildfrequenz 24 fps Fehler bei Abweichung der Bildfrequenz
Auflösung 720p oder 1080p Validierung der Auflösung fehlgeschlagen
Seitenverhältnis 16:9 oder 9:16 Fehler wegen nicht unterstütztem Verhältnis

Wichtiger Hinweis: Die Extend-Funktion der Gemini-API unterstützt nur von Veo generierte Videos als Eingabe. Wenn Sie versuchen, Videos aus anderen Quellen zu verwenden (z. B. Smartphone-Aufnahmen oder andere KI-generierte Videos), gibt die API einen Validierungsfehler zurück.

Ausgabespezifikationen

Element Spezifikation
Dateiformat MP4
Dauer der Erweiterung Fest 7 Sekunden
Auflösung 720p (aktuelle Beschränkung)
Bildfrequenz 24 fps
Audio Unterstützt die Fortführung von Hintergrundgeräuschen
Speicherdauer 2 Tage Aufbewahrung auf dem Server

veo-3-1-extend-video-api-guide-de 图示


Veo 3.1 Video Extension API Schnellstart

Vorbereitung der Umgebung

Bevor du beginnst, stelle sicher, dass du:

  1. Ein Google AI Studio oder Vertex AI Konto besitzt
  2. Zugriff auf die Gemini API erhalten hast
  3. Eine Python 3.8+ Umgebung installiert hast
  4. Das google-genai SDK installiert hast
pip install google-genai

Minimales Code-Beispiel

Hier ist der einfachste Code zum Aufrufen der Veo 3.1 Extend-API:

from google import genai
import time

# 初始化客户端
client = genai.Client(
    api_key="YOUR_API_KEY"
    # 也可使用 APIYI apiyi.com 统一接口
)

# 步骤1: 先生成原始视频
print("正在生成原始视频...")
initial_operation = client.models.generate_videos(
    model="veo-3.1-generate-preview",
    prompt="一只金色的猎鹰在蓝天中翱翔,阳光穿透云层",
)

# 等待生成完成
while not initial_operation.done:
    time.sleep(30)
    initial_operation = client.operations.get(initial_operation)

initial_video = initial_operation.result.generated_videos[0]
print(f"原始视频生成完成,时长: 8秒")

# 步骤2: 扩展视频
print("正在扩展视频...")
extend_operation = client.models.generate_videos(
    model="veo-3.1-generate-preview",
    prompt="猎鹰继续在空中盘旋,俯冲捕捉猎物",
    video=initial_video
)

# 等待扩展完成
while not extend_operation.done:
    time.sleep(30)
    extend_operation = client.operations.get(extend_operation)

extended_video = extend_operation.result.generated_videos[0]
print(f"视频扩展完成,总时长: 15秒")

🚀 Schnellstart: Wir empfehlen die Nutzung der APIYI (apiyi.com) Plattform für schnelle Tests der Veo 3.1 API. Die Plattform bietet sofort einsatzbereite Schnittstellen, mit denen die Integration ohne komplexe Konfiguration gelingt.

Vollständigen Code ansehen: Maximale Videolänge von 148 Sekunden realisieren
from google import genai
import time
import os

class Veo31VideoExtender:
    """Veo 3.1 视频扩展器 - 支持最长 148 秒视频生成"""

    def __init__(self, api_key: str):
        self.client = genai.Client(api_key=api_key)
        self.model = "veo-3.1-generate-preview"
        self.max_extensions = 20  # 最大扩展次数
        self.extension_duration = 7  # 每次扩展 7 秒

    def generate_initial_video(self, prompt: str, aspect_ratio: str = "16:9"):
        """生成初始视频"""
        print(f"[1/2] 生成初始视频...")
        print(f"    提示词: {prompt[:50]}...")

        operation = self.client.models.generate_videos(
            model=self.model,
            prompt=prompt,
            config={
                "aspect_ratio": aspect_ratio,
                "number_of_videos": 1
            }
        )

        video = self._wait_for_completion(operation)
        print(f"    初始视频生成完成 (8秒)")
        return video

    def extend_video(self, video, prompt: str, target_duration: int = 148):
        """
        扩展视频到目标时长

        Args:
            video: 输入视频对象
            prompt: 扩展提示词
            target_duration: 目标时长(秒),最大 148 秒

        Returns:
            扩展后的视频对象
        """
        # 计算需要的扩展次数
        initial_duration = 8
        needed_duration = target_duration - initial_duration
        extensions_needed = min(
            (needed_duration + self.extension_duration - 1) // self.extension_duration,
            self.max_extensions
        )

        print(f"[2/2] 开始视频扩展...")
        print(f"    目标时长: {target_duration}秒")
        print(f"    需要扩展: {extensions_needed}次")

        current_video = video
        current_duration = initial_duration

        for i in range(extensions_needed):
            print(f"    扩展进度: {i+1}/{extensions_needed}")

            operation = self.client.models.generate_videos(
                model=self.model,
                prompt=prompt,
                video=current_video
            )

            current_video = self._wait_for_completion(operation)
            current_duration += self.extension_duration

            print(f"    当前时长: {current_duration}秒")

        final_duration = min(current_duration, 148)
        print(f"视频扩展完成! 最终时长: {final_duration}秒")
        return current_video

    def _wait_for_completion(self, operation, check_interval: int = 30):
        """等待操作完成"""
        while not operation.done:
            time.sleep(check_interval)
            operation = self.client.operations.get(operation)

        if operation.result.generated_videos:
            return operation.result.generated_videos[0]
        raise Exception("视频生成失败")

    def download_video(self, video, output_path: str):
        """下载视频到本地"""
        print(f"下载视频到: {output_path}")

        # 获取视频内容
        video_data = self.client.files.download(video.video)

        with open(output_path, 'wb') as f:
            f.write(video_data)

        print(f"下载完成! 文件大小: {os.path.getsize(output_path) / 1024 / 1024:.2f} MB")


# 使用示例
if __name__ == "__main__":
    # 初始化扩展器
    extender = Veo31VideoExtender(api_key="YOUR_API_KEY")

    # 生成初始视频
    initial_video = extender.generate_initial_video(
        prompt="夕阳下的海边,金色的阳光洒在波光粼粼的海面上,一艘帆船缓缓驶向远方",
        aspect_ratio="16:9"
    )

    # 扩展到 60 秒
    extended_video = extender.extend_video(
        video=initial_video,
        prompt="帆船继续前行,天空逐渐变成橙红色,海鸥在船边盘旋",
        target_duration=60
    )

    # 下载视频
    extender.download_video(extended_video, "extended_video_60s.mp4")

Fortgeschrittene Techniken für die Veo 3.1 Video Extension API

Strategien für Eingabeaufforderungen: Kontinuität sicherstellen

Beim Erweitern von Videos hat die Formulierung der Eingabeaufforderung direkten Einfluss auf das Ergebnis. Hier sind einige Best Practices:

Strategie Beschreibung Beispiel
Aktionsfortsetzung Beschreibt die nächste Phase einer Bewegung "Der Falke taucht weiter ab und nähert sich dem Boden"
Szenenentwicklung Beschreibt natürliche Veränderungen der Szenerie "Der Himmel wird allmählich dunkler und die Sterne erscheinen"
Motiv beibehalten Hält das Hauptobjekt des Videos unverändert "Derselbe Falke kreist über dem Wald"
Sprünge vermeiden Keine plötzlichen Szenenwechsel vornehmen ❌ "Wechsel zu einer Innenszene"

Hinweise zur Audioverarbeitung

Veo 3.1 unterstützt die native Audiogenerierung, hat jedoch bei der Nutzung der Extend-Funktion einige Einschränkungen:

  1. Hintergrundgeräusche: Umgebungsgeräusche und Hintergrundmusik lassen sich gut fortsetzen.
  2. Dialoge/Stimmen: Wenn in der letzten Sekunde des Videos keine menschliche Stimme zu hören ist, wird auch die Erweiterung keine enthalten.
  3. Audiokohärenz: Das System versucht, den Audiostil konsistent zu halten.

💡 Tipp: Wenn das Video durchgehende Dialoge benötigt, stelle sicher, dass die letzte Sekunde des Originalvideos Sprachaudio enthält. Andernfalls bleibt im erweiterten Teil nur die Hintergrundkulisse erhalten.

Batch-Erweiterung und Kostenoptimierung

Wenn eine große Anzahl an langen Videos generiert werden soll, können folgende Optimierungsstrategien hilfreich sein:

veo-3-1-extend-video-api-guide-de 图示

# 批量扩展优化示例
def batch_extend_videos(video_list, prompts, target_duration=60):
    """
    批量扩展视频
    通过 APIYI apiyi.com 平台可以获得更优惠的批量调用价格
    """
    results = []

    for i, (video, prompt) in enumerate(zip(video_list, prompts)):
        print(f"处理视频 {i+1}/{len(video_list)}")

        extended = extender.extend_video(
            video=video,
            prompt=prompt,
            target_duration=target_duration
        )
        results.append(extended)

        # 避免触发速率限制
        time.sleep(5)

    return results

Veo 3.1 Video-Erweiterung im Vergleich zu anderen Lösungen

Es gibt verschiedene KI-Video-Lösungen auf dem Markt. Hier ist ein Vergleich der Erweiterungsfunktionen (Extend) von Veo 3.1 mit anderen gängigen Modellen:

Vergleichsaspekt Veo 3.1 Extend Sora Kling Runway Gen-3
Maximale Dauer 148 Sekunden 60 Sekunden 120 Sekunden 40 Sekunden
Erweiterungsmechanismus 7-Sekunden-Schritte Keine Erweiterung 5-Sekunden-Schritte Keine Erweiterung
Maximale Auflösung 4K (Generierung) / 720p (Erweiterung) 1080p 1080p 1080p
Natives Audio Unterstützt Unterstützt Teilweise unterstützt Nicht unterstützt
Hochformat-Support 9:16 9:16 9:16 9:16
API-Verfügbarkeit Gemini API Eingeschränkt Offen Offen
Verfügbare Plattformen APIYI (apiyi.com), Google AI Studio Offiziell Offiziell, APIYI Offiziell

Empfehlungen zur Auswahl

  • Für maximale Dauer: Wählen Sie Veo 3.1, das bis zu 148 Sekunden unterstützt.
  • Für stabile Bildqualität: Wählen Sie Veo 3.1, da es die beste Kontinuität bietet.
  • Bei begrenztem Budget: Über APIYI (apiyi.com) können Sie bessere Preise erhalten.
  • Für schnelle Ergebnisse: Die Version Veo 3.1 Fast bietet schnellere Antwortzeiten.

Häufig gestellte Fragen zur Veo 3.1 Video-Erweiterung

F1: Warum lässt sich mein Video nicht erweitern und zeigt einen „Validation Error“?

Dies liegt in der Regel daran, dass das Eingangsvideo nicht mit Veo erstellt wurde. Die Extend-Funktion der Gemini API unterstützt derzeit nur Videos als Eingabe, die ursprünglich mit Veo generiert wurden.

Lösung:

  1. Stellen Sie sicher, dass das Originalvideo mit Veo 3.1 erstellt wurde.
  2. Überprüfen Sie, ob das Videoformat MP4 ist.
  3. Bestätigen Sie, dass die Bildrate 24 fps und die Auflösung 720p oder 1080p beträgt.
  4. Über die Plattform APIYI (apiyi.com) erhalten Sie detaillierte Hilfe zur Fehlerdiagnose.
F2: Wie sorge ich dafür, dass der Stil des erweiterten Videos konsistent bleibt?

Der Schlüssel zur Wahrung der Stilkontinuität liegt in der Strategie für die Eingabeaufforderung:

  1. Original-Eingabeaufforderung fortsetzen: Verwenden Sie in der Erweiterungs-Eingabeaufforderung Beschreibungen, die dem Originalvideo ähneln.
  2. Stilsprünge vermeiden: Fügen Sie während der Erweiterung keine neuen Beschreibungen für visuelle Stile hinzu.
  3. Subjekt-Kontinuität: Geben Sie explizit an, dass „dasselbe“ Subjekt die Handlung fortsetzt.
  4. Sanfte Szenenübergänge: Szenenwechsel sollten schrittweise erfolgen und keine abrupten Schnitte enthalten.

Beispiel:

  • Original: „Eine weiße Katze spielt auf einer Wiese.“
  • Erweiterung: „Dieselbe weiße Katze rennt weiter über die Wiese und jagt einem Schmetterling hinterher.“ ✅
  • Erweiterung: „Ein schwarzer Hund erscheint im Bild.“ ❌
F3: Sinkt die Videoqualität nach 20 Erweiterungen?

Theoretisch kann es nach vielen Erweiterungen zu einer gewissen Qualitätsabweichung kommen. Veo 3.1 wurde jedoch speziell optimiert, um dieses Problem zu minimieren:

  • Jede Erweiterung greift auf die ursprünglichen Stilmerkmale zurück.
  • Die Kontinuitätsmodellierung sorgt für flüssige Bewegungen.
  • Die Auflösung bleibt stabil bei 720p.

Empfehlung: Wenn Sie extrem hohe Qualitätsansprüche haben, sollten Sie das Ergebnis nach 10 bis 15 Erweiterungen neu bewerten. Über APIYI (apiyi.com) lassen sich bequem mehrere Testvergleiche durchführen.

F4: Wie lange werden die erweiterten Videos gespeichert?

Generierte Videos werden auf den Google-Servern für 2 Tage aufbewahrt. Nach Ablauf dieser 2 Tage werden die Videos automatisch gelöscht.

Wichtiger Hinweis:

  • Auch erweiterte Videos gelten als neu generiert und werden ebenfalls nur 2 Tage gespeichert.
  • Es wird empfohlen, die Videos sofort nach der Generierung lokal herunterzuladen.
  • Mit der Methode download_video im Code lässt sich der Download automatisieren.
F5: Wie erhalte ich Zugriff auf die Veo 3.1 API?

Derzeit befindet sich die Veo 3.1 API in der „Paid Preview“-Phase. Es gibt folgende Wege für den Zugriff:

  1. Google AI Studio: Entwickler können sich direkt bewerben.
  2. Vertex AI: Unternehmenskunden können den Dienst über die Google Cloud Console aktivieren.
  3. APIYI (apiyi.com): Bietet eine einheitliche API-Schnittstelle, unterstützt Veo 3.1-Aufrufe und ist sofort nach der Registrierung einsatzbereit.

Veo 3.1 Video Extension API: Fehlerbehandlung

In der Praxis können verschiedene Fehler auftreten. Hier sind die häufigsten Fehler und ihre Lösungen:

Fehlertyp Fehlermeldung Ursache Lösung
Validierungsfehler Video validation failed Das Eingabevideo entspricht nicht den Spezifikationen Quelle, Format und Auflösung prüfen
Timeout-Fehler Operation timed out Die Generierung dauert zu lange Wartezeit erhöhen, erneut versuchen
Kontingentfehler Quota exceeded API-Aufruflimit überschritten Auf Zurücksetzung des Kontingents warten oder Tarif upgraden
Formatfehler Unsupported format Videoformat wird nicht unterstützt In das MP4-Format konvertieren
Framerate-Fehler Invalid frame rate Framerate ist nicht 24 fps Video neu kodieren
# 错误处理示例
def safe_extend_video(video, prompt, max_retries=3):
    """带重试机制的视频扩展"""
    for attempt in range(max_retries):
        try:
            operation = client.models.generate_videos(
                model="veo-3.1-generate-preview",
                prompt=prompt,
                video=video
            )

            while not operation.done:
                time.sleep(30)
                operation = client.operations.get(operation)

            return operation.result.generated_videos[0]

        except Exception as e:
            print(f"尝试 {attempt + 1} 失败: {e}")
            if attempt < max_retries - 1:
                time.sleep(60)  # 等待后重试
            else:
                raise

Veo 3.1 Video Extension API: Anwendungsbereiche

Erstellung von Kurzvideos

Erweitern Sie 8-Sekunden-Clips auf vollständige Kurzvideos von über 60 Sekunden, ideal für:

  • Douyin/TikTok Content-Erstellung
  • Produktion von YouTube Shorts
  • Werbematerialien für soziale Medien

Film- und Videopreview

Schnelle Generierung von 1-2 minütigen Konzeptvideos für:

  • Drehbuch-Visualisierung
  • Dynamisierung von Storyboards
  • Präsentation von kreativen Konzepten

Produktpräsentation

Erstellung dynamischer Produktvideos:

  • 360°-Produktrotation
  • Simulation von Anwendungsszenarien
  • Animationen zur Funktionsdemonstration

veo-3-1-extend-video-api-guide-de 图示


Zusammenfassung

Die „extend“-Funktion von Google Veo 3.1 zur Videoerweiterung bietet bahnbrechende Möglichkeiten für die Verlängerung von KI-generierten Videos:

  1. 7-Sekunden-Inkrement-Mechanismus: Jede Erweiterung fügt fest 7 Sekunden hinzu. Dabei basiert das Sampling auf der letzten Sekunde des vorherigen Segments, um die Kontinuität zu gewährleisten.
  2. Obergrenze von 20 Iterationen: Es können insgesamt maximal 20 Erweiterungsvorgänge durchgeführt werden.
  3. Maximale Ausgabelänge von 148 Sekunden: 8 Sekunden Originalvideo + 140 Sekunden Erweiterung = 148 Sekunden Gesamtlänge.
  4. Strenge Eingabebeschränkungen: Es werden ausschließlich von Veo generierte MP4-Videos mit 24 fps in den Auflösungen 720p oder 1080p unterstützt.

Für Entwickler und Creator, die längere Videos produzieren möchten, wird die Beherrschung der Veo 3.1 Extend-API die Effizienz der Content-Produktion erheblich steigern. Wir empfehlen APIYI (apiyi.com), um die Ergebnisse schnell zu validieren und einen stabilen API-Service zu erhalten.


Dieser Artikel wurde vom APIYI Team verfasst. Weitere Tutorials zur Nutzung von KI-APIs finden Sie auf apiyi.com

Ähnliche Beiträge