Skill Index

ai-agent-camp/

video-frame-reader

community[skill]

Habilidad para extraer fotogramas clave de archivos de video, deduplicarlos y optimizarlos, y luego analizar su contenido. Se activa con 'Muéstrame el contenido del video', 'Extraer fotogramas clave', 'Analizar este video', etc.

$/plugin install ai-agent-camp

when to use

details

Lector de Fotogramas de Video

Extrae fotogramas clave del video, presenta el costo en tokens y luego analiza.

Requisitos

  • ffmpeg (para extracción de fotogramas)
  • Python 3 + Pillow + numpy

Flujo de Trabajo

1. Capturar la Intención del Usuario

Comprender claramente por qué el usuario quiere que se analice el video:

  • Ejemplo: "El comportamiento de transición de pantalla parece incorrecto"
  • Ejemplo: "Quiero verificar la respuesta después de hacer clic en el botón"
  • Ejemplo: "Ayúdeme a identificar problemas de rendimiento"

Esta intención se convierte en contexto importante para el análisis.

2. Instalar Dependencias (Solo la Primera Vez)

# uv で依存関係をインストール
uv add Pillow numpy --quiet

3. Extraer Fotogramas Clave

uv run python skills/video-frame-reader/scripts/extract_keyframes.py "<ruta_video>"

Ejemplo de salida (JSON):

{
  "keyframe_count": 52,
  "image_size": "266x576",
  "total_tokens": 10400,
  "cost_usd_opus": 0.156,
  "cost_usd_sonnet": 0.031,
  "cost_usd_haiku": 0.0104,
  "files": ["/.../key_0001.jpg", ...]
}

4. Presentar Costo

Después de la extracción, presente lo siguiente al usuario:

Extracción de fotogramas clave completada:
- Fotogramas extraídos: {keyframe_count}
- Tamaño de imagen: {image_size}
- Tokens estimados: {total_tokens}
- Estimación de costo: Haiku ${cost_usd_haiku} / Sonnet ${cost_usd_sonnet} / Opus ${cost_usd_opus}

¿Proceder con el análisis de fotogramas?

5. Invocar Subagente Después de la Aprobación

Después de la aprobación del usuario, invocar subagente usando la herramienta Task:

Task(
  subagent_type="general-purpose",
  model="haiku",
  description="Análisis de fotogramas",
  prompt="""
[Intención del Usuario]
{Intención capturada en el Paso 1}

[Archivos de Imagen de Fotogramas]
{Lista de rutas del array files}

Analice las imágenes de fotogramas anteriores e identifique problemas/comportamientos según la intención del usuario.
"""
)

Beneficios de este enfoque:

  • La intención del usuario se incluye en el contexto de análisis
  • El subagente puede enfocarse en análisis eficiente específico a la intención
  • Procesado en contexto independiente para mejor eficiencia de tokens

Opciones

OpciónPredeterminadoDescripción
-t, --threshold0.85Umbral de similitud (mayor = más fotogramas conservados)
-q, --quality30Calidad JPEG (1-100)
-s, --scale0.3Escala de redimensionamiento
-o, --output<nombre_video>_keyframes/Directorio de salida

Ejemplo de Reducción de Tokens

# Reducción más agresiva (umbral, calidad y tamaño más bajos)
python3 extract_keyframes.py video.mp4 -t 0.75 -q 20 -s 0.2

Descripción General

Habilidad para extraer automáticamente fotogramas clave de archivos de video, deduplicarlos y optimizarlos, y luego analizar su contenido. Presenta el costo en tokens por adelantado y ejecuta el análisis mediante subagente después de la aprobación del usuario.

Solución de Problemas

ErrorSolución
ffmpeg not foundbrew install ffmpeg (Mac) o apt install ffmpeg (Linux) para instalar
No keyframes extractedBajar --threshold (ej., 0.75) para extraer más fotogramas

Criterios de Éxito

  • Las imágenes de fotogramas clave están guardadas en el directorio de salida
  • La estimación de costo en tokens se muestra en formato JSON
  • Se devuelven resultados alineados con la intención de análisis del usuario

Uso

Consulte la sección "Flujo de Trabajo" anterior. Ejemplos básicos:

# Extraer fotogramas clave
python3 skills/video-frame-reader/scripts/extract_keyframes.py "video.mp4"

# Con opciones de reducción de tokens
python3 skills/video-frame-reader/scripts/extract_keyframes.py "video.mp4" -t 0.75 -q 20 -s 0.2

technical

github
minicoohei/ai-agent-camp
stars
358
license
unspecified
contributors
3
last commit
2026-05-25T08:29:07Z
file
.claude/skills/video-frame-reader/SKILL.es.md

related