ai-agent-camp/

video-frame-reader

community[skill]

Habilidad para extraer fotogramas clave de archivos de video, deduplicarlos y optimizarlos, y luego analizar su contenido. Se activa con 'Muéstrame el contenido del video', 'Extraer fotogramas clave', 'Analizar este video', etc.

$/plugin install ai-agent-camp

when to use

Muéstrame el contenido del video
Extraer fotogramas clave
Analizar este video
Verificar el video
Ver grabación de pantalla
video-frame-reader
extracción de fotogramas clave

details

Lector de Fotogramas de Video

Extrae fotogramas clave del video, presenta el costo en tokens y luego analiza.

Requisitos

ffmpeg (para extracción de fotogramas)
Python 3 + Pillow + numpy

Flujo de Trabajo

1. Capturar la Intención del Usuario

Comprender claramente por qué el usuario quiere que se analice el video:

Ejemplo: "El comportamiento de transición de pantalla parece incorrecto"
Ejemplo: "Quiero verificar la respuesta después de hacer clic en el botón"
Ejemplo: "Ayúdeme a identificar problemas de rendimiento"

Esta intención se convierte en contexto importante para el análisis.

2. Instalar Dependencias (Solo la Primera Vez)

# uv で依存関係をインストール
uv add Pillow numpy --quiet

3. Extraer Fotogramas Clave

uv run python skills/video-frame-reader/scripts/extract_keyframes.py "<ruta_video>"

Ejemplo de salida (JSON):

{
  "keyframe_count": 52,
  "image_size": "266x576",
  "total_tokens": 10400,
  "cost_usd_opus": 0.156,
  "cost_usd_sonnet": 0.031,
  "cost_usd_haiku": 0.0104,
  "files": ["/.../key_0001.jpg", ...]
}

4. Presentar Costo

Después de la extracción, presente lo siguiente al usuario:

Extracción de fotogramas clave completada:
- Fotogramas extraídos: {keyframe_count}
- Tamaño de imagen: {image_size}
- Tokens estimados: {total_tokens}
- Estimación de costo: Haiku ${cost_usd_haiku} / Sonnet ${cost_usd_sonnet} / Opus ${cost_usd_opus}

¿Proceder con el análisis de fotogramas?

5. Invocar Subagente Después de la Aprobación

Después de la aprobación del usuario, invocar subagente usando la herramienta Task:

Task(
  subagent_type="general-purpose",
  model="haiku",
  description="Análisis de fotogramas",
  prompt="""
[Intención del Usuario]
{Intención capturada en el Paso 1}

[Archivos de Imagen de Fotogramas]
{Lista de rutas del array files}

Analice las imágenes de fotogramas anteriores e identifique problemas/comportamientos según la intención del usuario.
"""
)

Beneficios de este enfoque:

La intención del usuario se incluye en el contexto de análisis
El subagente puede enfocarse en análisis eficiente específico a la intención
Procesado en contexto independiente para mejor eficiencia de tokens

Opciones

Opción	Predeterminado	Descripción
`-t, --threshold`	0.85	Umbral de similitud (mayor = más fotogramas conservados)
`-q, --quality`	30	Calidad JPEG (1-100)
`-s, --scale`	0.3	Escala de redimensionamiento
`-o, --output`	`<nombre_video>_keyframes/`	Directorio de salida

Ejemplo de Reducción de Tokens

# Reducción más agresiva (umbral, calidad y tamaño más bajos)
python3 extract_keyframes.py video.mp4 -t 0.75 -q 20 -s 0.2

Descripción General

Habilidad para extraer automáticamente fotogramas clave de archivos de video, deduplicarlos y optimizarlos, y luego analizar su contenido. Presenta el costo en tokens por adelantado y ejecuta el análisis mediante subagente después de la aprobación del usuario.

Solución de Problemas

Error	Solución
ffmpeg not found	`brew install ffmpeg` (Mac) o `apt install ffmpeg` (Linux) para instalar
No keyframes extracted	Bajar `--threshold` (ej., 0.75) para extraer más fotogramas

Criterios de Éxito

Las imágenes de fotogramas clave están guardadas en el directorio de salida
La estimación de costo en tokens se muestra en formato JSON
Se devuelven resultados alineados con la intención de análisis del usuario

Uso

Consulte la sección "Flujo de Trabajo" anterior. Ejemplos básicos:

# Extraer fotogramas clave
python3 skills/video-frame-reader/scripts/extract_keyframes.py "video.mp4"

# Con opciones de reducción de tokens
python3 skills/video-frame-reader/scripts/extract_keyframes.py "video.mp4" -t 0.75 -q 20 -s 0.2

technical

github: minicoohei/ai-agent-camp
stars: 358
license: unspecified
contributors: 3
last commit: 2026-05-25T08:29:07Z
file: .claude/skills/video-frame-reader/SKILL.es.md