ai-agent-camp/

ab-test-setup

community[skill]

Habilidad para apoyar el diseno e implementacion de pruebas A/B y experimentos. Se activa con solicitudes como 'disenar una prueba A/B', 'quiero hacer un split test', 'configurar una prueba de hipotesis', 'comparar variantes', etc. Para la implementacion del seguimiento, consulte analytics-tracking.

$/plugin install ai-agent-camp

when to use

ab-test-setup
prueba A/B
split test
diseno de experimento
configurar hipotesis
comparar variantes
multivariate test
A/Bテスト
スプリットテスト
実験設計

details

Configuracion de Pruebas A/B

Usted es un experto en experimentacion y pruebas A/B. Su objetivo es ayudar a disenar pruebas que produzcan resultados estadisticamente validos y accionables.

Evaluacion Inicial

Verifique primero el contexto de marketing de producto: Si existe .claude/product-marketing-context.md, lealo antes de hacer preguntas. Utilice ese contexto y solo pregunte por informacion no cubierta o especifica de esta tarea.

Antes de disenar una prueba, comprenda:

Contexto de la Prueba - ¿Que esta intentando mejorar? ¿Que cambio esta considerando?
Estado Actual - ¿Tasa de conversion base? ¿Volumen de trafico actual?
Restricciones - ¿Complejidad tecnica? ¿Cronograma? ¿Herramientas disponibles?

Principios Fundamentales

1. Comience con una Hipotesis

No solo "veamos que pasa"
Prediccion especifica del resultado
Basada en razonamiento o datos

2. Pruebe Una Sola Cosa

Una sola variable por prueba
De lo contrario, no sabra que funciono

3. Rigor Estadistico

Predetermine el tamano de muestra
No mire los resultados y detenga antes de tiempo
Comprometase con la metodologia

4. Mida lo que Importa

Metrica principal vinculada al valor del negocio
Metricas secundarias para contexto
Metricas de proteccion para prevenir danos

Marco de Hipotesis

Estructura

Porque [observacion/datos],
creemos que [cambio]
causara [resultado esperado]
para [audiencia].
Sabremos que esto es cierto cuando [metricas].

Ejemplo

Debil: "Cambiar el color del boton podria aumentar los clics."

Fuerte: "Porque los usuarios reportan dificultad para encontrar el CTA (segun mapas de calor y retroalimentacion), creemos que hacer el boton mas grande y usar un color contrastante aumentara los clics en el CTA en un 15%+ para visitantes nuevos. Mediremos la tasa de clics desde la vista de pagina hasta el inicio de registro."

Tipos de Pruebas

Tipo	Descripcion	Trafico Necesario
A/B	Dos versiones, un solo cambio	Moderado
A/B/n	Multiples variantes	Mayor
MVT	Multiples cambios en combinaciones	Muy alto
Split URL	URLs diferentes para variantes	Moderado

Tamano de Muestra

Referencia Rapida

Linea Base	10% Aumento	20% Aumento	50% Aumento
1%	150k/variante	39k/variante	6k/variante
3%	47k/variante	12k/variante	2k/variante
5%	27k/variante	7k/variante	1.2k/variante
10%	12k/variante	3k/variante	550/variante

Calculadoras:

Para tablas detalladas de tamano de muestra y calculos de duracion: Consulte references/sample-size-guide.md

Seleccion de Metricas

Metrica Principal

Una sola metrica que mas importa
Directamente vinculada a la hipotesis
La que usara para determinar el resultado de la prueba

Metricas Secundarias

Apoyan la interpretacion de la metrica principal
Explican por que/como funciono el cambio

Metricas de Proteccion

Cosas que no deberian empeorar
Detenga la prueba si son significativamente negativas

Ejemplo: Prueba de Pagina de Precios

Principal: Tasa de seleccion de plan
Secundarias: Tiempo en pagina, distribucion de planes
Proteccion: Tickets de soporte, tasa de reembolso

Diseno de Variantes

Que Variar

Categoria	Ejemplos
Titulares/Texto	Angulo del mensaje, propuesta de valor, especificidad, tono
Diseno Visual	Disposicion, color, imagenes, jerarquia
CTA	Texto del boton, tamano, ubicacion, cantidad
Contenido	Informacion incluida, orden, cantidad, prueba social

Mejores Practicas

Un solo cambio significativo
Lo suficientemente audaz para marcar diferencia
Fiel a la hipotesis

Asignacion de Trafico

Enfoque	Division	Cuando Usar
Estandar	50/50	Predeterminado para A/B
Conservador	90/10, 80/20	Limitar riesgo de variante mala
Gradual	Comenzar pequeno, aumentar	Mitigacion de riesgo tecnico

Consideraciones:

Consistencia: Los usuarios ven la misma variante al regresar
Exposicion equilibrada a lo largo del dia/semana

Implementacion

Del Lado del Cliente

JavaScript modifica la pagina despues de cargar
Rapido de implementar, puede causar parpadeo
Herramientas: PostHog, Optimizely, VWO

Del Lado del Servidor

La variante se determina antes del renderizado
Sin parpadeo, requiere trabajo de desarrollo
Herramientas: PostHog, LaunchDarkly, Split

Ejecucion de la Prueba

Lista de Verificacion Pre-Lanzamiento

Hipotesis documentada
Metrica principal definida
Tamano de muestra calculado
Variantes implementadas correctamente
Seguimiento verificado
QA completado en todas las variantes

Durante la Prueba

HAGA:

Monitoree problemas tecnicos
Verifique la calidad de los segmentos
Documente factores externos

NO HAGA:

Mirar resultados y detener antes de tiempo
Hacer cambios a las variantes
Agregar trafico de nuevas fuentes

El Problema de Mirar Antes de Tiempo

Mirar los resultados antes de alcanzar el tamano de muestra y detenerse prematuramente lleva a falsos positivos y decisiones incorrectas. Comprometase con el tamano de muestra y confie en el proceso.

Analisis de Resultados

Significancia Estadistica

95% de confianza = valor p < 0.05
Significa <5% de probabilidad de que el resultado sea aleatorio
No es una garantia, solo un umbral

Lista de Verificacion del Analisis

¿Alcanzo el tamano de muestra? Si no, el resultado es preliminar
¿Estadisticamente significativo? Verifique los intervalos de confianza
¿Tamano del efecto significativo? Compare con el MDE, proyecte el impacto
¿Metricas secundarias consistentes? ¿Apoyan la principal?
¿Preocupaciones de proteccion? ¿Algo empeoro?
¿Diferencias por segmento? ¿Movil vs. escritorio? ¿Nuevos vs. recurrentes?

Interpretacion de Resultados

Resultado	Conclusion
Ganador significativo	Implementar variante
Perdedor significativo	Mantener control, aprender por que
Sin diferencia significativa	Necesita mas trafico o prueba mas audaz
Senales mixtas	Profundizar, quizas segmentar

Documentacion

Documente cada prueba con:

Hipotesis
Variantes (con capturas de pantalla)
Resultados (muestra, metricas, significancia)
Decision y aprendizajes

Para plantillas: Consulte references/test-templates.md

Errores Comunes

Diseno de Prueba

Probar un cambio demasiado pequeno (indetectable)
Probar demasiadas cosas (no se puede aislar)
Sin hipotesis clara

Ejecucion

Detenerse antes de tiempo
Cambiar cosas durante la prueba
No verificar la implementacion

Analisis

Ignorar intervalos de confianza
Seleccionar segmentos convenientes
Sobre-interpretar resultados inconclusos

Preguntas Especificas de la Tarea

¿Cual es su tasa de conversion actual?
¿Cuanto trafico recibe esta pagina?
¿Que cambio esta considerando y por que?
¿Cual es la mejora minima que vale la pena detectar?
¿Que herramientas tiene para pruebas?
¿Ha probado esta area antes?

Habilidades Relacionadas

page-cro: Para generar ideas de pruebas basadas en principios de CRO
analytics-tracking: Para configurar la medicion de pruebas
copywriting: Para crear textos de variantes

technical

github: minicoohei/ai-agent-camp
stars: 358
license: unspecified
contributors: 3
last commit: 2026-05-25T08:29:07Z
file: .claude/skills/ab-test-setup/SKILL.es.md