Piramide de Evidencia

Volver Protcolo Élite

Evidencia Científica en Longevidad — Muana Lab

MUANA LAB

Longevidad • Ciencia • Optimización

Jerarquía de Evidencia Científica
Protocolo Élite de Longevidad

Pirámide de evidencia

Evidencia → Decisión

Guía para el lector

Tabla GRADE

Sesgos frecuentes

Modelo dinámico, no estático. Un estudio observacional con dos millones de participantes y gradiente dosis-respuesta puede alcanzar mayor certeza que un ensayo pequeño con sesgos graves. Los modificadores ajustan la certeza hacia arriba o abajo sobre la certeza inicial del diseño. Kirmayr M et al. Medwave 2021;21(02):e8109

↑ Sube si (solo observacionales):

Gran magnitud del efecto

Gradiente dosis-respuesta

Confusión residual actúa en contra

↓ Baja si:

Riesgo de sesgo

Inconsistencia (I²)

Evidencia indirecta

Imprecisión (IC amplio)

Sesgo de publicación

5 factores que bajan la certeza (−1 o −2)

Riesgo de sesgo — fallas en diseño o conducta (RoB2, ROBINS-I)

Inconsistencia — heterogeneidad no explicada (I²>75%)

Evidencia indirecta — diferencias en población, intervención o desenlace

Imprecisión — intervalos de confianza amplios, N insuficiente

Sesgo de publicación — estudios negativos no publicados

3 factores que suben la certeza (+1 o +2)

Gran magnitud del efecto — OR/RR muy alejados de la línea nula

Gradiente dosis-respuesta — más dosis → más efecto documentado

Confusión residual actúa en contra — el efecto persiste contra los confusores

Solo aplicables a estudios observacionales sin las limitaciones anteriores.

Meta-análisis

Certeza máxima • GRADE A+

▼

✓ Fortalezas

Máximo poder estadístico combinando estudios

Detecta heterogeneidad y sesgo de publicación

Reduce el error aleatorio individual

⚠ Sesgos posibles

Sesgo de publicación si hay estudios negativos sin publicar

Heterogeneidad elevada (I²>75%)

Calidad variable de estudios incluidos

Lenguaje controlado GRADE A

"Reduce la mortalidad" • "Aumenta la probabilidad de supervivencia" (sin calificativo de probabilidad)

En el Protocolo Élite

Ejercicio N=2.000.000 con dosis-respuesta → GRADE A

Dieta mediterránea N=1.676.901 → GRADE A

Capital social — 23 meta-análisis +50% supervivencia → GRADE A

Vitamina D3 — 80 ECAs combinados → GRADE A

Revisión sistemática

Certeza muy alta • GRADE A

▼

✓ Fortalezas

Búsqueda exhaustiva y reproducible (PRISMA)

Evaluación crítica con herramientas validadas

Transparencia metodológica total

⚠ Sesgos posibles

Sesgo de lenguaje (solo publicaciones en inglés)

Inconsistencia entre revisores

Actualización lenta frente a nueva evidencia

Lenguaje controlado GRADE A

"Reduce" • "Aumenta" • "Se asocia con menor riesgo de" (afirmativo, sin calificativo)

En el Protocolo Élite

Proteína y músculo en adultos mayores (Nutrients, 2025) → GRADE B por ausencia de ECA de mortalidad directa

Ejercicio y cognición >50 años (BJSM, 2018) → GRADE B

Ensayo clínico aleatorizado (ECA)

Certeza alta base • GRADE B

▼

✓ Fortalezas

Asignación aleatoria → elimina confusión sistemática

Cegamiento → reduce sesgo de información

Permite establecer causalidad, no solo asociación

⚠ Sesgos posibles

Atrito diferencial en el seguimiento

Duración corta vs. efectos crónicos a largo plazo

Validez externa limitada (pacientes seleccionados)

Lenguaje controlado GRADE B

"Probablemente reduce" • "Probablemente mejora" • "Es probable que disminuya el riesgo de"

En el Protocolo Élite

Meta-análisis de 80 ECAs vitamina D3 → alcanza GRADE A por combinación de muchos ECAs

ECA NMN N<50, duración corta → GRADE C por imprecisión

Cohortes y caso-control

Certeza baja base • GRADE C • ajustable ↑↓

▼

✓ Fortalezas

Viables cuando el ECA es ético o prácticamente imposible

Cohortes grandes → alto poder estadístico

Alta validez externa (población real)

Mendelian Randomization aproxima la causalidad

⚠ Sesgos posibles

Confusión residual (variables no medidas)

Causalidad inversa

Sesgo del trabajador sano

Sesgo de selección

Lenguaje controlado GRADE C

"Puede reducir" • "Puede mejorar" • "Se observó asociación con menor riesgo de" (incertidumbre explícita)

Cohortes con modificadores → GRADE A

Ejercicio N=2M: dosis-respuesta +1 + magnitud HR 0.53 +1 → GRADE A

Fibra N=134.778: magnitud HR 0.61 +1 → GRADE A

Capital social +50% supervivencia: magnitud +1 → GRADE A

Animales • Series de casos • Expertos

Certeza muy baja • GRADE D

▼

✓ Utilidad

Generan hipótesis para estudios de mayor nivel

Exploran mecanismos biológicos en detalle

Identifican señales de seguridad tempranas

⚠ Limitaciones

Sin grupo control comparable en humanos

Baja transferibilidad animal → humano

Sesgo de confirmación en opinión de expertos

Lenguaje controlado GRADE D

"Efecto incierto en humanos" • "No permite establecer conclusiones" • "Solo en contexto experimental"

En el Protocolo Élite

Ayuno +35% vida en ratones → GRADE D longevidad humana, GRADE B beneficio metabólico

Senolíticos fase 1-2 N<50 → GRADE D • No recomendado fuera de ensayos

La certeza de la evidencia no determina sola la recomendación. Los marcos EtD integran cuatro criterios. Un GRADE C con daños mínimos puede justificar una recomendación condicional a favor. Un GRADE D con riesgo real de daño genera recomendación en contra.

Quilodrán C et al. Medwave 2021;21(04):e8182

Balance beneficios / daños

Evaluación simultánea de todos los desenlaces. Si los beneficios superan claramente los daños → dirección a favor.

Ej: Vitamina D3 con monitorización → balance muy favorable. Senolíticos sin supervisión → dasatinib es inmunosupresor → balance negativo.

Valores y preferencias

La importancia relativa que el cliente asigna a cada desenlace. Alta variabilidad → decisión compartida.

Ej: Ayuno intermitente — aceptabilidad muy variable → condicional. Capital social → fuerte con implementación variable.

Aceptabilidad y factibilidad

¿Es la intervención aceptable y factible en la vida real? Incluso una intervención GRADE A puede requerir adaptación.

Ej: Fuerza 2-3x/semana es GRADE A pero requiere adaptación para perfiles con alta carga laboral.

Uso de recursos y coste

El coste en relación al beneficio esperado. GRADE C de alto coste → recomendación débil.

Ej: NMN — GRADE C + coste alto → débil. Creatina — GRADE B + coste bajo → condicional a favor.

Esquema de recomendaciones — Protocolo Élite

Intervención	GRADE	Balance daños	Recomendación EtD
Ejercicio aeróbico + fuerza	A	Mínimos	Fuerte a favor
Sueño 7h • regularidad ±30 min	A/B	Ninguno	Fuerte a favor
Dieta mediterránea + fibra ≥25g	A	Ninguno	Fuerte a favor
Capital social + propósito	A	Ninguno	Fuerte • decisión compartida
Vitamina D3 (déficit documentado)	A	Hipercalcemia megadosis	Fuerte a favor
Omega-3 EPA/DHA 1-2g/día	A	Mínimos	Fuerte a favor
Magnesio (déficit o riesgo CV)	B	Interacc. medicamentos	Condicional a favor
Creatina monohidrato 3-5g/día	B	Mínimos	Condicional a favor
Proteína 1,2-1,5 g/kg/día	B	ERC: vigilar	Condicional a favor
Ayuno — beneficio metabólico	B	Ninguno	Condicional a favor
NMN / NR 250-500 mg/día	C	Seguridad LP: N/C	Condicional débil
Ayuno — extensión de vida directa	C	Ninguno	Condicional débil
Senolíticos (D+Q, fisetina)	D	Dasatinib: inmunosupresor	No recomendado fuera de ECA

⚠ Certeza GRADE ≠ fuerza de recomendación

NMN es GRADE C → recomendación condicional a favor (daños mínimos, mecanismo sólido) — no "GRADE C = no funciona"

Senolíticos son GRADE D → recomendación en contra activa (dasatinib tiene toxicidad real) — no solo "falta evidencia"

Capital social es GRADE A → recomendación fuerte con implementación variable

Biomarcadores techo GRADE B → limitación estructural (ECA de longevidad éticamente imposible)

¿Qué significa que algo "tiene evidencia científica"?

Cada día aparecen titulares como "nuevo estudio demuestra que X alarga la vida". Pero no toda evidencia pesa igual. Esta guía te enseña a leer el nivel de confianza de cada recomendación del Protocolo Élite, sin necesidad de ser científico.

¿Qué mide GRADE? — La analogía del GPS

Entiende la certeza de evidencia en 30 segundos

▼

Analogía

Imagina que la evidencia científica es la señal de tu GPS. GRADE A = señal perfecta en autopista abierta: muy improbable que te lleve por el camino equivocado. GRADE B = buena señal con algún edificio cerca: te guía bien, pero podría recalcular. GRADE C = señal débil en zona de montaña: puede ser correcto, pero conviene confirmar. GRADE D = sin cobertura: indica una dirección, pero no hay forma de saber si es correcta.

Alta certeza

Muy improbable que nuevos estudios cambien la conclusión

Moderada

Nuevos estudios podrían modificar la conclusión

Baja

Muy probable que nuevos estudios cambien la conclusión

Muy baja

La conclusión actual es muy incierta

El titular de prensa vs. la realidad GRADE

Por qué los titulares siempre parecen más seguros de lo que son

▼

El teléfono descompuesto científico

Un hallazgo pierde certeza cada vez que cambia de manos. Lo que empieza como "asociación observada en ratones" llega a redes sociales como "científicos descubren la cura del envejecimiento".

Estudio
GRADE C/D

→

Paper
Técnico

→

Nota de prensa
Simplificado

→

Titular
"Demuestra que..."

→

Redes
"La cura de X"

❌ Titular típico

"El NMN revierte el envejecimiento celular"

✓ Realidad GRADE C

"El NMN puede elevar NAD+ en músculo. Estudios en humanos son pequeños y cortos."

❌ Titular típico

"Ayuno intermitente alarga la vida un 35%"

✓ Realidad GRADE C/D

El +35% es en ratones. En humanos, mejora marcadores metabólicos (GRADE B) pero extensión de vida no demostrada en ECAs.

❌ Mito frecuente

"GRADE C significa que no funciona"

✓ Lo que significa en realidad

Significa incertidumbre sobre los datos, no sobre el mecanismo. Puede funcionar perfectamente — o no. Simplemente no lo sabemos con suficiente seguridad todavía.

❌ Titular típico

"Las relaciones sociales salvan vidas (nuevo estudio)"

✓ Realidad GRADE A

Esto sí está respaldado: 23 meta-análisis, +50% de supervivencia. Es una de las intervenciones con mayor certeza de todo el protocolo.

GRADE no es la última palabra

Por qué GRADE C no siempre significa "no recomendado"

▼

Analogía: el médico que recomienda caminar aunque no haya ECA de 50 años

No existe un ensayo clínico de 50 años donde la mitad caminó y la otra no. Sin embargo, ningún médico serio dudará en recomendar caminar. ¿Por qué? Porque el balance beneficio/daño es clarísimo, es aceptable, es gratis y todo el mundo puede hacerlo. Eso es lo que hacen los marcos EtD: juntar la certeza científica con el sentido común clínico.

Criterio EtD	Pregunta clave	Cómo afecta la recomendación
Balance daños	¿Los beneficios superan los daños?	Daños graves → recomendación débil o en contra, aunque sea GRADE A
Preferencias	¿Importa igual a todo el mundo?	Alta variabilidad → recomendación condicional con decisión compartida
Factibilidad	¿Es posible en la vida real?	No factible para el perfil → adaptar antes de recomendar
Coste	¿El coste es proporcional al beneficio?	Alto coste + GRADE C → recomendación débil aunque el mecanismo sea sólido

Preguntas que puedes hacerle a tu profesional de salud

Cómo usar GRADE como herramienta de conversación

▼

"¿En qué nivel de evidencia está basada esta recomendación?"

Pide que te explique si es GRADE A, B, C o D y qué tipo de estudio lo respalda. Una buena respuesta incluirá el tipo de diseño del estudio.

"¿Los estudios se hicieron en personas parecidas a mí?"

Si los estudios son en hombres de 30 años y tú tienes 55 con hipertensión, la evidencia es indirecta — lo que en GRADE reduce la certeza en un nivel.

"¿Qué pasa si no lo hago? ¿Qué riesgo concreto asumo?"

La recomendación debería venir con datos absolutos, no solo relativos. "Reduce el riesgo un 47%" es difícil de evaluar sin saber el riesgo de partida.

"¿Cuánto tiempo debo esperar para ver resultados? ¿Y cómo lo medimos?"

Toda intervención del protocolo tiene biomarcadores asociados. Sin seguimiento, no sabes si la intervención funciona para ti.

"¿Ha cambiado algo en la evidencia en los últimos 2-3 años?"

Áreas como senolíticos, NMN o relojes epigenéticos evolucionan rápidamente. Una buena respuesta reconocerá qué sigue siendo incierto.

Lo más contraintuitivo del Protocolo Élite

Las sorpresas que la evidencia reserva

▼

El dato más sorprendente

Las relaciones sociales tienen mayor evidencia que la mayoría de los suplementos del mercado. GRADE A con +50% de supervivencia. Sin embargo, nadie las vende en una cápsula.

La limitación más honesta

Los biomarcadores son GRADE B no porque la ciencia sea débil, sino porque el ECA definitivo es éticamente imposible — nadie puede aleatorizar tu edad biológica.

Lo más costoso con menos certeza

El NMN cuesta 60-150€/mes y tiene GRADE C. La creatina cuesta 10-15€/mes y tiene GRADE B para función cognitiva y muscular.

Lo más infrautilizado

El Paso 5 (suplementos) atrae toda la atención. Pero los pasos 1 (ejercicio), 4 (nutrición) y 7 (capital social) tienen GRADE A más limpio y consistente.

Lenguaje controlado GRADE (Kirmayr et al., 2021) aplicado a todas las intervenciones del Protocolo Élite.

Paso	Intervención	GRADE	Factor modificador clave	Expresión controlada
01	Ejercicio aeróbico + fuerza	A	Dosis-respuesta +1 • Magnitud HR 0.53 +1	Reduce la mortalidad
02a	Sueño 7h	A	57 estudios • N>500k • Consistente	Reduce mortalidad prematura
02b	Regularidad del sueño	B	Un cohorte N=88.975 • replicación pendiente	Probablemente reduce mortalidad
02c	Alineación circadiana alimentaria	C	Solo modelo animal • indirección −1	Puede extender la vida
03a	Resiliencia + propósito	A	Meta-análisis replicados • N=136.265	Reduce mortalidad 17-53%
03b	Mindfulness ≥8 semanas	B	Meta-análisis ECAs • PA medible	Probablemente reduce riesgo CV
04a	Dieta mediterránea	A	N=1.676.901 • dosis-respuesta +1	Reduce mortalidad
04b	Fibra ≥25g/día	A	N=134.778 • magnitud HR 0.61 +1	Reduce mortalidad cardiovascular
04c	Proteína 1,2-1,5 g/kg/día	B	Sin ECA mortalidad • indirección −1	Probablemente preserva masa muscular
04d	Ayuno — metabólico	B	ECAs glucemia • indirección parcial	Probablemente mejora marcadores metabólicos
04e	Ayuno — extensión de vida	C	Solo animal • indirección −1	Puede extender la vida (modelos animales)
05a	Vitamina D3	A	80 ECAs meta-análisis	Reduce mortalidad (>3 años)
05b	Omega-3 EPA/DHA	A	17 cohortes N=42.466 • magnitud +1	Reduce mortalidad 15-18%
05c	Magnesio	B	Un cohorte • 3,5 años	Probablemente reduce eventos CV
05d	Creatina monohidrato	B	Meta-análisis cognitivo	Probablemente mejora función cognitiva
05e	NMN / NR	C	N<100 • sin mortalidad humana	Puede elevar NAD+ muscular
05f	Senolíticos (D+Q, fisetina)	D	Fase 1-2 • dasatinib inmunosupresor	Efecto incierto • daño real conocido
06	Panel de biomarcadores	B*	*Techo estructural: ECA éticamente imposible	Probablemente predicen mortalidad
07	Capital social + propósito	A	23 meta-análisis • magnitud +50% +1	Aumenta probabilidad de supervivencia

Los sesgos más frecuentes en investigación de longevidad y cómo identificarlos al evaluar la evidencia.

Reduce certeza −1 o −2

Sesgo de publicación

Los estudios positivos se publican más que los negativos, inflando el efecto aparente. Detectable con funnel plot asimétrico en meta-análisis.

Reduce certeza −1 o −2

Confusión residual

Variables no medidas (educación, nivel socioeconómico, estilo de vida global) pueden explicar la asociación. Clave en estudios de longevidad.

Reduce certeza −1

Causalidad inversa

Personas ya enfermas cambian sus hábitos, haciendo que ese hábito parezca protector. Crítico en estudios de dieta y longevidad.

Reduce certeza −1

Sesgo del trabajador sano

Poblaciones activas laboralmente están más sanas que la general. Sobreestima el beneficio en cohortes ocupacionales.

Reduce certeza −1

Sesgo de atrito

Los participantes que abandonan el estudio son diferentes a los que permanecen. Relevante en ECAs de larga duración.

Reduce certeza −1 o −2

Heterogeneidad (I²)

En meta-análisis, cuánto varían los resultados entre estudios. I²>75% = inconsistencia considerable que reduce la certeza.

Reduce certeza −1

Evidencia indirecta

Datos de animales no se transfieren directamente a humanos. La cadena intervención → biomarcador → mortalidad acumula incertidumbre en cada paso.

Reduce certeza −1

Sesgo de recuerdo

En caso-control, los casos recuerdan mejor sus exposiciones. Sobreestima el riesgo de la exposición.

Limitación estructural

ECA éticamente imposible

Para biomarcadores de longevidad, el ECA definitivo es imposible: no se puede aleatorizar la edad biológica ni seguir a personas 40 años. El techo es GRADE B por diseño, no por falta de rigor.

Aumenta certeza +1

Gran magnitud del efecto

OR/RR muy alejados de la línea nula hacen improbable que el confusor explique todo el efecto. Ej: capital social +50% supervivencia; ejercicio HR 0.53.

Aumenta certeza +1

Gradiente dosis-respuesta

Mayor exposición → mayor efecto. Fortalece la inferencia causal en observacionales. Presente en ejercicio y dieta mediterránea del protocolo.

Aumenta certeza +1

Confusión residual actúa en contra

Si los confusores conocidos actuarían en contra del efecto y aun así el efecto es visible, aumenta la confianza en que es real.

Referencias metodológicas

[A] Kirmayr M et al. Metodología GRADE, parte 1: cómo evaluar la certeza de la evidencia. Medwave 2021;21(02):e8109. doi:10.5867/medwave.2021.02.8109 • medwave.cl/…/8109.html

[B] Quilodrán C et al. Metodología GRADE, parte 2: de la evidencia a la decisión. Medwave 2021;21(04):e8182. doi:10.5867/medwave.2021.04.8182 • medwave.cl/…/8182.html

Volver Protcolo Élite