Evidencia Científica en Longevidad — Muana Lab
MUANA LAB
Longevidad • Ciencia • Optimización
Jerarquía de Evidencia Científica
Protocolo Élite de Longevidad
Pirámide de evidencia
Evidencia → Decisión
Guía para el lector
Tabla GRADE
Sesgos frecuentes
Modelo dinámico, no estático. Un estudio observacional con dos millones de participantes y gradiente dosis-respuesta puede alcanzar mayor certeza que un ensayo pequeño con sesgos graves. Los modificadores ajustan la certeza hacia arriba o abajo sobre la certeza inicial del diseño. Kirmayr M et al. Medwave 2021;21(02):e8109
Mayor certeza Mayor sesgo potencial Meta-análisis GRADE A+ Revisiones sistemáticas Certeza muy alta • GRADE A Ensayos clínicos aleatorizados Certeza alta base • GRADE B Cohortes / caso-control Certeza baja base • GRADE C Ajustable ↑ con modificadores Animales • Series de casos • Expertos Certeza muy baja • GRADE D
↑ Sube si (solo observacionales):
Gran magnitud del efecto
Gradiente dosis-respuesta
Confusión residual actúa en contra
↓ Baja si:
Riesgo de sesgo
Inconsistencia (I²)
Evidencia indirecta
Imprecisión (IC amplio)
Sesgo de publicación

5 factores que bajan la certeza (−1 o −2)

Riesgo de sesgo — fallas en diseño o conducta (RoB2, ROBINS-I)
Inconsistencia — heterogeneidad no explicada (I²>75%)
Evidencia indirecta — diferencias en población, intervención o desenlace
Imprecisión — intervalos de confianza amplios, N insuficiente
Sesgo de publicación — estudios negativos no publicados

3 factores que suben la certeza (+1 o +2)

Gran magnitud del efecto — OR/RR muy alejados de la línea nula
Gradiente dosis-respuesta — más dosis → más efecto documentado
Confusión residual actúa en contra — el efecto persiste contra los confusores

Solo aplicables a estudios observacionales sin las limitaciones anteriores.

1
Meta-análisis
Certeza máxima • GRADE A+
✓ Fortalezas
Máximo poder estadístico combinando estudios
Detecta heterogeneidad y sesgo de publicación
Reduce el error aleatorio individual
⚠ Sesgos posibles
Sesgo de publicación si hay estudios negativos sin publicar
Heterogeneidad elevada (I²>75%)
Calidad variable de estudios incluidos
Lenguaje controlado GRADE A

"Reduce la mortalidad" • "Aumenta la probabilidad de supervivencia" (sin calificativo de probabilidad)

En el Protocolo Élite
Ejercicio N=2.000.000 con dosis-respuesta → GRADE A
Dieta mediterránea N=1.676.901 → GRADE A
Capital social — 23 meta-análisis +50% supervivencia → GRADE A
Vitamina D3 — 80 ECAs combinados → GRADE A
2
Revisión sistemática
Certeza muy alta • GRADE A
✓ Fortalezas
Búsqueda exhaustiva y reproducible (PRISMA)
Evaluación crítica con herramientas validadas
Transparencia metodológica total
⚠ Sesgos posibles
Sesgo de lenguaje (solo publicaciones en inglés)
Inconsistencia entre revisores
Actualización lenta frente a nueva evidencia
Lenguaje controlado GRADE A

"Reduce" • "Aumenta" • "Se asocia con menor riesgo de" (afirmativo, sin calificativo)

En el Protocolo Élite
Proteína y músculo en adultos mayores (Nutrients, 2025) → GRADE B por ausencia de ECA de mortalidad directa
Ejercicio y cognición >50 años (BJSM, 2018) → GRADE B
3
Ensayo clínico aleatorizado (ECA)
Certeza alta base • GRADE B
✓ Fortalezas
Asignación aleatoria → elimina confusión sistemática
Cegamiento → reduce sesgo de información
Permite establecer causalidad, no solo asociación
⚠ Sesgos posibles
Atrito diferencial en el seguimiento
Duración corta vs. efectos crónicos a largo plazo
Validez externa limitada (pacientes seleccionados)
Lenguaje controlado GRADE B

"Probablemente reduce" • "Probablemente mejora" • "Es probable que disminuya el riesgo de"

En el Protocolo Élite
Meta-análisis de 80 ECAs vitamina D3 → alcanza GRADE A por combinación de muchos ECAs
ECA NMN N<50, duración corta → GRADE C por imprecisión
4
Cohortes y caso-control
Certeza baja base • GRADE C • ajustable ↑↓
✓ Fortalezas
Viables cuando el ECA es ético o prácticamente imposible
Cohortes grandes → alto poder estadístico
Alta validez externa (población real)
Mendelian Randomization aproxima la causalidad
⚠ Sesgos posibles
Confusión residual (variables no medidas)
Causalidad inversa
Sesgo del trabajador sano
Sesgo de selección
Lenguaje controlado GRADE C

"Puede reducir" • "Puede mejorar" • "Se observó asociación con menor riesgo de" (incertidumbre explícita)

Cohortes con modificadores → GRADE A
Ejercicio N=2M: dosis-respuesta +1 + magnitud HR 0.53 +1 → GRADE A
Fibra N=134.778: magnitud HR 0.61 +1 → GRADE A
Capital social +50% supervivencia: magnitud +1 → GRADE A
5
Animales • Series de casos • Expertos
Certeza muy baja • GRADE D
✓ Utilidad
Generan hipótesis para estudios de mayor nivel
Exploran mecanismos biológicos en detalle
Identifican señales de seguridad tempranas
⚠ Limitaciones
Sin grupo control comparable en humanos
Baja transferibilidad animal → humano
Sesgo de confirmación en opinión de expertos
Lenguaje controlado GRADE D

"Efecto incierto en humanos" • "No permite establecer conclusiones" • "Solo en contexto experimental"

En el Protocolo Élite
Ayuno +35% vida en ratones → GRADE D longevidad humana, GRADE B beneficio metabólico
Senolíticos fase 1-2 N<50 → GRADE D • No recomendado fuera de ensayos

La certeza de la evidencia no determina sola la recomendación. Los marcos EtD integran cuatro criterios. Un GRADE C con daños mínimos puede justificar una recomendación condicional a favor. Un GRADE D con riesgo real de daño genera recomendación en contra.

Quilodrán C et al. Medwave 2021;21(04):e8182
A

Balance beneficios / daños

Evaluación simultánea de todos los desenlaces. Si los beneficios superan claramente los daños → dirección a favor.

Ej: Vitamina D3 con monitorización → balance muy favorable. Senolíticos sin supervisión → dasatinib es inmunosupresor → balance negativo.
B

Valores y preferencias

La importancia relativa que el cliente asigna a cada desenlace. Alta variabilidad → decisión compartida.

Ej: Ayuno intermitente — aceptabilidad muy variable → condicional. Capital social → fuerte con implementación variable.
C

Aceptabilidad y factibilidad

¿Es la intervención aceptable y factible en la vida real? Incluso una intervención GRADE A puede requerir adaptación.

Ej: Fuerza 2-3x/semana es GRADE A pero requiere adaptación para perfiles con alta carga laboral.
D

Uso de recursos y coste

El coste en relación al beneficio esperado. GRADE C de alto coste → recomendación débil.

Ej: NMN — GRADE C + coste alto → débil. Creatina — GRADE B + coste bajo → condicional a favor.

Esquema de recomendaciones — Protocolo Élite

IntervenciónGRADEBalance dañosRecomendación EtD
Ejercicio aeróbico + fuerzaAMínimosFuerte a favor
Sueño 7h • regularidad ±30 minA/BNingunoFuerte a favor
Dieta mediterránea + fibra ≥25gANingunoFuerte a favor
Capital social + propósitoANingunoFuerte • decisión compartida
Vitamina D3 (déficit documentado)AHipercalcemia megadosisFuerte a favor
Omega-3 EPA/DHA 1-2g/díaAMínimosFuerte a favor
Magnesio (déficit o riesgo CV)BInteracc. medicamentosCondicional a favor
Creatina monohidrato 3-5g/díaBMínimosCondicional a favor
Proteína 1,2-1,5 g/kg/díaBERC: vigilarCondicional a favor
Ayuno — beneficio metabólicoBNingunoCondicional a favor
NMN / NR 250-500 mg/díaCSeguridad LP: N/CCondicional débil
Ayuno — extensión de vida directaCNingunoCondicional débil
Senolíticos (D+Q, fisetina)DDasatinib: inmunosupresorNo recomendado fuera de ECA

⚠ Certeza GRADE ≠ fuerza de recomendación

NMN es GRADE C → recomendación condicional a favor (daños mínimos, mecanismo sólido) — no "GRADE C = no funciona"
Senolíticos son GRADE D → recomendación en contra activa (dasatinib tiene toxicidad real) — no solo "falta evidencia"
Capital social es GRADE A → recomendación fuerte con implementación variable
Biomarcadores techo GRADE B → limitación estructural (ECA de longevidad éticamente imposible)
¿Qué significa que algo "tiene evidencia científica"?
Cada día aparecen titulares como "nuevo estudio demuestra que X alarga la vida". Pero no toda evidencia pesa igual. Esta guía te enseña a leer el nivel de confianza de cada recomendación del Protocolo Élite, sin necesidad de ser científico.
1
¿Qué mide GRADE? — La analogía del GPS
Entiende la certeza de evidencia en 30 segundos
Analogía

Imagina que la evidencia científica es la señal de tu GPS. GRADE A = señal perfecta en autopista abierta: muy improbable que te lleve por el camino equivocado. GRADE B = buena señal con algún edificio cerca: te guía bien, pero podría recalcular. GRADE C = señal débil en zona de montaña: puede ser correcto, pero conviene confirmar. GRADE D = sin cobertura: indica una dirección, pero no hay forma de saber si es correcta.

A

Alta certeza

Muy improbable que nuevos estudios cambien la conclusión

B

Moderada

Nuevos estudios podrían modificar la conclusión

C

Baja

Muy probable que nuevos estudios cambien la conclusión

D

Muy baja

La conclusión actual es muy incierta

2
El titular de prensa vs. la realidad GRADE
Por qué los titulares siempre parecen más seguros de lo que son
El teléfono descompuesto científico

Un hallazgo pierde certeza cada vez que cambia de manos. Lo que empieza como "asociación observada en ratones" llega a redes sociales como "científicos descubren la cura del envejecimiento".

Estudio
GRADE C/D
Paper
Técnico
Nota de prensa
Simplificado
Titular
"Demuestra que..."
Redes
"La cura de X"
❌ Titular típico

"El NMN revierte el envejecimiento celular"

✓ Realidad GRADE C

"El NMN puede elevar NAD+ en músculo. Estudios en humanos son pequeños y cortos."

❌ Titular típico

"Ayuno intermitente alarga la vida un 35%"

✓ Realidad GRADE C/D

El +35% es en ratones. En humanos, mejora marcadores metabólicos (GRADE B) pero extensión de vida no demostrada en ECAs.

❌ Mito frecuente

"GRADE C significa que no funciona"

✓ Lo que significa en realidad

Significa incertidumbre sobre los datos, no sobre el mecanismo. Puede funcionar perfectamente — o no. Simplemente no lo sabemos con suficiente seguridad todavía.

❌ Titular típico

"Las relaciones sociales salvan vidas (nuevo estudio)"

✓ Realidad GRADE A

Esto sí está respaldado: 23 meta-análisis, +50% de supervivencia. Es una de las intervenciones con mayor certeza de todo el protocolo.

3
GRADE no es la última palabra
Por qué GRADE C no siempre significa "no recomendado"
Analogía: el médico que recomienda caminar aunque no haya ECA de 50 años

No existe un ensayo clínico de 50 años donde la mitad caminó y la otra no. Sin embargo, ningún médico serio dudará en recomendar caminar. ¿Por qué? Porque el balance beneficio/daño es clarísimo, es aceptable, es gratis y todo el mundo puede hacerlo. Eso es lo que hacen los marcos EtD: juntar la certeza científica con el sentido común clínico.

Criterio EtDPregunta claveCómo afecta la recomendación
Balance daños¿Los beneficios superan los daños?Daños graves → recomendación débil o en contra, aunque sea GRADE A
Preferencias¿Importa igual a todo el mundo?Alta variabilidad → recomendación condicional con decisión compartida
Factibilidad¿Es posible en la vida real?No factible para el perfil → adaptar antes de recomendar
Coste¿El coste es proporcional al beneficio?Alto coste + GRADE C → recomendación débil aunque el mecanismo sea sólido
4
Preguntas que puedes hacerle a tu profesional de salud
Cómo usar GRADE como herramienta de conversación
"¿En qué nivel de evidencia está basada esta recomendación?"

Pide que te explique si es GRADE A, B, C o D y qué tipo de estudio lo respalda. Una buena respuesta incluirá el tipo de diseño del estudio.

"¿Los estudios se hicieron en personas parecidas a mí?"

Si los estudios son en hombres de 30 años y tú tienes 55 con hipertensión, la evidencia es indirecta — lo que en GRADE reduce la certeza en un nivel.

"¿Qué pasa si no lo hago? ¿Qué riesgo concreto asumo?"

La recomendación debería venir con datos absolutos, no solo relativos. "Reduce el riesgo un 47%" es difícil de evaluar sin saber el riesgo de partida.

"¿Cuánto tiempo debo esperar para ver resultados? ¿Y cómo lo medimos?"

Toda intervención del protocolo tiene biomarcadores asociados. Sin seguimiento, no sabes si la intervención funciona para ti.

"¿Ha cambiado algo en la evidencia en los últimos 2-3 años?"

Áreas como senolíticos, NMN o relojes epigenéticos evolucionan rápidamente. Una buena respuesta reconocerá qué sigue siendo incierto.

5
Lo más contraintuitivo del Protocolo Élite
Las sorpresas que la evidencia reserva
El dato más sorprendente

Las relaciones sociales tienen mayor evidencia que la mayoría de los suplementos del mercado. GRADE A con +50% de supervivencia. Sin embargo, nadie las vende en una cápsula.

La limitación más honesta

Los biomarcadores son GRADE B no porque la ciencia sea débil, sino porque el ECA definitivo es éticamente imposible — nadie puede aleatorizar tu edad biológica.

Lo más costoso con menos certeza

El NMN cuesta 60-150€/mes y tiene GRADE C. La creatina cuesta 10-15€/mes y tiene GRADE B para función cognitiva y muscular.

Lo más infrautilizado

El Paso 5 (suplementos) atrae toda la atención. Pero los pasos 1 (ejercicio), 4 (nutrición) y 7 (capital social) tienen GRADE A más limpio y consistente.

Lenguaje controlado GRADE (Kirmayr et al., 2021) aplicado a todas las intervenciones del Protocolo Élite.

PasoIntervenciónGRADEFactor modificador claveExpresión controlada
01Ejercicio aeróbico + fuerzaADosis-respuesta +1 • Magnitud HR 0.53 +1Reduce la mortalidad
02aSueño 7hA57 estudios • N>500k • ConsistenteReduce mortalidad prematura
02bRegularidad del sueñoBUn cohorte N=88.975 • replicación pendienteProbablemente reduce mortalidad
02cAlineación circadiana alimentariaCSolo modelo animal • indirección −1Puede extender la vida
03aResiliencia + propósitoAMeta-análisis replicados • N=136.265Reduce mortalidad 17-53%
03bMindfulness ≥8 semanasBMeta-análisis ECAs • PA medibleProbablemente reduce riesgo CV
04aDieta mediterráneaAN=1.676.901 • dosis-respuesta +1Reduce mortalidad
04bFibra ≥25g/díaAN=134.778 • magnitud HR 0.61 +1Reduce mortalidad cardiovascular
04cProteína 1,2-1,5 g/kg/díaBSin ECA mortalidad • indirección −1Probablemente preserva masa muscular
04dAyuno — metabólicoBECAs glucemia • indirección parcialProbablemente mejora marcadores metabólicos
04eAyuno — extensión de vidaCSolo animal • indirección −1Puede extender la vida (modelos animales)
05aVitamina D3A80 ECAs meta-análisisReduce mortalidad (>3 años)
05bOmega-3 EPA/DHAA17 cohortes N=42.466 • magnitud +1Reduce mortalidad 15-18%
05cMagnesioBUn cohorte • 3,5 añosProbablemente reduce eventos CV
05dCreatina monohidratoBMeta-análisis cognitivoProbablemente mejora función cognitiva
05eNMN / NRCN<100 • sin mortalidad humanaPuede elevar NAD+ muscular
05fSenolíticos (D+Q, fisetina)DFase 1-2 • dasatinib inmunosupresorEfecto incierto • daño real conocido
06Panel de biomarcadoresB**Techo estructural: ECA éticamente imposibleProbablemente predicen mortalidad
07Capital social + propósitoA23 meta-análisis • magnitud +50% +1Aumenta probabilidad de supervivencia

Los sesgos más frecuentes en investigación de longevidad y cómo identificarlos al evaluar la evidencia.

Reduce certeza −1 o −2

Sesgo de publicación

Los estudios positivos se publican más que los negativos, inflando el efecto aparente. Detectable con funnel plot asimétrico en meta-análisis.

Reduce certeza −1 o −2

Confusión residual

Variables no medidas (educación, nivel socioeconómico, estilo de vida global) pueden explicar la asociación. Clave en estudios de longevidad.

Reduce certeza −1

Causalidad inversa

Personas ya enfermas cambian sus hábitos, haciendo que ese hábito parezca protector. Crítico en estudios de dieta y longevidad.

Reduce certeza −1

Sesgo del trabajador sano

Poblaciones activas laboralmente están más sanas que la general. Sobreestima el beneficio en cohortes ocupacionales.

Reduce certeza −1

Sesgo de atrito

Los participantes que abandonan el estudio son diferentes a los que permanecen. Relevante en ECAs de larga duración.

Reduce certeza −1 o −2

Heterogeneidad (I²)

En meta-análisis, cuánto varían los resultados entre estudios. I²>75% = inconsistencia considerable que reduce la certeza.

Reduce certeza −1

Evidencia indirecta

Datos de animales no se transfieren directamente a humanos. La cadena intervención → biomarcador → mortalidad acumula incertidumbre en cada paso.

Reduce certeza −1

Sesgo de recuerdo

En caso-control, los casos recuerdan mejor sus exposiciones. Sobreestima el riesgo de la exposición.

Limitación estructural

ECA éticamente imposible

Para biomarcadores de longevidad, el ECA definitivo es imposible: no se puede aleatorizar la edad biológica ni seguir a personas 40 años. El techo es GRADE B por diseño, no por falta de rigor.

Aumenta certeza +1

Gran magnitud del efecto

OR/RR muy alejados de la línea nula hacen improbable que el confusor explique todo el efecto. Ej: capital social +50% supervivencia; ejercicio HR 0.53.

Aumenta certeza +1

Gradiente dosis-respuesta

Mayor exposición → mayor efecto. Fortalece la inferencia causal en observacionales. Presente en ejercicio y dieta mediterránea del protocolo.

Aumenta certeza +1

Confusión residual actúa en contra

Si los confusores conocidos actuarían en contra del efecto y aun así el efecto es visible, aumenta la confianza en que es real.

Referencias metodológicas

[A] Kirmayr M et al. Metodología GRADE, parte 1: cómo evaluar la certeza de la evidencia. Medwave 2021;21(02):e8109. doi:10.5867/medwave.2021.02.8109 • medwave.cl/…/8109.html

[B] Quilodrán C et al. Metodología GRADE, parte 2: de la evidencia a la decisión. Medwave 2021;21(04):e8182. doi:10.5867/medwave.2021.04.8182 • medwave.cl/…/8182.html