Calidad global de la notificación de los ensayos clínicos aleatorizados de acupuntura para el dolor lumbar publicados después de 2020: una revisión sistemática (Liu J et al. en BMJ Open 2025)

Compartir:

En el mundo de la acupuntura hay una frase que aparece una y otra vez, como un estribillo: “la evidencia es mala”. A menudo viene acompañada de otras etiquetas: que los ensayos son pequeños, que casi todos son chinos, que la calidad metodológica es pobre. Y es cierto que una parte de esa crítica toca algo real; sería absurdo negar que en la investigación en acupuntura hay problemas. Pero si nos quedamos solo ahí, sin mirar alrededor, acabamos comprando una imagen muy simplificada: acupuntura = mala ciencia, resto de la medicina = buena ciencia.

La pregunta interesante no es si la acupuntura tiene estudios mejorables (los tiene), sino esta otra: ¿qué pasa cuando aplicamos la misma lupa a los ensayos de las otras intervenciones que usamos a diario? ¿La calidad es realmente tan diferente o el problema es más general, solo que solemos mirar con mucho más rigor a lo “alternativo” que a lo “convencional”?

Para intentar contestar, merece la pena centrarse en un terreno muy concreto y muy poco exótico: el dolor lumbar crónico. Es un campo donde conviven casi todas las grandes familias terapéuticas: ejercicio y programas de rehabilitación, educación y “escuelas de espalda”, TENS y otras técnicas físicas, fármacos de todo tipo, infiltraciones, bloqueos, rizólisis por radiofrecuencia, cirugía en determinados perfiles… y también acupuntura. Si hay un “laboratorio natural” para comparar cómo se genera y se evalúa la evidencia, es este.

Lo primero que llama la atención cuando uno busca no estudios de eficacia, sino estudios que analicen la calidad metodológica de los ensayos, es que hay muy pocos. En lumbalgia crónica contamos, básicamente, con cuatro trabajos serios que se dedican a auditar cómo están diseñados y reportados los ensayos clínicos. Dos son revisiones metodológicas centradas en acupuntura, una analizaba los estudios entre 2010 y 2020 (Liu X et al. Evaluating the Quality of Reports About Randomized Controlled Trials of Acupuncture for Low Back Pain. J Pain Res. 2021), la otra los publicados a partir de 2021 (Liu J et al. Overall reporting quality of randomised controlled trials of acupuncture for low back pain reported after 2020: a systematic review. BMJ Open. 2025). Los otros dos miran la rehabilitación “clásica”: uno, firmado por Gianola y colaboradores en 2016 (Gianola S et al. Reporting of Rehabilitation Intervention for Low Back Pain in Randomized Controlled Trials: Is the Treatment Fully Replicable? Spine (Phila Pa 1976). 2016), revisa la descripción de las intervenciones de rehabilitación; el otro, liderado por Cancelliere en el marco de la OMS (Cancelliere C et al.. Improving Rehabilitation Research to Optimize Care and Outcomes for People with Chronic Primary Low Back Pain: Methodological and Reporting Recommendations from a WHO Systematic Review Series. J Occup Rehabil. 2023), analiza los ensayos que alimentan la futura guía de la organización sobre lumbalgia primaria crónica.

De todas las otras grandes intervenciones usadas en dolor lumbar, fármacos, infiltraciones, rizólisis, cirugía…, no tenemos, hasta donde se ha buscado de forma sistemática, auditorías similares que apliquen con ese mismo nivel de detalle herramientas de calidad metodológica como CONSORT, TIDieR, GRADE o extensiones específicas. Esa asimetría es importante: en acupuntura se ha empezado a mirar la calidad con lupa, mientras que en otras áreas que suelen criticar la acupuntura desde una posición de superioridad rara vez se han sometido a ese mismo escrutinio.

Si nos acercamos un momento a la foto de la acupuntura, el trabajo más reciente, publicado por Liu J et al. en BMJ Open 2025, revisa 57 ensayos clínicos aleatorizados de acupuntura para lumbalgia publicados entre 2021 y 2025. El objetivo no es ver cuánto duele menos la espalda, sino comprobar “cómo están escritos” esos estudios cuando se valoran con tres estándares muy exigentes: CONSORT (la guía general para ECA), STRICTA (la extensión específica para describir intervenciones de acupuntura) y CONSORT-Outcomes (centrada en la elección y manejo de los resultados).

Cuando se puntúan los ensayos, la imagen que aparece no es ni gloriosa ni catastrófica. En conjunto, la calidad de la notificación es intermedia. Los autores suelen hacer un trabajo razonable describiendo quiénes son los pacientes y qué tipo de acupuntura reciben: qué estilo se utiliza, en qué puntos, con qué frecuencia. La parte “técnica” de la acupuntura, de hecho, suele estar mejor contada que hace una década. Donde flojean claramente es en los aspectos que llamamos “metodología dura”: explicar con detalle cómo se generó y se ocultó la secuencia de aleatorización, qué grado real de cegamiento había, si el ensayo estaba registrado previamente, dónde está disponible el protocolo completo o cómo se recopilaron y comunicaron los efectos adversos. Es decir, los problemas existen, pero no son de una naturaleza distinta a los que encontramos cuando aplicamos CONSORT en muchas otras áreas de la medicina.

Lo interesante es que, en acupuntura, al menos sabemos esto porque alguien se ha tomado el trabajo de revisar los ensayos con las herramientas adecuadas. No es un campo que “se escape” de los estándares; al contrario: se ha sometido voluntariamente a ellos, y eso permite ver con bastante claridad qué se está haciendo bien y qué se debe mejorar.

Cuando damos la vuelta al espejo y miramos la rehabilitación “convencional”, el cuadro no es muy distinto. Gianola et al. (Spine (Phila Pa 1976). 2016) cogieron 185 ensayos de rehabilitación para lumbalgia incluidos en revisiones Cochrane y se plantearon una pregunta muy sencilla y muy práctica: con la información que da el artículo, ¿podría otro grupo de investigadores reproducir exactamente la misma intervención en un nuevo estudio?

La respuesta fue que en más del 80 % de los ensayos la intervención no estaba descrita con suficiente detalle como para ser clínicamente replicable. Casi todos los trabajos decían, más o menos, qué tipo de pacientes incluían, quién les trataba y cuántas sesiones recibían. Pero faltaban piezas clave: qué ejercicios concretos se aplicaban, con qué intensidad, qué progresiones, qué criterios de ajuste en función de la respuesta, qué dosificación real de trabajo hacía cada paciente. Es decir, teníamos décadas de ensayos y mucha producción científica, pero a la hora de la verdad el tratamiento era poco menos que una caja negra. Desde el punto de vista de la práctica clínica, eso limita muchísimo lo que podemos aprender de esos estudios.

El informe de la OMS (Cancelliere C et al. J Occup Rehabil. 2023) sobre lumbalgia primaria crónica ofrece otra perspectiva complementaria. Aquí se revisan 82 ensayos de intervenciones como programas de ejercicio, educación estructurada, TENS y terapias de punción. El grupo no se conforma con ver si el dolor baja tres puntos en una escala, sino que analiza el riesgo de sesgo, la descripción de las intervenciones, la medida de adherencia, el registro de eventos adversos y la selección de outcomes.

Lo que encuentran podría sonar familiar a cualquiera que haya leído críticas metodológicas sobre acupuntura: más del 90 % de los ensayos presenta un riesgo alto o incierto de sesgo de rendimiento; en aproximadamente tres cuartas partes, el sesgo de detección también es alto o dudoso, en gran parte porque los resultados dependen de escalas autorreportadas por pacientes que saben qué tratamiento están recibiendo. En torno a dos tercios de los ensayos no informan nada sobre la adherencia: no sabemos si los pacientes hicieron realmente los ejercicios, acudieron a todas las sesiones o abandonaron a mitad. Solo una minoría recoge de forma sistemática los eventos adversos, y una proporción no desdeñable describe las intervenciones de manera tan incompleta que obliga a recomendar formalmente el uso de checklists como TIDieR para poder entender qué se hizo exactamente.

Cuando este tipo de ensayos se mete en una coctelera estadística y se intenta aplicar GRADE para valorar la confianza que merece la evidencia, el resultado es que muchas veces la certeza desciende a “baja” o “muy baja”. Y de nuevo, el motivo no es necesariamente que el ejercicio, la educación o el TENS “no funcionen”, sino que el conjunto de estudios es heterogéneo, mezcla ensayos de buena y mala calidad y adolece de déficits importantes de diseño y de reporting.

Si ponemos estas piezas en línea, el panorama que se dibuja es más pedagógico que polémico. No se trata de decir que “todo es malo”, ni en acupuntura ni fuera de ella. Se trata de reconocer que la fragilidad metodológica es un problema transversal en la investigación clínica, especialmente en campos complejos como el dolor lumbar crónico, donde las intervenciones son multifactoriales, el cegamiento es difícil y los outcomes dependen en gran medida del relato del paciente.

En ese contexto, es poco razonable utilizar una lupa de aumento solo cuando hablamos de acupuntura, y dejarla guardada en el cajón cuando se trata de fármacos, infiltraciones, rizólisis o cirugía. Más aún si tenemos en cuenta que, en estas últimas áreas, apenas hay trabajos que hayan auditado la calidad metodológica de los ensayos con el mismo nivel de detalle que se ha hecho en acupuntura o en rehabilitación.

El lado positivo de todo este análisis es que señala un camino. Sabemos qué herramientas tenemos para diseñar y contar mejor los estudios: CONSORT, STRICTA, TIDieR, CONSORT-Outcomes, GRADE, AMSTAR-2…. Sabemos también en qué puntos fallamos de forma repetida: descripción incompleta de las intervenciones, poca transparencia en el proceso de aleatorización y cegamiento, baja tasa de registro previo de ensayos y protocolos, escasa información sobre adherencia y daños. Estos problemas no son una condena, son un mapa de trabajo.

En el mundo de la acupuntura, el hecho de que existan varias revisiones metodológicas recientes, en revistas serias, que analizan sin anestesia la calidad de los ensayos y señalan lo que hay que mejorar, es una buena noticia. Muestra que hay una preocupación real por alinearse con los estándares de la medicina basada en la evidencia, no solo de palabra. También debería servir para rebajar el tono de superioridad con el que a veces se critica a la acupuntura desde otras disciplinas que, si se sometieran a un escrutinio igual de riguroso, probablemente sacarían un boletín de notas muy parecido.

El mensaje que podríamos extraer para nuestros pacientes, colegas e incluso para nosotros mismos como investigadores es más o menos este: la evidencia en acupuntura no es perfecta, pero la de muchas otras intervenciones tampoco. En lugar de usar las carencias de unos y otros como arma arrojadiza, tiene más sentido reconocer que compartimos problemas metodológicos comunes y aprovechar esa conciencia para hacer ensayos mejores, más transparentes y más útiles para la práctica clínica. Si conseguimos medirnos con la misma vara, ni más blanda, ni más dura, en todas las áreas, habremos dado un paso importante hacia una medicina que no solo invoque la evidencia, sino que la construya con rigor y con humildad.

Referencia:
Liu J, Lai P, Chen X, Jia C, He J, Xin M, Zhu D, Cheng S *, Zeng F *. Overall reporting quality of randomised controlled trials of acupuncture for low back pain reported after 2020: a systematic review. BMJ Open. 2025 Nov 13;15(11):e098961. doi: 10.1136/bmjopen-2025-098961. PMID: 41248354; PMCID: PMC12625842.

Fuente
Dr. Beltran Carrillo
Publicado el Categorías Blog, Dolor, Dolor lumbarEtiquetas Acupuntura basada en la evidencia, Calidad Metodologica, Clínica Beltrán Carrillo, dolor, Dolor Crónico, Dolor Lumbar, Evidencia científica