Pros y contras a la hora de decidir publicar un pre-print.

Dice el dicho que "después de visto, todo el mundo es listo", y con esa sensación me enfrento a la tarea de dirimir si hubiese publicado en un medio de comunicación el entonces artículo prepublicado en BiorXiv titulado "Phylodynamics of SARS-CoV-2 transmission in Spain".

El trabajo, enviado a la plataforma en abril del 2020, analizaba mediante cálculos bayesianos el probable origen geográfico y temporal de SARS-CoV-2 en España a partir de 1.590 secuencias completas del genoma vírico depositadas en GISAID. Así, comparaban secuencias de muestras procedentes de Europa y de Wuhan, así como muestras de Francia, Italia, Alemania y Finlandia junto con las pertenecientes a 28 muestras recogidas en España. De esta forma, los autores concluían que había habido varias momentos en los que el virus había entrado en España y que eran al menos dos los tipos de virus que habían proliferado (cluster S y cluster G, varían en una posición de su genoma) y desde aquí se habían expandido a otros países. Según sus cálculos la variante S-Española habría entrado el 14 de febrero procedente de Shangai y la G-Española el 18 de febrero. Los autores destacaban el extraordinario potencial del SARS-CoV-2 para una rápida y generalizada difusión geográfica (como hemos podido vivir meses después de la publicación de este pre-print).

¿Por qué hubiese dudado a la hora de publicar el artículo? Si bien era necesario encontrar datos que apoyaran que el virus se transmitía muy rápidamente de cara a tomar cuanto antes las medidas necesarias para intentar paliar lo máximo posible sus efectos, el tamaño muestral parece muy pequeño.

Desde el punto de vista del impacto social, con una gran incertidumbre sobre los pasos a dar, una gran desconfianza por parte de la sociedad hacia las decisiones políticas, publicar que el virus estaba presente en nuestro territorio antes de lo que se pensaba y que las medidas a aplicar quizá hubiesen debido ser anteriores, podría generar una alarma social innecesaria si los resultados del trabajo preliminar no hubiesen sido concluyentes. Es decir, si se tratara de unas conclusiones erróneas debido al pequeño tamaño muestral.

Por otra parte, tras la publicación en Twitter por parte del Instituto de Salud Carlos III (centro donde trabajan los autores del trabajo), la noticia pasó rápidamente a difundirse, por lo que podría considerarse que tendría un gran impacto social. Por tanto, merecería la pena preparar una buena noticia periodística describiéndolo, bien con más información que lo apoyara, bien con un trabajo contrarrestando la información compartida mediante datos que la desmintieran.

Para poder tomar la decisión final creo que hubiese contactado con los propios investigadores para que me explicaran lo que en su opinión aportaba el artículo así como los sesgos y limitaciones que ellos veían en su trabajo, hubiese recurrido a matemáticas expertas en el cálculo bayesiano (como Ana Bayes o Clara Grima) para que me indicaran lo robusto del análisis y quizá con algún microbiólogo, virólogo o filogenetista para analizar las conclusiones del trabajo.

No fue ésta la decisión que tomó Antena 3 que publicó la noticia el 23 de abril, dos días después de que el ISCIII lo comunicara en Twitter, sin contrastar la información con otros expertos. Por su parte, 20 minutos y El Heraldo también la publicaron en esa misma fecha, incluyendo comentarios de Fernando Simón sobre el descubrimiento y uniéndolo con publicaciones previas como posibles aclaraciones (o justificaciones).

Por cierto, el artículo ha sido recientemente publicado, tras revisión por pares, en Journal of Virology con el título "A Founder Effect Led Early SARS-CoV-2 Transmission in Spain". En esta nueva versión incluyen genomas completos de  12511 muestras obtenidas por todo el mundo, que comparan con 290 muestras recogidas en España (61 de las cuales son secuenciadas por los propios autores). En este caso, son al menos cuatro los grupos víricos de transmisión local, con una forma principal originada a más tardar a mediados de febrero y que fue rápidamente sustituida por las otras tres a mediados de marzo probablemente porque al portar una variante en la proteína S (o spikepresentaran mayor capacidad infectiva. Y es ahora cuando otros medios como Diario Sur, Acta Sanitaria o Redacción Médica, la sacan a la luz. Como curiosidad (👀), los tres medios publican la noticia el 3/4 de noviembre, cuando, de acuerdo a la infometría del propio artículo, éste fue aceptado en Octubre 2020 y su publicación online no fue hasta el 31 de enero.

Comentarios