banner

Blog

Aug 06, 2023

Diversificación evolutiva del ANME metanotrófico.

Nature Microbiology volumen 8, páginas 231–245 (2023)Cite este artículo

6323 Accesos

3 citas

46 altmétrico

Detalles de métricas

'Candidatus Methanophagales' (ANME-1) es un clado de arqueas de nivel de orden responsable de la oxidación anaeróbica de metano en sedimentos de aguas profundas. La diversidad, la ecología y la evolución de ANME-1 siguen siendo poco conocidas. En este estudio, utilizamos la metagenómica en muestras hidrotermales de aguas profundas para ampliar la diversidad de ANME-1 y descubrir el efecto de la dinámica virus-huésped. Los análisis filogenéticos revelan una familia termófila de ramificación profunda, 'Candidatus Methanospirareceae', estrechamente relacionada con los oxidantes de alcanos de cadena corta. La filogenia global y los genomas casi completos muestran que el metabolismo del hidrógeno dentro de ANME-1 es un rasgo antiguo que se heredó verticalmente pero se perdió diferencialmente durante la diversificación del linaje. La metagenómica también descubrió 16 familias de virus no descritas hasta ahora dirigidas exclusivamente a arqueas ANME-1, que muestran firmas estructurales y replicativas únicas. El viroma expansivo ANME-1 contiene un repertorio de genes metabólicos que puede influir en la ecología y la evolución del huésped a través del desplazamiento de genes mediado por virus. Nuestros resultados sugieren una continuidad evolutiva entre el metano anaeróbico y los oxidantes de alcanos de cadena corta y subrayan los efectos de los virus en la dinámica y evolución de los ecosistemas impulsados ​​por metano.

Las arqueas metanotróficas anaeróbicas (ANME) son un grupo polifilético de linajes de arqueas que han desarrollado de forma independiente la capacidad de oxidación anaeróbica de metano (OMA), un proceso que se estima que elimina más del 80% del metano producido globalmente en sedimentos de aguas profundas1 por revertir la vía de la metanogénesis2. Mientras que los linajes ANME-2 y ANME-3 comparten ancestros comunes con los metanógenos actuales del orden Methanosarcinales, las arqueas ANME-1 forman su propio orden 'Candidatus Methanophagales', que es hermano de los degradadores de alcanos no metano 'Candidatus Syntrophoarchaeales ' y 'Candidatus Alkanophagales'3. ANME-1 puede crecer más allá de los hábitats fríos y templados de aguas profundas que a menudo comparten con otros ANME, prosperando de manera única a temperaturas más altas dentro de ambientes hidrotermales2,4,5. En los sedimentos marinos, los ANME forman principalmente asociaciones sintróficas con bacterias reductoras de sulfato6 mediante transferencia directa de electrones entre especies7,8. Sin embargo, algunos ANME-1 se han observado como células individuales o como consorcios monoespecíficos sin bacterias asociadas5,9,10,11, y se ha propuesto que realicen metanogénesis hidrogenotrófica10,11,12, aunque hasta ahora los experimentos fisiológicos no han logrado respaldar esta hipótesis13. ,14. En general, sigue sin estar claro qué factores han contribuido a la diversificación fisiológica y ecológica de ANME-1 de sus parientes alcanos de cadena corta y otros linajes de ANME.

A pesar del predominio de las arqueas ANME en muchos ecosistemas ricos en metano, los virus que atacan a los linajes ANME están en gran medida inexplorados15,16,17. Al explotar y derramar los recursos celulares del huésped a través de su replicación y ciclos líticos, los virus desempeñan un papel importante en la dinámica ecológica y el ciclo de nutrientes en diversos sistemas microbianos18. En los ecosistemas de aguas profundas, se ha estimado que la lisis viral causa una mortalidad anual de arqueas que libera entre 0,3 y 0,5 gigatoneladas de carbono a nivel mundial19. Por lo tanto, caracterizar las distribuciones y funciones de los virus de los ANME es una de las tareas más importantes para vincular cuantitativamente la fisiología de los ANME con los flujos elementales y de energía en los ecosistemas impulsados ​​por metano de las profundidades marinas, y comprender los impulsores de la evolución de los ANME.

En este estudio, recuperamos 13 genomas ensamblados en metagenomas (MAG) de ANME-1 en muestras minerales nativas e incubadas en laboratorio del sistema de ventilación hidrotermal de la cuenca sur de Pescadero en el Golfo de California, México (Tablas complementarias 1 y 2). Estas muestras no solo ampliaron la diversidad conocida dentro del clado ANME-1a, particularmente el grupo ANME-1 G60, sino que también contenían cinco MAG y un andamio de genoma circular de 1,6 Mb de un clado de ramificación profunda previamente no caracterizado filogenéticamente ubicado en la base del clado ANME-1a. Orden ANME-1 (Fig. 1, Datos ampliados, Fig. 1 y Tablas complementarias 2 y 3). A este clado de nivel familiar lo llamamos 'Candidatus Methanospirareceae' o ANME-1c. Dada su posición basal, es el ANME-1 filogenéticamente más cercano a los órdenes hermanos de degradadores de alcanos distintos del metano, Alkanophagales y Syntrophoarchaeales21.

En negrita, genomas recuperados de la Cuenca Sur de Pescadero. Las barras de colores indican de izquierda a derecha: entorno, ubicación, OGT prevista (en °C) y una comparación genómica de algunas características metabólicas (texto principal e información complementaria). Los números después de los nombres de ANME-1c indican las dos especies de ANME-1c y las estrellas después de los nombres indican MAG que contienen al menos la subunidad grande de una hidrogenasa de NiFe. Los círculos negros indican valores de soporte de arranque superiores al 80%. La barra de escala representa el número de sustituciones de nucleótidos por sitio. CoM, coenzima M.

Nuestros MAG ANME-1c representan dos géneros diferentes, 'Candidatus Methanoxibalbensis' y 'Candidatus Methanospirare' dentro de la misma familia con una identidad de nucleótidos promedio del 76%, representada por las especies 'Candidatus Methanoxibalbensis ujae' (especie 1) y 'Candidatus Methanospirare jalkutatii' (especie 2, Métodos). Según la cobertura del genoma, estas dos especies ANME-1 fueron los organismos más abundantes en las muestras de rocas 12,019 y NA091.008, mientras que apenas se detectaron en las rocas 11,868 y 11,719 y en sedimentos hidrotermales (Fig. 2a).

a, Abundancia relativa de MAG de ANME y otras bacterias y linajes de arqueas (izquierda). La abundancia genómica de arqueas a nivel de especie está a la derecha, destacando una variación de los linajes ANME-1 en rocas y sedimentos (derecha). El color de fondo indica muestras de roca (gris) o sedimento (marrón). La abundancia total no llega al 100% porque no se incluyen las lecturas no mapeadas. Tenga en cuenta las diferentes escalas de los ejes y entre paneles. b, Hibridación fluorescente in situ de células ANME-1 recuperadas de la muestra de roca NA091.008 (n = 2). Las células a las que se dirige la sonda general ANME-1-350 se muestran en rojo (izquierda). Las células a las que se dirige la sonda bacteriana general 338 están en verde (centro). Una superposición compuesta que muestra bacterias (verde), células ANME-1 (rojo) y tinción DAPI de todas las células microbianas en azul (derecha). Barra de escala, 5 µm.

Hasta ahora, todas las secuencias de los genes ANME-1c MAG y 16S rRNA del Centro Nacional de Información Biotecnológica (NCBI; https://www.ncbi.nlm.nih.gov/) y SILVA (https://www.arb-silva .de/) las bases de datos se han originado en ambientes hidrotermales, específicamente los sedimentos de las cuencas de Guaymas11,22 y Pescadero Sur23. Estos hábitats hidrotermales están separados por 400 km a lo largo del mismo sistema de fallas en el Golfo de California y exhiben una superposición del 20% a nivel de especies en la comunidad microbiana23. Esta distribución sugiere una fuerte especialización fisiológica termófila de ANME-1c en ambientes hidrotermales. De hecho, la predicción basada en el genoma24 sugirió una temperatura de crecimiento óptima teórica alta (OGT; Tabla complementaria 4 y Fig. 2 de datos ampliados) para ambas especies ANME-1c (>70 °C) que era mayor que la OGT promedio predicha para ambas especies ANME-1c. 1a (62 °C) y ANME-1b (52 °C). Esta adaptación a altas temperaturas por parte de ANME-1c podría estar relacionada con el tamaño reducido del genoma estimado ('Candidatus Methanoxibalbensis ujae': 1,81 Mb; 'Candidatus Methanospirare jalkutatii': 1,62 Mb), como se observó previamente en otras bacterias y arqueas termófilas25.

Utilizando hibridación fluorescente in situ con una sonda de ARNr 16S dirigida a ANME-1, detectamos células ANME-1 en la roca NA091.008 (Fig. 2b), donde ANME-1c era el linaje dominante según la cobertura del genoma (Fig. 2a). . Estas supuestas células ANME-1c exhiben la forma cilíndrica típica reportada previamente para otras poblaciones ANME-16 y se asociaron vagamente con células bacterianas en una matriz de sustancias poliméricas extracelulares, o se encontraron como células individuales.

La posición de ramificación profunda de ANME-1c nos llevó a examinar los patrones genómicos de aparición y diferenciación de ANME-1 de los órdenes hermanos Alkanophagales y Syntrophoarchaeales. Como todos los ANME-1, ANME-1c codifica una vía completa de metanogénesis inversa que incluye un único operón para la enzima metil coenzima M reductasa (MCR), responsable de la activación del metano y la sustitución de la metilen-H4MPT reductasa dependiente de F420 por 5 ,10-metilenetetrahidrofolato reductasa característica de ANME-12,8. Al igual que otros clados ANME, ANME-1c codifica varios citocromos multihemas, que probablemente median en la transferencia de electrones durante la OMA sintrófica a bacterias reductoras de sulfato2,7,8.

En particular, ANME-1c exhibe características distintas en comparación con ANME-1a y ANME-1b en el operón que codifica la enzima MCR. Esta enzima consta de seis subunidades con la estructura α2β2ϒ2 y el cofactor coenzima F430 único que contiene níquel (ref. 26). En la maduración de este cofactor intervienen McrC y McrD, dos proteínas adicionales codificadas por el operón MCR en metanógenos27,28. Aunque mcrD no está presente en ANME-1a y ANME-1b, ambos genes están presentes en ANME-1c, donde mcrD forma un operón con mcrABG (Fig. 1). Análisis anteriores sugirieron que ANME-1 adquirió los genes mcr de metanógenos metilotróficos distantes dependientes de H2 de la clase Methanofastidiosa2, mientras que perdieron los MCR divergentes presentes en Syntrophoarchaeales y Alkanophagales, que parecen usar alcanos más grandes. Del mismo modo, encontramos que el ANME-1c McrD está estrechamente relacionado con el McrD de Methanofastidiosa, pero solo de manera lejana con el McrD de Syntrophoarchaeales y Alkanophagales que forman un grupo diferente (Datos ampliados, Fig. 3). Estos resultados sugieren que durante la aparición de ANME-1, se adquirió un operón completo de mcr que cicla el metano (incluido mcrCD) mediante transferencia horizontal de genes de un metanógeno metilotrófico relacionado con Methanofastidiosa, y mcrD se perdió posteriormente tanto en ANME-1a como en ANME. -clados 1b. El ANME-1c también exhibe varias características genómicas adicionales que son distintas, resaltadas en la Fig. 1 y descritas en la Información complementaria y la Tabla complementaria 5.

El hidrógeno se propuso como uno de los primeros candidatos intermedios en la OMA sintrófica, pero cayó en desgracia después de que varios estudios genómicos demostraron que la mayoría de los genomas ANME no codifican hidrogenasas. Sin embargo, estudios recientes han informado sobre hidrogenasas de NiFe en subclados de grupos ANME más grandes, incluido un subclado ANME-1b 'Candidatus Methanoalium' y de genomas ANME-1a seleccionados (Fig. 1)2,29. Curiosamente, los genomas de los órdenes hermanos Syntrophoarchaeales y Alkanophagales codifican una hidrogenasa NiFe (Fig. 1), pero los experimentos fisiológicos no respaldaron el papel de esta hidrogenasa en la oxidación de alcanos sintróficos21. Nuestro análisis filogenómico ampliado de ANME-1 confirma que los genomas asociados con tres subclados distintos de ANME-1a, ANME-1b y ahora ANME-1c codifican cada uno un operón hidrogenasa NiFe (Fig. 1). El análisis filogenético de la subunidad grande de estas hidrogenasas reveló un grupo monofilético de hidrogenasas afiliadas a ANME-1 agrupadas con las de Syntrophoarchaeales y Alkanophagales (Fig. 3a y Tabla complementaria 6). Por lo tanto, la aparición de hidrogenasas parece ser un rasgo antiguo de la clase Syntrophoarchaeia que fue heredado verticalmente por el ancestro común de ANME-1 y luego se perdió diferencialmente durante la diversificación del clado ANME-1. Sorprendentemente, la aparición de hidrogenasa tiene una aparente distribución en mosaico entre los MAG, incluso dentro de los clados que contienen hidrogenasa. Por ejemplo, dentro de ANME-1c, solo dos de cinco MAG de 'Candidatus Methanospirare jalkutatii' (FW4382_bin126 y NA091.008_bin1) codifican hidrogenasas, mientras que el MAG FWG175 completo de 'Candidatus Methanospirare jalkutatii', ensamblado en un solo andamio, no contiene a ellos. Para verificar que esta distribución es causada por la variación intraespecie en lugar del ensamblaje incompleto del genoma, realizamos análisis metagenómicos independientes que confirmaron la presencia diferencial de genes de hidrogenasa dentro de las cepas ANME de diferentes muestras de rocas (Fig. 3b, Datos ampliados, Fig. 4 e Información complementaria). ). Por tanto, las hidrogenasas parecen ser parte del repertorio pangenómico de ciertos subclados y especies de ANME-1, probablemente preservadas en el pangenoma ANME-1 como una adaptación ambiental más que como un requisito absoluto para el metabolismo central metanotrófico.

a, Árbol filogenético de la subunidad grande de la NiFe hidrogenasa presente en los genomas ANME-1 (izquierda) y el árbol filogenómico correspondiente de esos genomas (derecha). Algunas hidrogenasas de NiFe de los genomas de ANME-1 también estaban afiliadas a los grupos 3 y 4 de NiFe (no se muestran, ver Datos ampliados en la figura 5). Las barras de color/fondos indican la afiliación filogenética de las hidrogenasas de interés. Los círculos negros indican valores de soporte de arranque superiores al 70% (izquierda) e iguales al 100% (derecha). Las barras de escala representan el número de sustituciones de aminoácidos por sitio. b, Lea la distribución de cobertura del operón hidrogenasa de los genomas ANME-1c FW4382_bin126 y NA091.008_bin1. Las bibliotecas de lectura metagenómica se indican a la derecha. El tono azul indica dónde se encuentra el operón hidrogenasa dentro del cóntig correspondiente.

El papel potencial de estas hidrogenasas en ANME-1 aún no está claro. Su posición filogenética, junto a las enzimas hidrogenotróficas 30 de los grupos NiFe 1g y 1h (Fig. 3a; solo unas pocas afiliadas a los grupos NiFe 3 y 4, datos ampliados, Fig. 5), sugieren una posible participación en la metanogénesis hidrogenotrófica, como se propuso previamente en base basándose en datos bioquímicos31, ambientales11,12, isotópicos10 y metagenómicos29, aunque los intentos de cultivo de enriquecimiento con hidrógeno han sido infructuosos13,14. Recientemente, el análisis genómico del grupo ANME-1b que codifica la hidrogenasa 'Candidatus Methanoalium' mostró la presencia de características distintivas de ciclo electrónico (complejo Rnf, citocromo b) y la ausencia de citocromos multihemos, lo que sugiere un metabolismo metanogénico para este grupo2. Por el contrario, ANME-1c codifica citocromos multihemas y carece de estas características de ciclo electrónico. Por tanto, la utilidad fisiológica de las hidrogenasas puede variar entre linajes. Si bien es probable que el hidrógeno no sea factible como único intermediario para la OMA sintrófica7,13, ANME-1c podría producirlo como un intermediario adicional, como se propone en un modelo mixto que involucra transferencia directa de electrones e intercambio de metabolitos2,32.

Los genomas de ANME-1 recuperados en este estudio contenían varios loci CRISPR-Cas (Datos ampliados, figura 6a), lo que permitió el análisis de elementos genéticos móviles (MGEs) alojados en ANME-1 a través del mapeo de secuencias basado en espaciadores CRISPR33,34 con filtros estrictos adicionales. (ver Métodos e información complementaria). Mapeo de 20,649 espaciadores ANME-1 CRISPR únicos a ensamblajes metagenómicos de las cuencas del sur de Pescadero y Guaymas (Tabla complementaria 7), y la base de datos de virus derivados del metagenoma IMG/VR v.335 capturó 76, 69 y 88 contigs MGE de más de 10 kb. respectivamente, por un total de 233 MGE ANME-1 (Fig. 4a, Datos ampliados, Fig. 6b, Tablas complementarias 8 y 9 y Datos complementarios 1 y 2). En particular, todos los MGE ANME-1 derivados de IMG/VR se originaron a partir de varios metagenomas derivados de la Cuenca de Guaymas. Como se encontró previamente para el mobiloma arqueal de Asgard34, un aparente mapeo espaciador-mobiloma entre sitios indica que una fracción sustancial del mobiloma ANME-1 ha migrado a través de estos ecosistemas de respiraderos hidrotermales alojados en sedimentos en el Golfo de California, junto con sus anfitriones23 (Fig. .4a). Debido a la aparente superposición de repeticiones CRISPR en diversos linajes ANME-1, estos espaciadores y, por lo tanto, las interacciones huésped-MGE, no se asignaron taxonómicamente a subclados específicos de ANME-1. Todos los MGE identificados en este estudio están lejos de todos los demás virus conocidos (Datos ampliados, figura 7). Se descubrió que una gran fracción de estos MGE ANME-1 estaban interconectados, formando una gran red compleja de similitud genética de 185 nodos y una red de tamaño mediano de 28 nodos (Fig. 4b). Los 22 MGE restantes se dividieron en siete pequeños grupos de dos o tres nodos y siete singletons.

a, Histogramas que muestran el número de espaciadores CRISPR de los metagenomas de las cuencas de Pescadero Sur y Guaymas que coinciden con los MGE ANME-1 de Pescadero Sur. b, Red de intercambio de genes de diversas MGE ANME-1 de diferentes orígenes. c, ANME-1 MGE, exhibidos en la misma red que b, abarcan una importante diversidad de virus de arqueas y elementos no virales. Los círculos sólidos o abiertos indican ensamblajes virales con/sin MCP identificables. En (b) y (c), las líneas discontinuas rodean cinco familias virales propuestas que contienen representantes completos del genoma. Los nombres propuestos de familias virales (negro) y órdenes (morado) se indican en (c). d – f, Sintenia genética de tres familias propuestas de virus icosaédricos sin cola dirigidos a ANME-1. Los diferentes colores indican 83 grupos de proteínas diferentes. El sombreado gris denota productos únicos. La barra de escala y el sombreado de identidad anterior se indican en (f). g, estructuras predichas por Alphafold2 de DJR MCP en virus ANME-1 que se muestran en (d) y (e). El azul indica barriles β y hélices α rojas. h, el análisis de máxima verosimilitud de las familias de MCP propuestas indica sus largas distancias evolutivas. i, el análisis de máxima verosimilitud de PolB encontrado en diferentes clados de Chaacvirus sin cola dirigidos a arqueas ANME-1 está relacionado con dos clados de Wyrdvirus en forma de huso dirigidos a arqueas Asgard. SJR, rollo de gelatina único.

Con base en la conservación de genes característicos que codifican proteínas estructurales virales, llegamos a la conclusión de que estos MGE abarcan virus de ADN bicatenario que pertenecen a al menos cuatro conjuntos de virus muy diferentes, caracterizados por diferentes historias evolutivas y distintas morfologías de viriones (Fig. 4c). En particular, los virus con cola de cabeza de la clase Caudoviricetes (reino Duplodnaviria) codifican MCP características de 97 veces HK y la subunidad grande de las proteínas terminal y portal36; los virus icosaédricos sin cola del reino Varidnaviria se caracterizan por MCP de doble rollo de gelatina (DJR)36; los virus del reino Adnaviria codifican MCP α-helicoidales únicas, que forman dímeros en forma de garras que se envuelven alrededor del ADN viral formando una cápside helicoidal en forma de varilla37; y todos los virus con forma de huso codifican MCP de hélice α altamente hidrofóbicas17 (Tablas complementarias 9 y 10). En total, en este estudio se descubrieron 16 familias virales candidatas, incluidas cinco familias con genomas completos representativos (Fig. 4c). A estas familias de virus candidatos les pusimos el nombre de dioses mayas, debido a su descubrimiento en los respiraderos hidrotermales del Golfo de California frente a la costa de México (ver Métodos para la etimología de los nombres de las familias de virus).

Los virus icosaédricos sin cola (Varidnaviria) que infectan ANME-1 se distinguen de los virus conocidos, y los 32 representantes son únicos en este estudio. Forman tres módulos desconectados y, según el análisis de similitud genética, representan tres familias virales no informadas (Fig. 4c-f). Los miembros del grupo Huracanviridae codifican MCP de rollo de gelatina individuales relacionadas con las conservadas en el reino Helvetiavirae, mientras que Chaacviridae e Ixchelviridae se unificaron dentro del orden que denominamos Coyopavirales y no codifican MCP con homología de secuencia con otros virus conocidos. Sin embargo, el modelado estructural de los MCP candidatos conservados en 'Chaacviridae' e 'Ixchelviridae' utilizando AlphaFold238 y RoseTTAFold39 reveló una similitud inequívoca con los MCP con un pliegue DJR (Fig. 4g). El análisis filogenético reveló que estas MCP de DJR forman tres grupos altamente divergentes, MCP-1–3 (Fig. 4g y h), y MCP-2 y MCP-3 contienen un pequeño barril beta adicional que se predice que apuntará hacia afuera desde la cápside. superficie y probablemente mediar en las interacciones virus-huésped.

Los chaacvirus tienen genomas de ADNbc lineales con repeticiones terminales invertidas y, en consecuencia, codifican ADN polimerasas de la familia B cebadas con proteínas (pPolB). Los chaacvirus muestran una notable plasticidad genómica; Estos virus no solo codifican dos variantes diferentes de los MCP de DJR, MCP-1 y MCP-2, sino que sus pPolB pertenecen a dos clados muy distintos. En particular, las dos variantes de MCP y dos de pPolB no coinciden estrictamente, lo que sugiere múltiples casos de recombinación y reemplazo de genes dentro de los módulos replicativo y morfogenético (Fig. 4d). El análisis de máxima verosimilitud de estos grupos divergentes de secuencias de pPolB reveló una relación con dos clados separados de pPolB codificados por Wyrdvirus, virus en forma de huso que se dirigen a las arqueas de Asgard40 (Fig. 4i). Además de pPolB, aguas arriba del gen MCP, todos los chaacvirus codifican una proteína funcionalmente no caracterizada con homólogos en los virus de arqueas de Asgard del grupo Huginnvirus, donde también están codificados aguas arriba de los genes MCP41. Esta observación sugiere un notable entrelazamiento evolutivo entre estos virus de arqueas ANME-1 y Asgard, potencialmente facilitado por la proximidad ecológica (es decir, los ecosistemas de respiraderos de aguas profundas) en lugar de la proximidad evolutiva de los respectivos huéspedes.

Los virus con cola de cabeza que se dirigen a ANME-1 codifican el conjunto de herramientas morfogenéticas típico compartido entre todos los miembros de Caudoviricetes, incluido el MCP de HK97 veces, la proteína portal, la subunidad grande de la terminasa y varias proteínas de la cola42. La filogenia de MCP indica una ascendencia compartida para los componentes estructurales de los virus de ANME-1 y haloarchaea, que están relacionados a nivel de filo (Datos ampliados, figura 8). Sin embargo, la filogenia global basada en proteomas43 reveló una clara división entre ANME-1 y los virus de cola de cabeza haloarqueales (Fig. 5a). Este resultado sugiere que, aunque estos virus codifican proteínas centrales relacionadas para la formación de viriones, como lo sugieren sus posiciones filogenéticas de MCP intercaladas (Datos ampliados, figura 8), el contenido general del proteoma de los virus ANME-1 y haloarqueales difiere considerablemente, probablemente reflejando la adaptación a sus respectivos anfitriones y contextos ecológicos. Con base en las distancias genéticas mínimas entre las familias de halovirus y las comparaciones entre genomas (Datos ampliados, figura 9), proponemos nueve familias candidatas de Caudoviricetes. Los virus de estas familias exhiben poca superposición de proteomas entre sí (Datos ampliados, figura 9), lo que ilustra aún más la vasta diversidad genética de los virus de cola de cabeza ANME-1.

a, División evolutiva entre virus con cola de cabeza que se dirigen a ANME-1 y haloarchaea revelada por análisis filogenéticos globales basados ​​en proteomas. Los virus ANME-1 con genomas circulares completos están resaltados en violeta, aquellos con genomas circulares completos no confirmados están resaltados en azul. b, c, Organización del genoma y contenido genético de los genomas completos que representan dos familias de virus ANME-1 con cola de cabeza Ahpuchviridae (b) y Ekchuahviridae (c). El sombreado azul y morado representa hebras hacia adelante y hacia atrás, respectivamente. Los genes MCP, PolB y ThyX están resaltados en rosa y rojo. d, Alineación circular de los dos genomas de ekchuahvirus. Las puntas de flecha negras indican los sitios de inicio/finalización del contig original en cada ensamblaje. e, Contenido genético del genoma lineal completo de un representante de la familia de virus en forma de bastón Ahmunviridae. f, Sintenia genética de tres familias de virus fusiformes dirigidos a ANME-1, donde se encontró que los genomas completos y circulares de Itzamnaviridae se presentan en dos tamaños de genoma, donde los representantes de Demiitzamnavirus se alinean con una sección de los genomas más grandes de Pletoitzamnavirus (ilustrados en la parte superior). bien). Los diferentes colores indican 76 grupos de proteínas diferentes. El sombreado gris denota productos únicos. La barra de escala y el porcentaje de sombreado de identidad se indican en la parte inferior derecha. g, Contenido genético del genoma lineal completo de un representante de la familia de virus fusiformes Itzamnaviridae. El cuadro rojo discontinuo en (f) y (g) resalta un ejemplo de inserción de un grupo multigénico. En (d) y (f), el brazo estructural indica la fracción del genoma donde residen todos los genes estructurales virales; el brazo enzimático denota la fracción donde no hay genes estructurales y solo residen genes que codifican enzimas.

Ekchuahviridae y Ahpuchviridae están representados por virus ANME-1 con genomas completos de 70 a 80 kb y en el árbol proteómico forman clados hermanos fuera de los tres órdenes de halovirus, formando un orden independiente que llamamos Nakonvirales (Fig. 5a). Los ahpuchvirus PBV299 (70,9 kb, completo, Fig. 5b) e IMGVR0573778 (74,8 kb, casi completo) codifican cada uno una copia de MCP, mientras que los dos ekchuahvirus GBV302 (80,6 kb, completo, Fig. 5c) y GBV301 (71,8 kb, completo) 35,44 cada uno codifica dos copias de MCP. Esto es único entre otros Caudoviricetes conocidos que apuntan a haloarchaea y ANME-1. Podemos excluir un artefacto de ensamblaje, porque se encontró que los ensamblajes iniciales de los dos ekchuahvirus tenían una alineación circular entre sí (Fig. 5d). Ambos genes MCP están acompañados por genes de proteasa de maduración de la cápside afines, mientras que todas las demás proteínas morfogenéticas del virión están codificadas como genes de copia única (Fig. 5c). Es probable que MCP-1 esté conservado ancestralmente, mientras que MCP-2 parece transferido horizontalmente de los haloferuvirus. Su gran distancia filogenética sugiere una larga coexistencia y coevolución en los ekchuahvirus.

La coexistencia de dos genes MCP divergentes también se encuentra en miembros de supuestos virus con forma de bastón dentro de la familia 'Ahmunviridae', que proponemos incluir en la clase Tokiviricetes (reino Adnaviria) 37 dentro de un orden monotípico 'Maximonvirales' (Fig. 5e) y virus con la morfología fusiforme prevista, los 'Itzamnaviridae' (Fig. 5f-g). Estos dos clados de virus no descritos previamente están representados por genomas lineales completos con repeticiones terminales invertidas y genomas circulares, respectivamente. Esto contrasta con otro virus ANME-1 con forma de huso, el tepeuvirus PBV144, que tiene el genoma más grande (72,6 kb, aún no circularizado) pero solo un MCP. La coexistencia de MCP divergentes es inusual entre Caudoviricetes, pero se ha documentado previamente para el fago T4 con cola de cabeza, cuyas MCP forman respectivamente capsómeros hexaméricos y pentamericanos, ocupando este último los cinco vértices icosaédricos45. Los virus con forma de bastón de MCP dual forman un heterodímero de MCP funcional37,46 o utilizan solo una copia para la formación del virión47. Por lo tanto, aún no está claro cómo los genes MCP coexistentes contribuyen a la arquitectura de la cápside de los virus ANME-1.

Los grandes genomas de los virus ANME-1 con cola de cabeza y forma de huso exhiben una fuerte agrupación de genes funcionalmente relacionados: la mitad del genoma viral contiene todos los genes estructurales, mientras que la otra mitad codifica diversas enzimas implicadas en la síntesis y modificación del ADN y diversas Funciones metabólicas y de defensa (Fig. 5b – d, f, g). En particular, falta todo el módulo replicativo y metabólico de aproximadamente 20 kb en los genomas circulares de los demiitzamnavirus. Las alineaciones entre genomas revelaron una mayor variación en el contenido de genes para los brazos enzimáticos tanto en virus con cola de cabeza como en forma de huso, frecuentemente en forma de inserciones de grupos multigénicos (Fig. 5f y Datos ampliados, Fig. 9). Ekchuahviridae y Ahpuchviridae con cola de cabeza y Pletoitzamnavirus y Tepeuviridae con forma de huso codifican ADN polimerasas de la familia B cebadas con ARN, que comúnmente están codificadas por virus de ADNds con genomas más grandes48. Por lo tanto, la división del brazo estructural-enzimático se asemeja a los genomas centrales y pangenomas de los microbios, lo que permite interacciones versátiles entre estos virus y sus huéspedes ANME-1 (Tabla complementaria 10). Por ejemplo, los virus con cola de cabeza y con forma de huso contienen genes metabólicos auxiliares implicados en el metabolismo de nucleótidos y aminoácidos (NrdD, QueCDEF y asparagina sintasa), el anabolismo de carbono (PEPCK y GntT) y el anabolismo de fosfato y azufre (PhoU y PAPS) (ver Tabla complementaria 11 e información complementaria).

Nuestro análisis de genes metabólicos auxiliares virales también sugirió la participación de virus en la diversificación metabólica ancestral de ANME-1. Específicamente, la detección de genes que codifican ThyX49, que cataliza la metilación de dUMP en dTMP y probablemente aumenta la síntesis de timidina del huésped durante la producción viral, en ahpuchvirus y ekchuahvirus con cola de cabeza y en pletoitzamnavirus con forma de huso (Fig. 5b, f). Esto coincide con la presencia de thyX en el huésped ANME-1, que a diferencia de otros linajes ANME y arqueas oxidantes de alcanos de cadena corta, no codifica el gen de timidilato sintasa no homólogo, thyA2 (Fig. 1). La distribución dicotómica de los análogos funcionales thyA/thyX prevalece entre los microbios y, en particular, en los itzamnavirus, thyX y thyA pueden existir en diferentes miembros (Fig. 5f, g). El análisis filogenético de ThyX muestra que fue codificado por ANME-1 y sus virus forman un clado distinto de aquellos codificados por bacterias, arqueas y otros Caudoviricetes (Fig. 6 y Datos ampliados Fig. 10a, b). Sorprendentemente, ThyX codificado por itzamnavirus forma un grupo monofilético bien soportado en la base de este clado divergente y el ANME-1c de ramificación profunda codifica ThyX que pertenece a la segunda rama más profunda. En particular, el contenedor ANME-1c de la Cuenca de Guaymas (B22_G9) contiene un thyX genómico y un thyX codificado por un contig parcial derivado de itzamnavirus (Fig. 6 y Datos ampliados, Fig. 10). Los ekchuahvirus y ahpuchvirus probablemente adquirieron thyX de forma independiente en una etapa posterior.

Análisis de máxima verosimilitud de ThyX relacionado con las proteínas ThyX codificadas por ANME-1, con vistas ampliadas de ThyX de los virus ANME-1 a la derecha. Las leyendas de los colores de las ramas de ThyX de los virus ANME-1 y los genomas ANME-1 se indican debajo del árbol filogenético principal.

Los análisis anteriores sugieren que thyX fue adquirido primero por virus ANME-1 con forma de huso y luego transmitido a los ancestros comunes de ANME-1, desplazando a thyA. Debido a la mayor promiscuidad de las ADN polimerasas virales y la intensa carrera armamentista, se sabe que los genes virales evolucionan rápidamente50, lo que está en línea con la divergencia extrema del ANME-1/viral thyX del clado canónico.

En este estudio, la caracterización metagenómica de un ambiente de respiradero hidrotermal recientemente descubierto en la cuenca sur de Pescadero condujo a la expansión de la diversidad ANME-1 conocida para incluir ANME-1c y sus virus. ANME-1c es una familia de ramificación profunda que hasta ahora sólo se ha detectado en ambientes hidrotermales de alta temperatura. La genómica comparada indica un continuo evolutivo dentro de la clase Syntrophoarchaeia, porque ANME-1c retuvo varias características ancestrales que también se encuentran en Syntrophoarchaeales y Alkanophagales, incluidas las hidrogenasas. La filogenia de estas hidrogenasas es congruente con la filogenia del genoma, lo que indica una herencia vertical aparente y una pérdida diferencial de estos genes en ANME-1, lo que sugiere que estas hidrogenasas tienen un papel fisiológico no obligatorio, pero pueden conferir una ventaja selectiva de larga data.

Nuestro estudio también descubrió una supuesta fuente viral del gen thyX de timidilato sintasa específico de ANME-1 que reemplazó al gen thyA análogo funcional. ThyX se diferencia de ThyA en el uso de NADPH como donante de electrones al transferir el grupo metilo del intermedio C1 H4MPT = CH2 a dUMP para producir dTMP, sin oxidar el resto H4MPT2. H4MPT es un cofactor central que se recicla constantemente a través de la vía Wood-Ljungdahl que alimenta el anabolismo ANME-12; La abundancia de NADPH depende en gran medida del tipo de metabolismo energético del huésped y del estado redox51. La transición de ThyA a ThyX inducida por el virus puede haber desempeñado un papel en la diversificación metabólica y la posterior expansión ecológica de los ancestros ANME-1. El anabolismo de C1 parece ser más divergente entre los linajes ANME que el metabolismo energético de C12, que también puede haberse originado a partir de virus y otros MGE.

El viroma expansivo de ANME-1, descubierto en este estudio, está distante de todos los virus conocidos y forma 16 familias no descritas previamente y al menos tres órdenes no reportados. Se caracterizan por muchas características estructurales y replicativas únicas, lo que amplía sustancialmente nuestra apreciación de la diversidad de virus de arqueas y su importancia ecológica. Estos hallazgos abren la puerta a una exploración específica, dependiente e independiente de la cultura, de las interacciones entre el virus ANME y el huésped que se espera que desempeñen un papel fundamental en el ciclo biogeoquímico19 en estos ecosistemas productivos impulsados ​​por metano1.

Mientras se revisaba este artículo, se publicó un artículo que describe el enriquecimiento de una cepa de 'Candidatus Methanoxibalbensis ujae' en condiciones metanotróficas termófilas52.

Se recolectaron cuatro muestras de roca del campo de respiradero Auka de 3,7 km de profundidad en la cuenca sur de Pescadero (23.956094N, 108.86192W)20,23. La muestra NA091.008 se recolectó en 2017 en el crucero NA091 con el buque de exploración Nautilus y se incubó como se describió anteriormente34. Las muestras 12.019 (S0200-R1), 11.719 (S0193-R2) y 11.868 (S0197-PC1), esta última representa un nódulo litificado recuperado de un núcleo de empuje de sedimentos, se recolectaron con el vehículo operado remotamente SuBastian y el buque de investigación Falkor en el crucero FK181031 en Noviembre de 2018. Estas muestras fueron procesadas a bordo y almacenadas en condiciones anóxicas a 4 °C para su posterior incubación en laboratorio. En el laboratorio, las muestras de roca 12,019 y 11,719 se rompieron en pedazos más pequeños en condiciones estériles, se sumergieron en agua de mar artificial esterilizada rociada con N2 y se incubaron en condiciones anóxicas con metano, como se describió anteriormente para NA091.008 (ref. 34). Se puede encontrar información de muestreo adicional en la Tabla complementaria 1. El análisis mineralógico mediante difracción de rayos X en polvo (XRD) identificó barita en varias de estas muestras, recolectadas en dos ubicaciones en el campo del respiradero de Auka, incluido el lado occidental del respiradero Matterhorn ( 11,719, NA091.008), y una muestra saturada de petróleo (12,019) recuperada de los flancos sedimentados del lado sur del respiradero Z. Nuestro análisis también incluye datos metagenómicos de dos núcleos de sedimentos del campo de respiraderos de Auka (DR750-PC67 y DR750-PC80) recopilados en abril de 2015 con el ROV Doc Ricketts y el R/V Western Flyer (MBARI2015), publicados anteriormente (ref. 23). .

Las muestras se fijaron a bordo utilizando paraformaldehído recién preparado (2 % en volumen en solución tampón fosfato (PBS) 3 ×, EMS15713) a 4 °C durante la noche, se enjuagaron dos veces con PBS 3 × y se almacenaron en etanol (50 % en PBS 1 ×) a −20 °C hasta su procesamiento. Se trituraron suavemente trozos pequeños (<1 cm3) de la muestra mineral NA091.008 en un mortero de ágata estéril y una mano de mortero en una solución de etanol al 80 % – 1 × PBS recién preparada y esterilizada por filtración. Se sonicaron aproximadamente 500 µl de la mezcla resultante tres veces en ráfagas de 15 segundos en un disruptor celular ultrasónico Branson Sonifier W-150 (nivel 3) en hielo con una sonda de micropunta remota estéril insertada en el líquido. Las células se separaron de la matriz mineral mediante un protocolo adaptado de separación por densidad utilizando Percoll (Sigma P4937)7. Las células separadas por densidad se filtraron en filtros de policarbonato de 25 mm con un tamaño de poro de 0,22 μm (Millipore GTTP2500) y se enjuagaron con PBS 1X. Las hibridaciones fluorescentes in situ se llevaron a cabo como se describió anteriormente7 usando una mezcla 1:1 de una sonda dirigida ANME-1 (ANME-1-3509 marcada con Cy3) y la mezcla general de sonda bacteriana EUB338 I-III (https://probebase. csb.univie.ac.at/), etiquetado con Alexa-488 en una solución de formamida al 35% (VWR EM-FX0420-8). Se tomaron imágenes de las muestras hibridadas utilizando un objetivo de × 100 utilizando un microscopio de iluminación estructurada Zeiss Elyra con el software Zen Black.

La extracción de ADN de las muestras minerales siguió protocolos publicados previamente34. El análisis metagenómico del ADN genómico extraído se subcontrató a Quick Biology (Pasadena, CA) para la preparación y secuenciación de la biblioteca. Las bibliotecas se prepararon con el kit KAPA Hyper plus utilizando 10 ng de ADN como entrada. Este insumo se sometió a fragmentación enzimática a 37 °C durante 10 min. Después de la reparación del extremo y la cola A, el ADN se ligó con un adaptador IDT (Integrated DNA Technologies Inc.). El ADN ligado se amplificó con KAPA HiFi HotStart ReadyMix (2x) durante 11 ciclos. La limpieza posterior a la amplificación se realizó con perlas puras KAPA 1X. La calidad y cantidad de la biblioteca final se analizaron y midieron mediante el Agilent Bioanalyzer 2100 (Agilent Technologies) y el fluorómetro Life Technologies Qubit 3.0 (Life Technologies), respectivamente. Finalmente, las bibliotecas se secuenciaron utilizando lecturas de extremos emparejados de 150 pb en el secuenciador Illumina HiSeq4000 (Illumina Inc.). Después de la secuenciación, los cebadores y adaptadores se eliminaron de todas las bibliotecas usando bbduk (https://sourceforge.net/projects/bbmap/) con mink = 6 y hdist = 1 como parámetros de recorte, y estableciendo un valor mínimo de calidad de 20 y un mínimo longitud de 50 pb. Para la secuenciación de nanoporos de muestras incubadas, el ADN se amplificó mediante amplificación por desplazamiento múltiple con el kit QIAGEN REPLI-g Midi antes de la preparación de la biblioteca. Las bibliotecas de secuenciación Oxford Nanopore se construyeron utilizando el kit de códigos de barras sin PCR y fueron secuenciadas en la plataforma PromethION por Novogene Inc.

Las lecturas de secuenciación de rocas no incubadas se ensamblaron individualmente y en conjunto utilizando SPAdes v.3.12.0 (ref. 53). A partir de los ensamblajes de novo, realizamos la agrupación manual utilizando Anvio v.6 (ref. 54). Evaluamos la calidad y la afiliación de taxonomía de los contenedores obtenidos utilizando GTDB-tk v.1.5.0 (ref. 55) y checkM v.1.13 (ref. 56). Los genomas afiliados a ANME-1 y Syntrophoarchaeales se refinaron aún más mediante un proceso de reensamblaje dirigido. En este proceso, las lecturas originales se asignaron al contenedor de interés usando bbmap (https://sourceforge.net/projects/bbmap/), luego las lecturas asignadas se ensamblaron usando SPAdes y el ensamblaje resultante se filtró descartando contigs por debajo de 1500 pb. . Este procedimiento se repitió durante varias rondas (entre 11 y 50) para cada contenedor, hasta que no pudimos ver una mejora en la calidad del contenedor. La calidad del contenedor se evaluó mediante checkM y considerando la integridad, la contaminación (<5%), el valor de N50 y el número de andamios. Los contenedores resultantes se consideraron MAG. Las lecturas de secuenciación para las rocas incubadas 12.019 y 11.719 se ensamblaron como se describió anteriormente para NA091.R00834. Además, el conjunto de 12,019 se fortaleció utilizando lecturas de Nanopore a través de dos iteraciones de LRScaf v.1.1.10 (ref. 57). Los ensamblajes finales se agruparon usando metabat2 v.2.15 (ref. 58) usando la configuración predeterminada. La predicción metabólica automática de los MAG se realizó utilizando prokka v.1.14.6 (ref. 59) y se curó con la identificación de perfiles PFAM y TIGRFAM utilizando HMMER v.3.3 (hmmer.org), ortólogos de KEGG con Kofamscan60 y de COG y arCOG. motivos61. Para identificar citocromos multihemos en nuestros genomas, buscamos el motivo CXXCH en las secuencias de aminoácidos predichas para cada MAG. Se llevaron a cabo predicciones metabólicas similares con genomas ANME-1 y Syntrophoarchaeales disponibles públicamente para comparar el potencial metabólico de todo el orden ANME-1. Se puede encontrar una lista de los genomas utilizados en este estudio en la Tabla complementaria 2. Para comparar diferentes características genómicas entre los genomas ANME-1, buscamos proteínas específicas utilizando los identificadores COG, arCOG y KEGG asignados (Tabla complementaria 5) .

Utilizamos el software coverM v.0.5 (https://github.com/wwood/CoverM) para calcular la abundancia relativa genómica de los diferentes organismos de nuestras muestras, utilizando todos los MAG que hemos extraído de nuestro análisis metagenómico. Ejecutamos el software con los siguientes parámetros adicionales para la dereplicación ('–dereplication-ani 95–dereplication-prethreshold-ani 90–dereplication-precluster-method finch'). Los resultados se visualizaron en R v.4.2.1.

Calculamos el OGT para todos los MAG ANME-1 y Syntrophoarchaeales incluidos en nuestro análisis (Tabla complementaria 2) utilizando la herramienta OGT_prediction descrita en Sauer y Wang24 con los modelos de regresión para Archaea excluyendo las características del ARNr y el tamaño del genoma.

Debido a que sólo dos de los cinco genomas de 'Candidatus Methanospirare jalkutatii' tienen un operón que codifica una hidrogenasa, realizamos análisis adicionales para comprender mejor esta distribución intraespecies. Por un lado, asignamos las lecturas metagenómicas de muestras con genomas de 'Candidatus Methanospirare jalkutatii' (12019, FW4382_bin126, NA091.008, PR1007, PR1031B) a los MAG que contienen el operón hidrogenasa (FW4382_bin126, NA091.008_bin1) para comprobar si Las lecturas que mapean este operón también están presentes en muestras de donde se recuperaron los MAG sin hidrogenasa. Para mapear las lecturas, utilizamos bowtie2 v.2.4.2 (ref. 62), luego transformamos los archivos sam a bam usando samtools (http://www.htslib.org/) y extrajimos la profundidad de cobertura para cada posición. Además, realizamos una comparación genómica de los genomas con un operón hidrogenasa (FW4382_bin126, NA091.008_bin1) con el genoma FWG175 que se ensambló en un único andamio. Para ello, utilizamos el alineador genoma a genoma Sibelia v.3.0.7 (ref. 63) y visualizamos los resultados utilizando Circos (http://circos.ca/).

Para el árbol filogenómico de los MAG ANME-1, utilizamos la lista de genomas presentes en la Tabla complementaria 2. Como genes marcadores, utilizamos 31 genes de copia única (Tabla complementaria 5) que extrajimos y alineamos de los genomas correspondientes usando anvi- obtenga secuencias para hmm-hits de Anvio v.6 (ref. 54) con los parámetros '–return-best-hit–max-num-genes-missing-from-bin 7–partition-file'. Siete genomas omitieron más de siete genes marcadores y no se utilizaron para la reconstrucción filogenómica presente en la Fig. 1 (ANME-1 UWMA-0191, Syntrophoarchaeum GoM_oil, ANME-1 ERB7, ANME-1 Co_bin174, ANME-1 Agg-C03, PB_MBMC_218 , FW4382_bin035). Luego se usó el conjunto de genes marcadores alineados concatenados para calcular un árbol filogenómico con RAxML v.8.2.12 (ref. 64) usando un archivo de partición para calcular modelos diferenciales para cada gen con los siguientes parámetros '-m PROTGAMMAAUTO -fa -N autoMRE - k.' Luego se visualizó el árbol usando iTol65. Para agrupar los MAG en diferentes especies, eliminamos la replicación de los MAG ANME-1 utilizando dRep v.2.6.2 con el parámetro '-S_ani 0.95' (ref. 66). Se calculó un árbol filogenómico más pequeño con los genomas que contienen genes de hidrogenasa (Fig. 3). Para este árbol también utilizamos Anvio v.6 y RAxML v.8.2.12 con los mismos parámetros pero excluyendo el indicador '—max-num-genes-missing-from-bin' de anvi-get-sequences-for-hmm -hits ordena incluir en el análisis aquellos genomas con un menor número de genes marcadores que aún contienen genes de hidrogenasa (PB_MBMC_218, FW4382_bin035, ANME-1 UWMA-0191).

El árbol filogenético del gen 16S rRNA se calculó para los genes 16S rRNA predichos a partir de nuestro conjunto de datos del genoma que eran de longitud completa. Incluimos estos genes de ARNr 16S de longitud completa en la base de datos SILVA_132_SSURef_NR9967 y con ARB v.6.1 (ref.68) calculamos un árbol filogenético 16S utilizando el algoritmo de máxima verosimilitud RAxML con GTRGAMMA como modelo y un filtro de similitud del 50%. En total, se realizaron 1000 análisis bootstrap para calcular los valores de soporte de las sucursales. Se seleccionó el árbol con mayor puntuación de probabilidad.

Para la construcción del árbol filogenético de la hidrogenasa (Tabla complementaria 6), utilizamos la secuencia de proteínas predicha para la subunidad grande de la hidrogenasa NiFe presente en los genomas de nuestro conjunto de datos (Tabla complementaria 2), un subconjunto de las hidrogenasas de subunidades grandes presentes en la base de datos HydDB30 y las hidrogenasas predichas presentes en una base de datos de arqueas utilizando el motivo COG para la gran hidrogenasa NiFe (COG0374) con el software Anvio v.6. Para la filogenia del gen mcrD, utilizamos las secuencias de proteínas predichas de mcrD en los genomas ANME-1c y en la base de datos de arqueas mencionada anteriormente con el motivo TIGR TIGR03260.1 utilizando también el software Anvio v.6. La lista de genomas de la base de datos de arqueas utilizada en el análisis se puede encontrar en la Tabla complementaria 6. Para ambas filogenias, las secuencias de proteínas para el análisis se alinearon utilizando clustalw v.2.1 con la configuración predeterminada69. El archivo alineado se usó para calcular un árbol filogenético usando RAxML v.8.2.12 (ref. 64) con los siguientes parámetros '-m PROTGAMMAAUTO -fa -N 100 –k'. Luego se visualizó el árbol usando iTol65.

Para la distribución y el análisis filogenético de MCP y pPolB, se utilizaron secuencias conocidas codificadas por varios virus bacterianos y arqueales para construir un modelo oculto de Markov (HMM) a través de hmmer v.3.3.2. Luego se utilizó el HMM para capturar los componentes correspondientes en los proteomas de los virus ANME-1 y otros MGE. Luego, todas las secuencias se alinearon usando la opción linsi de MAFFT v.7.475 (ref. 70) y se recortaron usando la opción gappyout trimAl v1.4.1 (ref. 71) para pPolB y la opción de eliminación de espacios del 20% para MCP. Los análisis de máxima verosimilitud se llevaron a cabo a través de IQtree v.2.1.12 (ref. 72) utilizando un buscador de modelos y un arranque ultrarrápido con 2000 réplicas. El árbol filogenético se visualizó y preparó utilizando iTol65.

Para la distribución y el análisis filogenético de ThyX, todas las secuencias de ThyX anotadas por EggNOG mapper73 v.2 en los genomas de ANME-1 y sus MGE se usaron para crear un HMM como se describió anteriormente, y se usaron para buscar homólogos cercanos en la base de datos GTDB202. , base de datos IMGVR V.3 y nuevamente en los proteomas y ANME-1 y sus MGE en este estudio. Esto produjo 261 secuencias, que luego se alinearon y analizaron filogenéticamente como para pPolB.

Los sistemas CRISPR-Cas de los genomas ANME-1 y varios conjuntos metagenómicos se anotaron utilizando CRISPRCasTyper v.1 (ref. 33). El mapeo del espaciador CRISPR en MGE se llevó a cabo como se describió anteriormente34 con las siguientes modificaciones. Para filtrar secuencias no confiables que pueden haber surgido durante la agrupación MAG, tomamos una medida conservadora de retener solo las repeticiones CRISPR identificadas en al menos tres contigs ANME-1. Además, analizamos las repeticiones CRISPR encontradas en el clado hermano Alkanophagales de ANME-1 utilizando el mismo enfoque, que no se superpusieron con las repeticiones CRISPR ANME-1. Para evitar el mapeo accidental a MGE no relacionados, aplicamos un segundo criterio estricto de retener solo MGE con al menos tres protoespaciadores ANME-1. Los MGE de más de 10 kb se conservaron para análisis adicionales en este estudio.

Los marcos de lectura abiertos en todos los contigs MGE mapeados con CRISPR se identificaron utilizando el paquete PATRIC74. Los análisis de redes de similitud genética se realizaron utilizando vCONTACT v.2.0 (ref. 75) utilizando la referencia predeterminada (RefSeq202), con virus con cola de cabeza dirigidos a haloarchaea y metanógenos agregados como referencias adicionales42. Se detectaron repeticiones terminales directas e invertidas utilizando CheckV v.1.01. y el paquete PATRIC para determinar la integridad del genoma. La confianza de agrupamiento se obtuvo con la configuración predeterminada como se describe en la ref. 75, donde el valor de P se obtuvo mediante una prueba U de Mann-Whitney unilateral y la confianza de la topología se obtiene multiplicando el puntaje de calidad del subgrupo y el valor de P.

Los proteomas de MGE se anotan mediante comparaciones sensibles de perfil HMM con HHsearch v.3.3.2 (ref. 76) con las siguientes bases de datos disponibles públicamente: Pfam 33.1, Protein Data Bank (25 de marzo de 2021), CDD v.3.18, PHROG y uniprot_sprot_vir70. (9 de febrero de 2021)77. La supuesta MCP de Chaacviridae e Ixchelviridae no pudo identificarse utilizando enfoques basados ​​en similitud de secuencia. Así, las proteínas candidatas se sometieron a modelado estructural utilizando AlphaFold2 (ref. 38) y RoseTTAFold v.1.1.0 (ref. 39). Los modelos obtenidos se visualizaron utilizando ChimeraX78 y se compararon con la estructura de referencia del MCP del corticovirus PM2 (ID de PDB: 2vvf). Los cóntigos que contienen proteínas estructurales virales identificables se describen como virus. Los contigs restantes se describen como MGE no clasificados, incluidos elementos circulares que probablemente sean plásmidos de ANME-1 y posibles virus envueltos por proteínas estructurales aún desconocidas.

Los genomas virales se anotaron utilizando Prokka v.1.14.6 (ref. 59) para producir archivos genbank. Luego se analizaron archivos genbank seleccionados utilizando Clinker v.0.0.23 (ref. 79) para producir la agrupación y las alineaciones de secuencias de proteínas. La filogenia a escala de proteoma para los virus con cola de cabeza se llevó a cabo a través del servidor VipTree43.

Familia 'Candidatus Methanospirareceae'. Neutro de la Liga Nacional. norte. metano metano; Preferencia de Holanda. metano-, perteneciente al metano; Lv spirare, respirar. Clasificación propuesta: clase Methanomicrobia, orden 'Candidatus Methanophagales'. La especie tipo y la cepa es 'Candidatus Methanospirare jalkutatii' FWG175.

'Candidatus Methanoxibalbensis ujae'. Neutro de la Liga Nacional. norte. metano metano; Preferencia de Holanda. metano-, perteneciente al metano; NL adj. xibalbensis, del lugar llamado Xibalbá, palabra maya para inframundo; Neutro de la Liga Nacional. norte. Methanoxibalbensis organismo cíclico del metano presente en sedimentos hidrotermales de aguas profundas; Neutro de la Liga Nacional. adj. ujae, de la palabra ujá, que significa roca en kiliwa, lengua indígena de los pueblos originarios de Baja California, en referencia a la alta abundancia de esta especie en muestras de rocas. Clasificación propuesta: clase Methanomicrobia, orden 'Candidatus Methanophagales', familia 'Candidatus Methanoxibalbaceae', género 'Candidatus Methanoxibalbensis'.

El tipo de material es el genoma denominado NA091.008_bin2 (GCA_026134085.1), un MAG que comprende 1,99 Mbp en 86 andamios. El MAG se recuperó de una muestra mineral (NA091.008) del ambiente hidrotermal de la Cuenca Sur de Pescadero.

'Candidatus Methanospirare jalkutatii'. Neutro de la Liga Nacional. norte. metano metano; Preferencia de Holanda. metano-, perteneciente al metano; Lv spirare, respirar; Neutro de la Liga Nacional. norte. Metanospirare organismo que respira metano; Masc.NL. norte. jalkutatii, un dragón mítico de las historias del pueblo indígena Pa ipai del norte de Baja California. Este dragón habitaba un hermoso lugar hecho de rocas y agua similar al sitio del respiradero hidrotermal de Auka. Clasificación propuesta: clase Methanomicrobia, orden 'Candidatus Methanophagales', familia 'Candidatus Methanoxibalbaceae', género 'Candidatus Methanospirare'.

El tipo de material es el genoma denominado FWG175 (CP110382.1), un MAG de un solo andamio que comprende 1,62 Mbp en un andamio circular. Este MAG se recuperó de una incubación alimentada con metano de la muestra mineral 12,019 recuperada del ambiente hidrotermal de la Cuenca Sur de Pescadero.

El orden Coyopavirales se propone dentro de la clase existente Tectiliviricetes, en honor a Coyopa, el dios del trueno en la mitología maya. Contiene virus icosaédricos sin cola con una clase de MCP DJR no reportada previamente y poca superposición de proteomas con virus conocidos. La familia Chaacviridae se propone dentro de Coyopavirales, en honor a Chaac, el dios de la muerte en la mitología maya. Se caracteriza por un genoma uniforme de 10 a 11 kb y un gen que codifica la ADN polimerasa de la familia B cebada con proteínas (pPolB). Proponemos los nombres de género Homochaacvirus y Antichaacvirus (de homo, igual en griego, y anti, opuesto en griego, para enfatizar la inversión de un módulo genético que incluye el gen pPolB). Se han obtenido seis genomas completos de chaacvirus: virus Methanophagales PBV304 (OP548099) dentro de la especie Homochaacvirus pescaderoense, virus Methanophagales PBV305 (OP548100) dentro de la especie Homochaacvirus californiaense, virus Methanophagales GBV261, virus Methanophagales GBV265, virus Methanophagales GBV275 y virus Methanophagales PBV266 (OP413841) dentro especie Antichaacvirus pescaderoense. La familia candidata Ixchelviridae se propone dentro de Coyopavirales, en honor a Ix Chel, diosa de la partería y la medicina en la mitología maya. Ixchelviridae está representado por los virus de la cuenca del Pescadero PBV176 y PBV180, y se desconoce la integridad del ensamblaje.

La familia candidata Huracanviridae se propone sin clasificación de nivel superior, después de Hurancán, dios del viento, la tormenta y el fuego en la mitología maya. Contiene virus icosaédricos sin cola con MCP de un solo rollo de gelatina. Está representado por los virus de la Cuenca del Pescadero PBV264 y PBV238, con un ensamblaje completo indeterminado.

El orden Nakonvirales se propone dentro de Caudoviricetes, en honor a Nakon, el dios de la guerra más poderoso de la mitología maya. Contiene virus con cola de cabeza con genomas de alrededor de 80 kb y MCP de 97 veces HK. La familia Ahpuchviridae (después de Ah Puch, el dios de la muerte en la mitología maya) incluye un género, Kisinvirus, (después de Kisin, otro dios maya de la muerte) y está representada por un solo virus, el virus Methanophagales PBV299 (OP413838) dentro de la especie Kisinvirus. pescaderoense. La familia Ekchuahviridae (después de Ek Chuah, el dios patrón de los guerreros y comerciantes en la mitología maya), está representada por un género, Kukulkanvirus (después de Kukulkan, la serpiente de guerra en la mitología maya). Incluye el virus Methanophagales GBV301 (OP880252) dentro de la especie Kukulkanvirus guaymasense y el virus Methanophagales GBV302 (OP880253) dentro de la especie Kukulkanvirus mexicoense, cada uno de los cuales codifica dos MCP divergentes de HK97 veces con sus propias proteasas de maduración de la cápside.

Se proponen otras siete familias candidatas de virus con cola de cabeza sin representantes genómicos completos. Forman un grupo filogenético hermano de los halovirus (Fig. 5a) y, de acuerdo con las clasificaciones filogenéticas de estos últimos, probablemente forman múltiples clados a nivel de orden no clasificados. Estas familias candidatas son Acanviridae, Alomviridae, Bacabviridae, Baalhamviridae, Cabrakanviridae, Cacochviridae y Chiccanviridae, todas con nombres de dioses de la mitología maya.

El orden Maximonvirales se propone dentro de Tokiviricetes, en honor a Maximón, un dios de los viajeros, comerciantes, curanderos, travesuras y fertilidad en la mitología maya. Contiene virus en forma de bastón de una sola familia Ahmunviridae (después de Ah Mun, el dios de la agricultura en la mitología maya) con un solo género Yumkaaxvirus (después de Yum Kaax, el dios de los bosques, la naturaleza salvaje y la caza en la mitología maya) . Está representado por el genoma lineal completo del virus Methanophagales PBV300 (OP413840) dentro de la especie Yumkaaxvirus pescaderoense.

La familia Itzamnaviridae lleva el nombre de Itzamná, señor de los cielos y de la noche y el día en la mitología maya. Contiene virus con forma de huso que difieren en el tamaño del genoma y se subdividen en dos géneros, que proponemos denominar Demiitzamnavirus y Pletoitzamnavirus (después de demi- para mitad o parcial, derivado en francés del latín dimedius y pleto para completo en latín). Están representados respectivamente por genomas completos del virus Methanophagales GBV170 dentro de la especie Demiitzamnavirus guaymasense, el virus Methanophagales GBV303 (OP880254) dentro de la especie Demiitzamnavirus mexicoense y el virus Methanophagales PBV082 (OP413839) dentro de la especie Pletoitzamnavirus pescaderoense.

Se proponen familias candidatas Tepeuviridae y Votanviridae, que llevan el nombre de un dios skye, Tepeu, y de una deidad ancestral legendaria, Votan, respectivamente, para dos nuevos clados adicionales de virus con forma de huso. Sus representantes genómicos, Tepeuvirus PBV144 y Votanvirus IMGVR0294848, aún no están circularizados y, por tanto, están incompletos.

Más información sobre el diseño de la investigación está disponible en el Resumen del informe de Nature Portfolio vinculado a este artículo.

Las lecturas de metagenomas sin procesar, los contenedores de metagenomas ensamblados y los datos de secuencias de virus están disponibles en la base de datos del NCBI con los números de acceso de BioProject PRJNA875076 y PRJNA721962. Los genomas completos del virus ANME-1 que representan nuevos taxones virales se pueden encontrar en GenBank con los números de acceso OP413838, OP413839, OP413840, OP413841, OP548099, OP548100, OP880252, OP880253 y OP880254. Las secuencias espaciadoras CRISPR de ANME-1 y todas las secuencias genómicas de ANME-1 MGE también se proporcionan como datos complementarios. Para el análisis genómico del virus, en este estudio se utilizaron las siguientes bases de datos: Protein Data Bank (es decir, la principal proteína de la cápside del fago PM2, PDB id: 2vvf; https://www.rcsb.org/structure/2vvf), CDD v3. 18, PHROG (https://phrogs.lmge.uca.fr/) y uniprot_sprot_vir70 (02/09/2021).

Reeburgh, WS Biogeoquímica del metano oceánico. Química. Rev. 107, 486–513 (2007).

Artículo CAS Google Scholar

Chadwick, GL y cols. La genómica comparada revela la transferencia de electrones y los mecanismos sintróficos que diferencian las arqueas metanotróficas y metanogénicas. PLoS Biol. 20, e3001508 (2022).

Artículo de Google Scholar

Wegener, G., Laso-Perez, R., Orphan, VJ y Boetius, A. Degradación anaeróbica de alcanos por arqueas marinas. Año. Rev. P. Microbiol. Rev. 76, 553–577 (2022).

Artículo de Google Scholar

Grite, T. y col. Oxidación anaeróbica termófila de metano por consorcios de microbios marinos. ISME J. 5, 1946 (2011).

Artículo CAS Google Scholar

Orphan, VJ, House, CH, Hinrichs, K.-U., McKeegan, KD y DeLong, EF Múltiples grupos de arqueas median la oxidación de metano en sedimentos anóxicos de filtración fría. Proc. Acad. Nacional. Ciencia. 99, 7663–7668 (2002).

Artículo CAS Google Scholar

Knittel, K. & Boetius, A. Oxidación anaeróbica del metano: progreso con un proceso desconocido. Año. Rev. Microbiol. 63, 311–334 (2009).

Artículo CAS Google Scholar

McGlynn, SE, Chadwick, GL, Kempes, CP y Orphan, VJ La actividad unicelular revela transferencia directa de electrones en consorcios metanotróficos. Naturaleza 526, 531 (2015).

Artículo CAS Google Scholar

Krukenberg, V. y col. Expresión génica y ultraestructura de consorcios metanotróficos meso y termófilos. Reinar. Microbiol. 20, 1651-1666 (2018).

Artículo CAS Google Scholar

Knittel, K., Lösekann, T., Boetius, A., Kort, R. y Amann, R. Diversidad y distribución de arqueas metanotróficas en filtraciones frías. Aplica. Aprox. Microbiol. Rev. 71, 467–479 (2005).

Artículo CAS Google Scholar

House, CH y cols. Amplia heterogeneidad isotópica de carbono entre la microbiota de filtración de metano. Reinar. Microbiol. 11, 2207–2215 (2009).

Artículo CAS Google Scholar

Biddle, JF y cols. Oxidación anaeróbica de metano a diferentes regímenes de temperatura en sedimentos hidrotermales de la Cuenca de Guaymas. ISME J. 6, 1018 (2011).

Artículo de Google Scholar

Kevorkian, RT, Callahan, S., Winstead, R. & Lloyd, KG Las arqueas ANME-1 pueden impulsar la acumulación y eliminación de metano en los sedimentos estuarinos. Reinar. Microbiol. Representante 13, 185-194 (2021).

Artículo CAS Google Scholar

Nauhaus, K., Boetius, A., Krüger, M. y Widdel, F. Demostración in vitro de oxidación anaeróbica de metano acoplada a reducción de sulfato en sedimentos de un área de hidratos de gas marino. Reinar. Microbiol. 4, 296–305 (2002).

Artículo CAS Google Scholar

Wegener, G., Krukenberg, V., Ruff, SE, Kellermann, MY y Knittel, K. Capacidades metabólicas de los microorganismos involucrados y asociados con la oxidación anaeróbica del metano. Frente. Microbiol. 7, 46 (2016).

Artículo de Google Scholar

Li, Z. y col. Los sedimentos de aguas profundas asociados con filtraciones frías son un reservorio subterráneo de diversidad viral. ISME J. 15, 2366–2378 (2021).

Artículo CAS Google Scholar

Paul, BG y cols. Generación de diversidad dirigida por arqueas intraterrestres y virus de arqueas. Nat. Comunitario. 6, 6585 (2015).

Artículo CAS Google Scholar

Wang, F. y col. Los virus de arqueas con forma de huso evolucionaron a partir de ancestros con forma de bastón para empaquetar un genoma más grande. Celda 185, 1297–1307.e11 (2022).

Artículo CAS Google Scholar

Zimmerman, AE y cols. Consecuencias metabólicas y biogeoquímicas de la infección viral en ecosistemas acuáticos. Nat. Rev. Microbiol. 18, 21–34 (2020).

Artículo CAS Google Scholar

Danovaro, R. et al. Hecatombe de arqueas mediada por virus en las profundidades del fondo marino. Ciencia. Adv. 2, e1600492 (2016).

Artículo de Google Scholar

Paduan, JB y cols. Descubrimiento de campos de respiraderos hidrotermales en la elevación de Alarcón y en la cuenca sur de Pescadero, Golfo de California. Geoquímica. Geofís. Geosistema. 19, 4788–4819 (2018).

Artículo de Google Scholar

Laso-Pérez, R. et al. Las arqueas termófilas activan el butano mediante la formación de alquil-coenzima M. Naturaleza 539, 396 (2016).

Artículo de Google Scholar

Dombrowski, N., Teske, AP y Baker, BJ Amplia versatilidad metabólica microbiana y biodiversidad en sedimentos hidrotermales dinámicos de la cuenca de Guaymas. Nat. Comunitario. 9, 4999 (2018).

Artículo de Google Scholar

Speth, DR y cols. Las comunidades microbianas de los sedimentos hidrotermales de Auka arrojan luz sobre la biogeografía de los respiraderos y la historia evolutiva de la termofilia. ISME J. 16, 1750–1764 (2022).

Artículo CAS Google Scholar

Sauer, DB y Wang, D.-N. Predecir las temperaturas óptimas de crecimiento de procariotas utilizando únicamente características derivadas del genoma. Bioinformática 35, 3224–3231 (2019).

Artículo CAS Google Scholar

Sabath, N., Ferrada, E., Barve, A. y Wagner, A. La temperatura de crecimiento y el tamaño del genoma en bacterias están correlacionados negativamente, lo que sugiere una racionalización genómica durante la adaptación térmica. Genoma Biol. Evolución 5, 966–977 (2013).

Artículo de Google Scholar

Ermler, U., Grabarse, W., Shima, S., Goubeaud, M. y Thauer, RK Estructura cristalina de la metil-coenzima M reductasa: la enzima clave de la formación biológica de metano. Ciencia 278, 1457-1462 (1997).

Artículo CAS Google Scholar

Prakash, D., Wu, Y., Suh, S.-J. & Duin, EC Aclaración del proceso de activación de la metil-coenzima M reductasa. J. Bacteriol. Rev. 196, 2491–2498 (2014).

Artículo de Google Scholar

Zheng, K., Ngo, PD, Owens, VL, Yang, X.-P. & Mansoorabadi, SO La vía biosintética de la coenzima F430 en arqueas metanogénicas y metanotróficas. Ciencia 354, 339–342 (2016).

Artículo CAS Google Scholar

Beulig, F., Røy, H., McGlynn, S. & Jørgensen, B. Ciclo críptico de CH4 en la transición sulfato-metano de sedimentos marinos aparentemente mediado por arqueas ANME-1. ISME J. 296, 10.1038 (2018).

Søndergaard, D., Pedersen, CNS & Greening, C. HydDB: una herramienta web para la clasificación y análisis de hidrogenasas. Ciencia. Representante 6, 34212–34212 (2016).

Artículo de Google Scholar

Bertram, S. y col. Capacidades metanogénicas de ANME-archaea deducidas de enfoques de etiquetado con 13C. Reinar. Microbiol. 15, 2384–2393 (2013).

Artículo CAS Google Scholar

He, X., Chadwick, GL, Kempes, CP, Orphan, VJ & Meile, C. Controles sobre el transporte de electrones entre especies y limitación del tamaño de consorcios microbianos anaeróbicamente oxidantes de metano. mBio 12, e03620 – e03620 (2021).

Artículo CAS Google Scholar

Russel, J., Pinilla-Redondo, R., Mayo-Muñoz, D., Shah, SA & Sørensen, SJ CRISPRCasTyper: identificación, anotación y clasificación automatizadas de loci CRISPR-Cas. CRISPR J. 3, 462–469 (2020).

Artículo CAS Google Scholar

Wu, F. y col. Elementos móviles únicos y flujo de genes escalable en el límite procariota-eucariota revelados por genomas circularizados de arqueas de Asgard. Nat. Microbiol. 7, 200–212 (2022).

Artículo CAS Google Scholar

Roux, S. y col. IMG/VR v3: un marco ecológico y evolutivo integrado para interrogar genomas de virus no cultivados. Ácidos nucleicos res. 49, D764–D775 (2021).

Artículo CAS Google Scholar

Koonin, EV y cols. Organización global y propuesta de megataxonomía del mundo de los virus. Microbiol. Mol. Biol. Rev.84, e00061–19 (2020).

Artículo CAS Google Scholar

Krupovič, M. et al. Adnaviria: un nuevo ámbito para los virus filamentosos de arqueas con genomas de ADN bicatenario en forma de a lineal. J. Virol. 95, e00673–21 (2021).

Artículo CAS Google Scholar

Saltador, J. et al. Predicción de estructura de proteínas de alta precisión con AlphaFold. Naturaleza 596, 583–589 (2021).

Artículo CAS Google Scholar

Baek, M. y col. Predicción precisa de estructuras e interacciones de proteínas utilizando una red neuronal de tres vías. Ciencia 373, 871–876 (2021).

Artículo CAS Google Scholar

Medvedeva, S. y cols. Tres familias de virus de arqueas de Asgard identificadas en genomas ensamblados en metagenomas. Nat. Microbiol. 7, 962–973 (2022).

Artículo CAS Google Scholar

Tamarit, D. et al. Un cromosoma cerrado de Odinarchaeum expone los virus arqueales de Asgard. Nat. Microbiol. 7, 948–952 (2022).

Artículo CAS Google Scholar

Liu, Y. et al. Diversidad, taxonomía y evolución de virus de arqueas de la clase Caudoviricetes. PLoS Biol. 19, e3001442 (2021).

Artículo de Google Scholar

Nishimura, Y. et al. ViPTree: el servidor de árboles proteómicos virales. Bioinformática 33, 2379–2380 (2017).

Artículo CAS Google Scholar

Dowell, F. y col. Comunidades microbianas en sedimentos hidrotermales ricos en metano y alcanos de cadena corta de la cuenca de Guaymas. Frente. Microbiol. 7, 17 (2016).

Artículo de Google Scholar

Fokine, A. y col. Las similitudes estructurales y funcionales entre las proteínas de la cápside de los bacteriófagos T4 y HK97 apuntan a una ascendencia común. Proc. Acad. Nacional. Ciencia. 102, 7163–7168 (2005).

Artículo CAS Google Scholar

Wang, F. y col. Las estructuras de los virus filamentosos que infectan arqueas hipertermófilas explican la estabilización del ADN en ambientes extremos. Proc. Acad. Nacional. Ciencia. 117, 19643–19652 (2020).

Artículo CAS Google Scholar

Baquero, DP et al. Nuevos virus aislados de ambientes hidrotermales italianos subrayan el patrón biogeográfico en las comunidades de virus arqueales. ISME J. 14, 1821–1833 (2020).

Artículo CAS Google Scholar

Kazlauskas, D., Krupovic, M., Guglielmini, J., Forterre, P. y Venclovas, Č. Diversidad y evolución de las ADN polimerasas de la familia B. Ácido nucleico. Res. 48, 10142–10156 (2020).

Artículo CAS Google Scholar

Graziani, S. y col. Mecanismo catalítico y estructura de la timidilato sintasa viral dependiente de flavina ThyX. J. Biol. Química. 281, 24048–24057 (2006).

Artículo CAS Google Scholar

Dennehy, JJ Ecología evolutiva de la aparición de virus. Ana. Académico de Nueva York. Ciencia. 1389, 124-146 (2017).

Artículo de Google Scholar

Goldbeck, O., Eck, AW y Seibold, GM Monitoreo en tiempo real de las concentraciones de NADPH en Corynebacterium glutamicum y Escherichia coli a través del sensor mBFP codificado genéticamente. Frente. Microbiol. 9, 2564 (2018).

Artículo de Google Scholar

Benito Merino, D., Zehnle, H., Teske, A. y Wegener, G. Las arqueas ANME-1c de ramificación profunda crecen en el límite de temperatura superior de la oxidación anaeróbica del metano. Frente. Microbiol. 13, 988871 (2022).

Artículo de Google Scholar

Bankevich, A. y cols. SPAdes: un nuevo algoritmo de ensamblaje del genoma y sus aplicaciones a la secuenciación unicelular. J. Computat. Biol. 19, 455–477 (2012).

Artículo CAS Google Scholar

Eren, AM y cols. Multiómicas reproducibles, integradas y lideradas por la comunidad con anvi'o. Nat. Microbiol. 6, 3–6 (2021).

Artículo CAS Google Scholar

Chaumeil, P.-A., Mussig, AJ, Hugenholtz, P. & Parks, DH GTDB-Tk: un conjunto de herramientas para clasificar genomas con la base de datos de taxonomía del genoma. Bioinformática 36, ​​1925-1927 (2020).

CAS Google Académico

Parks, DH, Imelfort, M., Sknnerton, CT, Hugenholtz, P. & Tyson, GW CheckM: evaluación de la calidad de los genomas microbianos recuperados de aislados, células individuales y metagenomas. Genoma Res. 25, 1043-1055 (2015).

Artículo CAS Google Scholar

Qin, M. y col. LRScaf: mejora de los borradores de genomas mediante lecturas largas y ruidosas. BMC Genomics 20, 955 (2019).

Artículo CAS Google Scholar

Kang, DD y cols. MetaBAT 2: un algoritmo de agrupamiento adaptativo para una reconstrucción genómica sólida y eficiente a partir de ensamblajes de metagenomas. PeerJ 7, e7359 (2019).

Artículo de Google Scholar

Seemann, T. Prokka: anotación rápida del genoma procariótico. Bioinformática 30, 2068–2069 (2014).

Artículo CAS Google Scholar

Aramaki, T. y col. KofamKOALA: asignación de KEGG Ortholog basada en el perfil HMM y el umbral de puntuación adaptativa. Bioinformática 36, ​​2251–2252 (2020).

Artículo CAS Google Scholar

Meereis, F. & Kaufmann, M. Ampliación de las bases de datos COG y arCOG mediante secuencias de aminoácidos y nucleótidos. BMC Bioinf. 9, 479 (2008).

Artículo de Google Scholar

Langmead, B. & Salzberg, SL Alineación rápida de lectura entre espacios con Bowtie 2. Nat. Métodos 9, 357–359 (2012).

Artículo CAS Google Scholar

Minkin, I., Patel, A., Kolmogorov, M., Vyahhi, N. y Pham, S. en Algoritmos en bioinformática (eds Darling A. y Stoye, J.) 215–229 (Springer Berlin Heidelberg, 2013).

Stamatakis, A. RAxML versión 8: una herramienta para el análisis filogenético y el posanálisis de grandes filogenias. Bioinformática 30, 1312-1313 (2014).

Artículo CAS Google Scholar

Letunic, I. & Bork, P. Interactive Tree Of Life (iTOL) v4: actualizaciones recientes y nuevos desarrollos. Ácidos nucleicos res. 47, W256–W259 (2019).

Artículo CAS Google Scholar

Olm, MR, Brown, CT, Brooks, B. & Banfield, JF dRep: una herramienta para comparaciones genómicas rápidas y precisas que permite una mejor recuperación del genoma a partir de metagenomas mediante la desreplicación. ISME J. 11, 2864–2868 (2017).

Artículo CAS Google Scholar

Quast, C. y col. El proyecto de base de datos de genes de ARN ribosómico SILVA: procesamiento de datos mejorado y herramientas basadas en web. Ácidos nucleicos res. 41, D590-D596 (2013).

Artículo CAS Google Scholar

Ludwig, W. y col. ARB: un entorno de software para datos de secuencia. Ácido nucleico. Res. 32, 1363-1371 (2004).

Artículo CAS Google Scholar

Larkin, MA y cols. Clustal W y Clustal X versión 2.0. Bioinformática 23, 2947–2948 (2007).

Artículo CAS Google Scholar

Nakamura, T., Yamada, KD, Tomii, K. y Katoh, K. Paralelización de MAFFT para alineamientos de secuencias múltiples a gran escala. Bioinformática 34, 2490–2492 (2018).

Artículo CAS Google Scholar

Capella-Gutiérrez, S., Silla-Martínez, JM & Gabaldón, T. trimAl: una herramienta para el recorte de alineación automatizado en análisis filogenéticos a gran escala. Bioinformática 25, 1972-1973 (2009).

Artículo de Google Scholar

Nguyen, L.-T., Schmidt, HA, von Haeseler, A. & Minh, BQ IQ-TREE: un algoritmo estocástico rápido y eficaz para estimar filogenias de máxima verosimilitud. Mol. Biol. Evolución 32, 268–274 (2015).

Artículo CAS Google Scholar

Huerta-Cepas, J. et al. eggNOG 5.0: un recurso de ortología jerárquico, funcional y filogenéticamente anotado basado en 5090 organismos y 2502 virus. Ácido nucleico. Res. 47, D309–D314 (2019).

Artículo CAS Google Scholar

Davis, JJ y cols. El Centro de recursos de bioinformática PATRIC: ampliando las capacidades de análisis y datos. Ácido nucleico. Res. 48, D606–D612 (2020).

CAS Google Académico

Bin Jang, H. y col. La asignación taxonómica de genomas de virus procarióticos no cultivados es posible mediante redes de intercambio de genes. Nat. Biotecnología. 37, 632–639 (2019).

Artículo de Google Scholar

Steinegger, M. y col. HH-suite3 para una rápida detección remota de homologías y una anotación profunda de proteínas. BMC Bioinf. 20, 473 (2019).

Artículo de Google Scholar

Gabler, F. y col. Análisis de secuencia de proteínas utilizando el kit de herramientas de bioinformática MPI. actual. Protocolo. Bioinformación. 72, e108 (2020).

Artículo CAS Google Scholar

Pettersen, EF y cols. UCSF ChimeraX: visualización de estructuras para investigadores, educadores y desarrolladores. Ciencia de las proteínas. 30, 70–82 (2021).

Artículo CAS Google Scholar

Gilchrist, CLM & Chooi, YH Clinker & clustermap.js: generación automática de cifras de comparación de grupos de genes. Bioinformática 37, 2473–2475 (2021).

Artículo CAS Google Scholar

Descargar referencias

Agradecemos a G. Chadwick, H. Yu, R. Murali y A. Philosof por la discusión, A. Narayanan por la preparación de la biblioteca de secuenciación, S. Connon por el soporte técnico y S. Roux y A. Teske por la presentación de documentos relacionados con IMG/VR. datos. . . . Estamos en deuda con los equipos científicos y los científicos codirectores D. Caress (MBARI), R. Zierenberg (UC Davis), las tripulaciones del R/V Falkor (crucero FK181031) y el E/V Nautilus (crucero NA091), SuBastian y Hercules. También agradecemos a R. Speltz (Universidad Autónoma de Baja California) por su consulta sobre la denominación de especies del idioma Kiliwa. Los permisos de recolección de muestras para FK181031 (25 de julio de 2018) fueron otorgados por la Dirección General de Ordenamiento Pesquero y Acuícola, Comisión Nacional de Acuacultura y Pesca (CONAPESCA: Permiso de Promoción de Pesca No. PPFE/DGOPA-200/18) y la Dirección General de Geografía y Medio Ambiente, Instituto Nacional de Estadística y Geografía (INEGI: Autorización EG0122018), con la Nota Diplomática asociada número 18-2083 (CTC/07345/18) de la Secretaría de Relaciones Exteriores, Agencia Mexicana de Cooperación Internacional para el Desarrollo y Dirección General de Asuntos Técnicos y Cooperación científica. El permiso de recolección de muestras para el crucero NA091 (18 de abril de 2017) fue obtenido por Ocean Exploration Trust con el número de permiso EG0072017. Esta investigación utilizó muestras proporcionadas por el Programa de Exploración Nautilus del Ocean Exploration Trust, crucero NA091. El E/V Nautlius es operado por Ocean Exploration Trust, y el crucero NA091 cuenta con el apoyo de la Fundación Dalio y el Instituto Oceanográfico Woods Hole. La financiación para este trabajo fue proporcionada por subvenciones del Centro STC para Investigaciones de la Biosfera de Energía Oscura de la Fundación Nacional de Ciencias, la Fundación NOMIS y el Departamento de Energía de EE. UU. con el número de premio DE-SC0020373 a VJO. Este trabajo también fue apoyado por la Deutsche Forschungsgemeinschaft (Alemania). Research Foundation) en el marco de la Iniciativa/Estrategia de Excelencia Alemana (EXC-2077-390741603 RL-P. y VJO). MK recibió el apoyo de la subvención ANR-20-CE20-0009-02 de la Agencia Nacional de Investigación. FW fue apoyado en parte por el premio Rubicon 019.162LW.037 del Consejo Holandés de Investigación, la beca a largo plazo del Programa Científico de Fronteras Humanas LT000468/2017 y una subvención inicial de PI independiente de ZJU-HIC. Este informe fue preparado como un relato del trabajo patrocinado por una agencia del gobierno de los Estados Unidos. Ni el Gobierno de los EE. UU., ninguna agencia del mismo ni ninguno de sus empleados ofrecen ninguna garantía, expresa o implícita, ni asumen ninguna responsabilidad legal por la exactitud, integridad o utilidad de cualquier información, aparato, producto o proceso divulgado para su uso. no infringiría derechos de propiedad privada. La referencia aquí a cualquier producto, proceso o servicio comercial específico por nombre comercial, marca registrada, fabricante o de otro modo no necesariamente constituye o implica su respaldo, recomendación o favor por parte del gobierno de los EE. UU. o cualquier agencia del mismo. Los puntos de vista y opiniones de los autores expresados ​​en este documento no necesariamente expresan ni reflejan los del gobierno de los EE. UU. o cualquier agencia del mismo.

Financiamiento de acceso abierto proporcionado por la Biblioteca Estatal y Universitaria de Bremen.

Rafael Laso-Pérez

Present address: Systems Biology Department, Centro Nacional de Biotecnología (CNB-CSIC), Madrid, Spain

Carretera R. Speth

Dirección actual: Instituto Max-Planck de Microbiología Marina, Bremen, Alemania

Contribuyeron igualmente los siguientes autores: Rafael Laso-Pérez, Fabai Wu.

MARUM, Centro de Ciencias Ambientales Marinas y Departamento de Geociencias, Universidad de Bremen, Bremen, Alemania

Rafael Laso-Pérez

Centro Mundial de Innovación Científica y Tecnológica ZJU-Hangzhou, Hangzhou, China

Fabai Wu y Kehan ​​Zhao

Ocean College, Universidad de Zhejiang, Zhoushan, China

Fabai Wu

Laboratorio Donghai, Zhoushan, China

Fabai Wu

División de Ciencias Geológicas y Planetarias, Instituto de Tecnología de California, Pasadena, CA, EE. UU.

Fabai Wu, Anthony Cremier, John S. Magyar y Victoria J. Orphan

División de Biología e Ingeniería Biológica, Instituto de Tecnología de California, Pasadena, CA, EE. UU.

Dan R. Speth y Victoria J. Huérfano

Instituto Pasteur, Universidad Paris Cité, CNRS UMR6047, Unidad de Virología Arqueológica, París, Francia

Mart Krupovic

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

RL-P., FW, AC y VJO conceptualizaron y diseñaron el estudio. DRS, VJO y JSM participaron en la expedición oceanográfica y recuperaron y procesaron las muestras originales. AC y FW llevaron a cabo incubaciones de rocas y microscopía de hibridación in situ de fluorescencia. RL-P., FW y AC realizaron la extracción de ADN. RL-P. y FW realizó ensamblaje y análisis metagenómico. FW realizó el descubrimiento de mobilomas basado en CRISPR. MK y FW realizaron análisis de virus. KZ organizó y catalogó datos de virus. RL-P., FW, MK y VJO escribieron el manuscrito con contribuciones de todos los coautores.

Correspondencia a Rafael Laso-Pérez, Fabai Wu, Mart Krupovic o Victoria J. Orphan.

Los autores declaran no tener conflictos de intereses.

Nature Microbiology agradece a Brett Baker y Felipe Hernandes Coutinho por su contribución a la revisión por pares de este trabajo.

Nota del editor Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

El sombreado de color resalta los tres grupos principales de arqueas ANME-1. Las barras moradas indican las secuencias del gen 16S rRNA recuperadas de los MAG que se muestran en la Fig. 1. Las secuencias recuperadas de los MAG de Pescadero están en negrita. Los valores de Bootstrap superiores al 50% se indican con un círculo negro. La barra de escala indica el número de sustituciones de nucleótidos por sitio.

Cada punto y número representa los valores promedio para un género/especie ANME (ver Tabla complementaria 2), excepto en el caso de Syntrophoarchaeales y Alkanophagales donde el punto representa los valores promedio para todo el clado. El color indica la taxonomía correspondiente. La línea de puntos indica el modelo de regresión (R2 = 0,3858).

Los círculos negros indican valores de soporte de arranque superiores al 70%. La barra de escala representa el número de sustituciones de aminoácidos por sitio.

Los contigs correspondientes a los genomas de consulta (NA091.008, FW4382_bin126) están marcados en verde y el andamio del genoma de FWG175 está en naranja. El contig que contiene el operón hidrogenasa se muestra en violeta y las secciones de homología correspondientes entre los genomas de referencia y de consulta se resaltan en azul. La región entre estas secciones de homología corresponde al operón hidrogenasa que no fue detectado en el genoma FWG175.

El sombreado verde y azul indica la identidad taxonómica del ANME-1 MAG que contiene la hidrogenasa correspondiente. Los círculos negros indican valores de soporte de arranque superiores al 70%. La barra de escala representa el número de sustituciones de aminoácidos por sitio.

(a) Características CRISPR/Cas en los dos MAG ANME-1c más contiguos caracterizados utilizando CCtyper. Las barras negras indican matrices CRISPR. ( b ) Longitudes de contig de todos los elementos genéticos móviles (MGEs) ANME-1 encontrados en este estudio. Tenga en cuenta que la longitud del contig no necesariamente indica que esté completo, ya que IMG/VR v.3 está más enriquecido con virus con cola de cabeza (con genomas de hasta 80 kb), mientras que los contig obtenidos directamente de los ensamblajes metagenómicos de la cuenca Pescadero/Guaymas contienen muchos virus icosaédricos sin cola cuyos Los genomas tienen un tamaño de alrededor de 10 kb. (c) Distribución de protoespaciadores dentro de los elementos móviles ANME-1 encontrados en las cuencas de S. Pescadero y Guaymas.

Las redes de intercambio de genes producidas a través de vCONTACT2 indican que todos los elementos genéticos móviles ANME-1 (magenta) se distinguen bien de los virus haloarqueales conocidos, o halovirus, (azul) y otros virus con huéspedes conocidos (naranja).

A la derecha: azul, familias de virus ANME-1; familias de virus haloarqueales negros. Las MCP de genomas completos de virus ANME-1 se indican en azul y sus respectivas familias en negrita.

Los colores indican aquí familias de proteínas codificadas por al menos 2 genomas virales representativos. El gris indica proteínas únicas sin homólogos aparentes. Las barras de escala para puntuaciones de identidad de proteínas y tamaños de genoma se indican en la parte inferior. Los nombres y tamaños de los contig virales se indican en el lado izquierdo y sus respectivos apellidos se indican en el derecho.

a, la filogenia sin raíces sugiere que ANME-1 thyX puede haber evolucionado a partir de genes thyX originados en virus ANME-1. Se resaltan las dos versiones de ThyX en el contenedor ANME-1c B22_G9. b, Distribución del gen ThyX en varios virus fusiformes indicados en la red de intercambio de genes. c, Alineación de secuencia que muestra la conservación y variación del contenido genético alrededor del gen thyX en los genomas de virus fusiformes.

Breve discusión de algunos de los resultados del artículo: características metabólicas de ANME-1c y genes virales.

12 Tablas Suplementarias con información adicional.

Archivo Fasta que contiene las secuencias espaciadoras CRISPR encontradas en este estudio.

Archivo Fasta que contiene MGE específicos de ANME-1 de las cuencas de Guaymas y Pescadero.

Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado a los autores originales y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Laso-Pérez, R., Wu, F., Crémière, A. et al. Diversificación evolutiva de las arqueas metanotróficas ANME-1 y su viroma expansivo. Nat Microbiol 8, 231–245 (2023). https://doi.org/10.1038/s41564-022-01297-4

Descargar cita

Recibido: 13 de junio de 2022

Aceptado: 29 de noviembre de 2022

Publicado: 19 de enero de 2023

Fecha de emisión: febrero de 2023

DOI: https://doi.org/10.1038/s41564-022-01297-4

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt

Microbiología de la naturaleza (2023)

COMPARTIR