Renouvellement des
chromosomes sexuels chez la tribu des cichlidés du lac Tanganyika
Tropheini (Teleostei : Cichlidae )
.Publié
:
Kristen A. Behrens ,
Holger Zimmermann , Radim Blažek , Martin Reichard , Stephan Koblmüller &
Thomas D. Kocher
.
Le remplacement des chromosomes sexuels est fréquent chez
de nombreux clades de vertébrés, notamment les poissons, les grenouilles
et les lézards. Afin de comprendre les mécanismes responsables du
renouvellement des chromosomes sexuels et les premiers stades de la
divergence des chromosomes sexuels, il est nécessaire d'étudier les
lignées dont les chromosomes sexuels ont évolué récemment. Nous
examinons ici l'évolution des chromosomes sexuels chez un groupe de
cichlidés africains (tribu
Tropheini)
dont la divergence a commencé il y a moins de 4 millions d'années. Nous
disposons de preuves de l'existence d'un système de chromosomes sexuels
jusqu'alors inconnu, ainsi que des indications préliminaires de
plusieurs autres systèmes non signalés auparavant dans ce groupe. Nous
constatons une fréquence élevée de renouvellement des chromosomes
sexuels et estimons qu'il y en a au moins 14 dans cette tribu. Nous
datant l'origine du système de détermination du sexe le plus courant
dans cette tribu (XY-LG5/19) près de la base de l'un des deux principaux
sous-clades de cette tribu, il y a environ 3,4 millions d'années. Enfin,
nous observons une variation de la taille d'une région de détermination
du sexe, suggérant une évolution indépendante des strates évolutives
chez les espèces partageant un système de détermination du sexe. Nos
résultats mettent en lumière le taux rapide de renouvellement des
chromosomes sexuels dans la tribu
Tropheini
et ouvrent la voie à de nouvelles études sur la dynamique de l’évolution
des chromosomes sexuels dans ce groupe.
.
Les premières méthodes de
caractérisation des chromosomes sexuels utilisaient des approches
cytologiques qui ne permettaient d'identifier que les chromosomes
sexuels hautement différenciés 1 , 2 , 3 et 4. Les systèmes de
chromosomes sexuels étaient donc initialement classés selon la
morphologie de la paire de chromosomes sexuels. La disponibilité de
techniques peu coûteuses de séquençage du génome a permis d'identifier
des paires de chromosomes sexuels qui ne présentent pas de différences
morphologiques manifestes. Il s'agit souvent de chromosomes sexuels
jeunes qui n'ont pas encore suffisamment divergé pour être considérés
comme hétéromorphes. La même terminologie XY ou ZW peut être utilisée
pour ces chromosomes sexuels homomorphes. Les systèmes hétérogamétiques
mâles sont appelés XY et les systèmes hétérogamétiques femelles ZW.
De nouveaux allèles déterminant le
sexe apparaissant dans une population peuvent initier une transition
vers un nouveau chromosome sexuel 5 , 6 , 7 , 8. Le taux de
renouvellement des chromosomes sexuels est très variable selon les
lignées. À quelques exceptions près, comme le rat épineux 9 , il n'y a
pas eu de renouvellement des chromosomes sexuels chez les mammifères ou
les oiseaux thériens au cours des 100 à 180 derniers millions d'années
10 , 11. En revanche, des groupes tels que les poissons et les reptiles
squamates présentent une fréquence élevée de tels renouvellements 12 ,
13 , 14. La raison pour laquelle certains organismes connaissent des
taux de renouvellement élevés alors que d'autres n'en connaissent pas
reste une question sans réponse 15. Les hypothèses sur les mécanismes
évolutifs favorisant le renouvellement des chromosomes sexuels
comprennent la sélection sexuellement antagoniste 16 , 17 ,
l'accumulation de mutations délétères 18 , 19 et la dérive génétique 20
. Distinguer ces mécanismes de manière empirique s’est avéré difficile
et nécessitera la découverte et la caractérisation des chromosomes
sexuels chez d’autres espèces.
Chez de nombreuses espèces, la
région chromosomique immédiatement adjacente au locus déterminant le
sexe présente une réduction de la recombinaison. Cette région liée au
sexe peut s'étendre au fil du temps par suppression supplémentaire de la
recombinaison, créant souvent des « strates évolutives » présentant
divers niveaux de différenciation entre les chromosomes sexuels. Une
théorie prédominante pour le développement des strates évolutives est
que chaque expansion associe des variants sexuellement antagonistes
avantageux au gène déterminant le sexe 8 . Cependant, cette théorie a
été difficile à prouver empiriquement 21 , 22 , 23 et a été contestée 24
. Les mécanismes par lesquels la recombinaison est supprimée font
également l'objet de débats 23 . Un modèle récent suggère que les
inversions s'étendent progressivement à partir de la région déterminant
le sexe car elles abritent des mutations délétères 25 . Une autre
théorie propose que la coévolution des régulateurs cis et trans de
l'expression des gènes entraîne des inversions sur le gène Y 26 . Tous
ces modèles devraient entraîner l’arrêt de la recombinaison des régions
adjacentes à la région déterminant le sexe à différents moments,
produisant ainsi des strates évolutives 27 , 28 , 29 , 30 , 31 .
Une grande partie des travaux sur
l'évolution des chromosomes sexuels a été menée chez les mammifères et
les oiseaux. Ces deux groupes possèdent des chromosomes sexuels
hétéromorphes anciens avec des strates évolutives facilement apparentes
10 , 11 . Cependant, ces systèmes ne sont pas idéaux pour étudier les
mécanismes du renouvellement des chromosomes sexuels ou les premiers
stades du développement des strates évolutives. Pour comprendre les
mécanismes de l'évolution des chromosomes sexuels, nous devons étudier
les lignées présentant un taux élevé de renouvellement récent des
chromosomes sexuels. Alors que des strates évolutives très divergentes
ont été identifiées chez certains poissons, comme les épinoches 32 , 33
, 34 , les chromosomes sexuels de la plupart des espèces de poissons
sont homomorphes 35 , 36 , 37 . Cette homomorphie, et la fréquence
élevée à laquelle se produit le renouvellement des chromosomes sexuels,
font des poissons des espèces idéales pour l'étude de l'évolution des
chromosomes sexuels 36 , 38 . On pense que la direction du
renouvellement, XY vers ZW contre ZW vers XY, est biaisée en faveur de
cette dernière chez les poissons 12 . Des cas de ségrégation de
multiples chromosomes sexuels au sein d'espèces téléostéens ont été
récemment étudiés 39 , mais les effets des systèmes polygéniques sur les
estimations du renouvellement des chromosomes sexuels restent à
explorer. Enfin, un rôle des fusions chromosomiques dans l'évolution des
chromosomes sexuels a également été proposé chez les poissons 40 , et
pourrait contribuer à l'isolement reproductif 38 .
Nous nous sommes concentrés sur
les poissons cichlidés d'Afrique de l'Est ( Cichlidae ), un groupe connu
pour sa radiation rapide qui a généré des lignées riches en espèces 41 .
L'évolution relativement récente de ces espèces les rend idéales pour
l'étude des mécanismes évolutifs. La forte densité spécifique permet un
grand nombre de comparaisons entre espèces étroitement apparentées. De
nombreux renouvellements de chromosomes sexuels ont été détectés dans ce
clade, et au dernier décompte impliquait 12 des 23 chromosomes de
cichlidés 15 , 42 , 43 . Le taux de renouvellement des chromosomes
sexuels dans ce groupe a été calculé à au moins 0,186 renouvellement par
million d'années 42 .
Les Tropheini, l'une des
treize tribus de cichlidés du lac Tanganyika 44 , sont particulièrement
bien adaptés à de telles études. Les Tropheini se composent
d'environ 40 espèces regroupées en huit genres 45 , 46 , 47 qui
partageaient un ancêtre commun il y a environ 3,6 à 3,8 millions
d'années 44 , 48 . Les genres des Tropheini sont définis par
leurs morphologies de mâchoires distinctes 49 , et une analyse
phylogénétique antérieure a identifié plusieurs sous-clades au sein de
la tribu 44 , 48 (Fig. 1 ). Le clade 1 comprend 13 espèces de
Tropheus divisées en 3 sous-clades. Le clade 1.1 contient une seule
espèce, T. duboisi , qui est sœur du reste du clade 1. Les clades
1.2 et 1.3 contiennent chacun 6 espèces. Le clade 2 contient les 27
espèces restantes qui peuvent être regroupées en cinq sous-clades. Le
clade 2.1 est constitué de l'espèce unique Lobochilotes labiatus
, qui est un groupe externe aux quatre autres clades. Le clade 2.2
contient 12 espèces de Petrochromis . Le clade 2.3 contient
Simochromis diagramma , Interochromis loocki et 3 autres
espèces de Petrochromis. Le clade 2.4 est constitué d'une seule
espèce, Petrochromis famula et le clade 2.5 comprend Limnotilapia
dardennii, Shuja horei, Gnathochromis pfefferi et cinq
espèces de Pseudosimochromis.
.
Figure 1
Phylogénie des Tropheini
avec les appels antérieurs des chromosomes sexuels et les systèmes
proposés. Certains systèmes présentent des fusions chromosomiques ou des
chromosomes sexuels multiples. Les cellules en bleu indiquent un système
XY, les cellules en orange un système ZW. Le texte en gras indique une
discordance entre l'appel précédent et l'appel actuel. Les cercles noirs
indiquent la perte d'un chromosome sexuel commun à ce clade. Topologie
adaptée de Ronco et al. 44 et échelle de temps approximative de Singh et
al. 48 .
.
Notre étude précédente a
identifié un système XY sur LG19 chez Tropheus sp. 'black' 43 .
Une étude plus récente portant sur 40 taxons au sein de la tribu a
identifié trois systèmes distincts de chromosomes sexuels, dont deux
sont partagés par plusieurs espèces 42 . Les espèces du genre
Tropheus (Clade 1) se sont avérées ségréguer le système XY sur LG19,
tandis que les espèces de Petrochromis et Pseudosimochromis
(Clade 2) ont ségrégué un système XY impliquant une fusion apparente de
LG5 et LG19. Gnathochromis pfefferi (Clade 2.4) portait un
système XY impliquant une fusion apparente de LG11 et LG15 42 (Fig. 2 ).
.
Figure 2
Fréquence des allèles F ST et
spécifiques au sexe , par paires, mâle x femelle, dans les données de
pool-seq pour Interochromis loocki et Gnathochromis pfefferi
. L'axe des abscisses correspond à la position sur l' assemblage de
référence Metriaclima zebra (UMD2a).
.
Nous utilisons ici de nouvelles
données issues du séquençage groupé de mâles et de femelles de plusieurs
espèces, ainsi qu'une réanalyse de séquences précédemment publiées
d'individus mâles et femelles isolés 42 , afin d'identifier de nouveaux
systèmes de chromosomes sexuels chez cette tribu. Nous quantifions le
taux élevé de renouvellement des chromosomes sexuels et décrivons
également le développement indépendant des strates évolutives sur LG19
parmi les espèces. Notre étude apporte de nouvelles perspectives sur les
premiers stades de l'évolution des chromosomes sexuels dans ce groupe.
.
Méthodes
.
Les chromosomes sexuels des
cichlidés sont généralement à un stade précoce de différenciation. Cela
signifie que les différences de fréquence allélique entre les
chromosomes sexuels sont faibles et souvent présentes sur un nombre
relativement restreint de sites. De plus, les caractéristiques du signal
évoluent avec l'âge du système. Initialement, le signal principal sera
l'hétérozygotie de quelques sites du sexe hétérogamétique. Cependant,
avec la divergence continue, certaines séquences disparaissent du
chromosome Y (ou W), ce qui conduit à des signaux apparemment
contradictoires. Par exemple, la perte d'une séquence du chromosome Y
rend les mâles hémizygotes à certains sites, de sorte que
l'hétérozygotie de ces sites sur le chromosome X suggère à tort un
système ZW. De nombreux signaux généralement quantifiés pour les
systèmes de chromosomes sexuels plus anciens (par exemple, les
différences de composition en bases ou de couverture séquentielle) sont
absents des systèmes très récents chez les cichlidés.
L'identification de ces signaux est
d'autant plus compliquée par la faible taille effective de nombreuses
populations de cichlidés. Un faible nombre de grands blocs haplotypiques
dans ces populations peut conduire à l'identification de blocs erronés
associés au sexe lorsqu'un petit nombre d'individus mâles et femelles
est échantillonné. Même lorsqu'un nombre plus important d'individus est
échantillonné, la faible valeur de Ne peut entraîner des niveaux de fond
élevés de différences de fréquence allélique entre les échantillons
mâles et femelles.
Enfin, il est possible que des
systèmes polygéniques se ségrégent chez ces espèces, en raison soit du
taux élevé de renouvellement des chromosomes sexuels, soit du maintien
de polymorphismes équilibrés pendant des centaines de milliers d'années.
L'échantillonnage pour les études sur les chromosomes sexuels n'est
généralement pas conçu pour identifier plusieurs systèmes de chromosomes
sexuels en ségrégation au sein d'une population. Compte tenu de ces
difficultés, nous avons utilisé diverses approches pour extraire le
maximum d'informations des données limitées disponibles.
.
Échantillons d'ADN et
séquençage
.
Nous avons obtenu de
nouvelles données de séquençage à partir de mâles et de femelles
regroupés de quatre espèces collectées en 2019 près de Kalambo Lodge, en
Zambie, près de l'extrémité sud du lac (-8,623°N, 31,200°E) : 25 mâles
et 23 femelles de Pseudosimochromis babaulti, 23 mâles et 25
femelles de Gnathochromis pfefferi , 24 mâles et 21 femelles d'
Interochromis loocki et 25 mâles et 25 femelles de Shuja horei
( Ctenochromis horei ) 50 . Nous avons également analysé une
famille de frères et sœurs de 30 mâles et 28 femelles de Simochromis
diagramma élevés à l'Université de Graz. Enfin, nous avons réanalysé
les données de 30 mâles et 24 femelles de Tropheus sp. " black "
qui ont été capturés dans la nature près d'Ikola, en Tanzanie 43 . Les
expériences sur les animaux ont été menées conformément au Guide pour le
soin et l'utilisation des animaux de laboratoire et rapportées
conformément aux directives ARRIVE 51 . Toute utilisation d'animaux a
été approuvée en vertu du permis de recherche zambien K-4335/18
KA/K.48/18 (S. Koblmüller) et des protocoles de soins aux animaux R-OCT-19-48
(U. Maryland) et BMWFW-66.007/004-WF/V/3b/2016 (U. Graz). Cette étude a
été réalisée avec l'approbation du comité d'éthique de l'Université de
Graz (numéro de permis GZ. 39/115/63 ex 2022/23).
L'ADN a été extrait des fragments de
nageoires par extraction au phénol-chloroforme à l'aide de tubes de gel
à verrouillage de phase (5Prime, Gaithersburg, MD). Les concentrations
d'ADN ont été quantifiées par spectroscopie de fluorescence à l'aide
d'un test Quant-iT PicoGreen (ThermoFisher, Waltham, MA). Des quantités
équimolaires d'ADN de chaque individu ont ensuite été regroupées par
sexe pour chaque espèce. Des banques de séquençage ont été constituées
et un séquençage d'ADN apparié de 150 pb a été réalisé sur un
NovaSeq6000 S4 (Illumina, San Diego, CA) par Novogene US (Davis, CA).
Les données de séquences issues
d'études antérieures ont été récupérées auprès des archives NCBI Short
Read Archive et de GenBank. Elles comprenaient des données de séquences
génomiques complètes de mâles et de femelles isolés pour les espèces de
la tribu Tropheini, analysées par El Taher et al. 42 . Nous avons
également examiné les données transcriptomiques de neuf espèces,
également incluses dans cette étude (Suppl. Tableau S1 ).
.
Analyse SNP spécifique au
sexe
.
La base principale de nos
analyses est l'identification et l'analyse des SNP spécifiques au sexe.
Ces SNP ont été identifiés selon les méthodes décrites dans Behrens et
al. 52 en utilisant le pipeline développé par Gammerdinger et al. 43 .
Le code précédemment rapporté de cette étude est disponible ( https://github.com/Gammerdinger/sex-SNP-finder
). Brièvement, les lectures de séquence ont été alignées avec BWA
version 0.7.12 en utilisant les paramètres par défaut ainsi que les
étiquettes de groupe de lecture 53 . Nous avons aligné tous les
échantillons sur l'assemblage de référence de haute qualité le plus
proche, le zèbre du Malawi ( Maylandia zebra —UMD2a, RefSeq
GCF_000238955.4) 54 . Français Dans certains cas, une partie du signal
spécifique au sexe était cartographiée sur des contigs non ancrés de
l'assemblage du zèbre du Malawi, nous avons donc remappé les lectures
sur l'assemblage plus contigu du tilapia du Nil ( Oreochromis
niloticus— UMD_NMBU, RefSeq GCF_001858055.2) 55 . À chaque site
nucléotidique variable, nous avons calculé la statistique F ST entre les
populations de lectures de séquences mâles et femelles. Les tracés F ST
résultants fournissent une première indication de la différenciation
entre les génomes mâles et femelles. Nous avons en outre identifié les
SNP à motifs XY et ZW comme des SNP fixes (fréquence inférieure à 0,1)
chez un sexe et polymorphes (fréquence entre 0,3 et 0,7) chez l'autre
sexe. Des tracés séparés de la fréquence allélique des SNP à motifs XY
et ZW ont souvent permis de déterminer le type de système
hétérogamétique en ségrégation (XY ou ZW).
Ensuite, nous avons utilisé
Bedtools 56 make windows et coverage pour calculer la densité des SNP à
motifs sexuels dans des fenêtres de 100 kbp à travers le génome. Nous
avons identifié le 1 % supérieur des fenêtres (~ 78 des 7 800 fenêtres
ancrées) avec le plus grand nombre de SNP à motifs sexuels en utilisant
la méthodologie décrite dans Kocher et al. 57 . Le rapport log 2 (XY:ZW)
de la densité des SNP a ensuite été calculé pour chaque fenêtre 58 . Un
test de Kruskal-Wallis (KW) sur les données classées a été réalisé dans
R (v.2023.03.0 + 386) en utilisant kruskal.test du package stats pour
déterminer si le rapport log différait entre les chromosomes 59 . Si les
différences étaient statistiquement significatives, le test de Dunn du
package R rstatix a été réalisé post-hoc pour déterminer quels
chromosomes différaient significativement les uns des autres avec une
correction de Benjamini-Hochberg pour les tests multiples. Les régions
de densité élevée de SNP spécifiques au sexe ont été visualisées dans
IGV 60 pour identifier les gènes candidats déterminant le sexe.
.
analyse k-mer
.
Afin d'identifier les variants
liés au sexe partagés par des espèces possédant le même système
chromosomique sexuel, nous avons réalisé une analyse k-mer. Suite à nos
travaux précédents, nous avons utilisé Jellyfish v. 2.2.7 61 pour
calculer la fréquence des k-mers de longueur 22 bases 52. Le code de
cette étude est disponible ( https://github.com/KristenBehrens/K-mer-scripts
). En bref, pour chaque système chromosomique sexuel partagé, une région
centrale a été identifiée à l'aide d'un script Python qui compare les
k-mers de chaque espèce et génère une liste des k-mers partagés par
toutes les espèces possédant ce système. Ces k-mers ont ensuite été
alignés sur le génome de référence de M. zebra (M_zebra_UMD2a) à l'aide
de BLAST afin de déterminer la région centrale de différenciation.
Samtools v. 1.10 a été utilisé pour les conversions de formats de
fichiers, le tri et l'indexation nécessaires. Cette analyse a été menée
pour les espèces avec le système de groupe de liaison XY (LG) 5/19 et
pour comparer le système XY-LG5 entre Shuja horei et
Cyprichromis pavo .
.
Résultats
.
Identification des chromosomes
sexuels à partir de données de séquences groupées
.
Dans les nouvelles données de
pool-seq pour cinq espèces rapportées ici, nous avons confirmé trois
systèmes précédemment identifiés à partir de données de séquences
individuelles 42 . Les chromosomes sexuels confirmés étaient les
systèmes XY-LG5/19 chez Interochromis loocki et
Pseudosimochromis babaulti, et le système XY-LG11/15 chez
Gnathochromis pfefferi (Fig. 2 ) .
Les tracés F ST des données de
séquençage groupé pour S. horei (Clade 2.5) ne montrent aucune preuve du
système XY-LG5/19 commun au reste du Clade 2, mais suggèrent un système
XY sur LG5 (Fig. 3 ). Ce pic étroit (~ 1,5 Mb de large) est situé à
7,8–7,9 Mbp, qui est la fenêtre supérieure de différenciation contenant
80 SNP à motifs XY. Cependant, ce pic étroit n'a pas produit de test de
Kruskal–Wallis significatif pour l'hétérogénéité entre les chromosomes,
que ce soit pour les données individuelles ou les données de séquençage
groupées (Suppl Tableau S2 ). Le pic (7,8–7,9 Mbp) englobe deux gènes,
ncoa3 et id1 , qui pourraient tous deux être considérés comme des gènes
candidats pour la détermination du sexe masculin. ncoa3 ( src-3 , ab1 )
est un membre de la famille des coactivateurs du récepteur stéroïde p160
qui régule la transcription 62 , 63 . Il a été découvert que ce gène
contrôle la migration cellulaire dans l'ovaire chez la drosophile et
l'homme 64 . id1 est un inhibiteur de la protéine de différenciation qui
agit pendant l'embryogenèse pour favoriser la croissance cellulaire 65 .
Ce gène est médié en amont par la voie TGF-bêta 66 qui a été impliquée
dans la détermination du sexe chez les cichlidés et d'autres poissons 67
, 68 , 69 . Cependant, la plus forte densité de SNP spécifiques aux
mâles se situait dans la région entre ncoa3 et id1 , qui n'a pas de gène
annoté dans l' assemblage de M. zebra . La différenciation sur LG5 chez
S. horei n'est pas liée au système XY sur LG5/19 observé dans tout le
clade 2, car les pics sur LG5 se trouvent dans des régions différentes
du chromosome.
.
Figure 3
Fréquence des allèles F ST et
spécifiques au sexe, par paires mâle x femelle, pour S. horei , (
a ) génome entier, ( b ) LG5. L'axe des x indique la position sur l'
assemblage de référence Metriaclima zebra (UMD2a).
.
Le graphique F ST de
l'échantillon groupé de Simochromis diagramma ne montre aucune
trace du système XY-LG5/19 commun au clade 2. En revanche, nous
observons une forte différenciation sur LG7 (Suppl Fig. S1 ). Les 1 % de
fenêtres supérieures comprennent 45 fenêtres ZW et 34 fenêtres XY sur
LG7. Bien que le test KW pour l'hétérogénéité entre les chromosomes soit
significatif, les tests de Dunn ne suggèrent pas de différenciation
inhabituelle de LG7 par rapport aux autres chromosomes, mais suggèrent
plutôt une différenciation de LG2, LG8 et LG20. En revanche, les 1 % de
fenêtres supérieures dans la comparaison d'un seul mâle et d'une seule
femelle montrent 22 fenêtres XY sur LG8 et 11 fenêtres XY sur LG16. Le
test KW pour l'hétérogénéité est également significatif et le test de
Dunn suggère une différenciation inhabituelle de LG8, LG16 et LG18. Les
signaux multiples et les différences entre les échantillons individuels
et le séquençage groupé de la famille suggèrent que cette espèce
pourrait ségréguer plusieurs systèmes de chromosomes sexuels.
.
Confirmation des chromosomes
sexuels à partir de données de séquences individuelles
.
Nous avons également réanalysé
un ensemble de données publié constitué de lectures de séquences
génomiques complètes d'un seul mâle et d'une seule femelle pour la
plupart des espèces de Tropheini et avons pu confirmer de
nombreux systèmes identifiés par El Taher 42 . Ceux-ci incluent un
système XY-LG19 prédominant dans les Tropheus du clade 1, que
nous avons confirmé dans Tropheus sp. 'black', T. sp. 'kirschfleck',
T . sp. 'lunatus', T. sp. 'lukuga', T. brichardi
et T. polli. Chacune de ces espèces a montré un fort support
statistique pour le système XY-LG19. Les tests de KW pour
l'hétérogénéité étaient significatifs, le test de Dunn pour les
différences entre les chromosomes impliquait LG19, et presque toutes les
fenêtres supérieures de 1 % étaient situées sur LG19 (Suppl Tableau S2
). Français Tout aussi important, nous avons confirmé l'absence du
système XY-LG19 dans de nombreuses espèces du Clade 1. Nous n'avons
trouvé aucune preuve de XY-LG19 dans T . sp. 'brichardi
kipili', T . sp. 'mpimbwe', T. annectens , T . sp.
'red', T . sp. 'Murago' ou T. moorii. Les forts signaux XY-LG19
que nous avons observés dans les taxons frères de chacune de ces espèces
permettent de déduire fortement que le système XY-LG19 n'est pas présent
dans nos échantillons de ces espèces. Nous déduisons 3 pertes
indépendantes du système XY-LG19 dans le Clade 1 (Fig. 1 ).
Nous avons également confirmé
un système XY-LG5/19 dans de nombreuses espèces du Clade 2, y compris
Petrochromis trewavasae , P. horii , P. sp. 'red',
P. sp. 'macrognathus rainbow', P. sp. 'giant',
Interochromis loocki , P. sp. 'orthognathus Ikola',
P. famula , Pseudosimochromis curvifrons , P. babaulti
South , P. babaulti , P. marginatus North et P.
marginatus. Ces espèces ont montré des signes d'un système XY-LG5/19
dans de multiples tests (Suppl Tableau S2 ). Nous sommes d'accord avec
la conclusion d'El Taher et al. 42 que le système LG19 observé dans le
clade 1 est différent du système LG19 dans le clade 2. Ces deux systèmes
impliquent des régions différentes de LG19, et leurs haplotypes ne se
regroupent pas phylogénétiquement 42 .
Nous avons trouvé moins de
support pour le système XY-LG5/19 chez plusieurs autres espèces (Suppl
Tableau S2 ). Petrochromis sp. 'polyodon Texas' montre un
support de fenêtre du 1% supérieur pour XY-LG5/19, et une hétérogénéité
KW entre les chromosomes. Les tests de Dunn soutiennent la
différenciation de LG5 et LG19, mais aussi LG8 et LG18. En l'absence de
support de fenêtre du 1% supérieur pour LG8 et LG18, nous concluons que
cette espèce ségrège le système XY-LG5/19. Petrochromis fasciolatus
montre une hétérogénéité KW et un support du 1% supérieur pour 5/19,
mais les résultats du test de Dunn sont dispersés. De nouveau, nous
concluons que cette espèce ségrège le XY-LG5/19, et les résultats
dispersés du test de Dunn proviennent d'artefacts du petit échantillon.
Enfin, nous n'avons pas été en mesure de confirmer l'affirmation d'un
système XY-LG5/19 chez Petrochromis sp. 'kipili brown' 42 . Notre
analyse montre une hétérogénéité KW, mais les 1 % de fenêtres
supérieures suggèrent un signal XY pour LG4, LG11, LG20 et LG22. Nous ne
sommes pas en mesure d'identifier un système de chromosomes sexuels chez
cette espèce en raison de nombreux tests de Dunn significatifs,
suggérant là encore des artefacts liés à la petite taille de
l'échantillon ou à l'identité par descendance au sein d'une petite
population. Pour les 9 espèces restantes du clade 2, nous n'avons trouvé
aucun support pour un système XY-LG5/19, ce qui pourrait indiquer que ce
système a été perdu et remplacé par un nouveau chromosome sexuel. De
tels remplacements ont pu se produire jusqu'à 8 fois au cours de
l'évolution du clade 2 (Fig. 1 ).
Nous avons également pu confirmer
le système XY-LG11/15 chez G. pfefferi , ce qui constitue le
deuxième cas de fusion de chromosomes sexuels dans cette tribu. Les
chromosomes X et Y sont fortement différenciés, comme le montre le
graphique F ST (Fig. 2 ), et toutes les fenêtres supérieures (1 %) sont
des fenêtres XY correspondant aux chromosomes LG11 et LG15 (Tableau
supplémentaire S2 ). Ce niveau élevé de différenciation suggère que ce
chromosome sexuel est d'âge similaire au système XY-LG5/19 du clade 2.
.
Nouveaux systèmes possibles
identifiés dans des données individuelles
.
Nous avons trouvé un support
provisoire pour plusieurs systèmes supplémentaires dans le clade 1. Nous
les mentionnons afin qu'ils puissent être examinés avec des données
supplémentaires ultérieurement. Aucune de ces espèces n'a montré de
signe du système LG19 présent chez d'autres espèces du clade 1.
Tropheus duboisi ne présente aucun signal évident dans le graphique
F ST . Le test KW d'hétérogénéité est significatif et les tests de Dunn
identifient LG9 comme distinct. Quatre fenêtres supérieures de 1 %
suggèrent un système XY sur LG9, mais le rapport global des SNP XY sur
ZW sur LG9 est fortement biaisé en faveur de ZW. Tropheus sp. 'brichardi
kipili' ne présente aucun signal évident dans le graphique F ST , et le
test KW n'est pas significatif. Nous ne sommes pas en mesure
d'identifier un chromosome sexuel pour cette espèce. Tropheus sp.
'mpimbwe' ne présente aucun signal évident dans le graphique F ST . Le
test KW est modérément significatif et les tests de Dunn identifient LG8
comme distinct. Cependant, aucune fenêtre supérieure de 1 % n'est
présente sur LG8. Tropheus annectens présente un pic étroit de F
ST sur LG8, suggérant un système ZW. Le test KW est significatif, mais
les tests de Dunn suggèrent que LG14 et LG23 sont distincts des autres
chromosomes. Les 1 % de fenêtres supérieures comprennent une fenêtre ZW
sur LG8, deux fenêtres ZW sur LG14, ainsi qu'une fenêtre XY et six
fenêtres ZW sur LG23. Le tracé F ST pour Tropheus sp. « red » est
sans particularité, et le test KW n'est pas significatif. Le tracé F ST
pour Tropheus sp. " Murago " suggère un possible système XY sur
LG6, mais le test KW est non significatif et aucun système n'est
confirmé dans les 1 % de fenêtres supérieures. Le tracé F ST pour
Tropheus moorii est sans particularité, le test KW est à peine
significatif et aucun système évident n'est indiqué dans les 1 % de
fenêtres supérieures.
Nous
avons également trouvé un support provisoire pour des systèmes
supplémentaires dans le Clade 2. Aucune de ces espèces n'a montré de
preuve du système XY-LG5/19 trouvé dans d'autres espèces du Clade 2. Les
tracés F ST pour Petrochromis macrognathus ne montrent pas de
signaux sexuels évidents, et les tests de KW et de Dunn ne sont que
modérément significatifs. Petrochromis sp. 'moshi yellow' montre
quelques pics possibles de F ST , et le test de KW est significatif.
Cependant, les résultats de Dunn sont faibles et dispersés, et les 1%
supérieurs des fenêtres ne supportent aucun chromosome particulier. Le
tracé F ST pour Petrochromis ephippium est sans particularité,
mais le test de KW est significatif et les tests de Dunn mettent en
évidence LG3 et LG4. Les 1% supérieurs des fenêtres suggèrent un système
ZW sur LG4. Le tracé F ST pour Petrochromis sp. 'kazumbae' est
également sans particularité, mais le test de KW est significatif, et
les tests de Dunn mettent en évidence LG23. Petrochromis polyodon
ne présente aucun pic F ST évident , et le test KW est modérément
significatif. Les tests de Dunn ne mettent en évidence aucun chromosome.
La preuve de la ségrégation de plusieurs systèmes sexuels dans les
diagrammes de Simochromis a été discutée en détail dans la
section ci-dessus relative aux résultats du séquençage groupé. Le tracé
F ST de Petrochromis orthognathus est sans particularité, mais le
KW est significatif, et les tests de Dunn suggèrent un système sur LG13.
Il existe une seule fenêtre supérieure de 1 % sur LG13 contenant 18 SNPS
à motifs ZW. Le tracé F ST de Limnotilapia dardennii est sans
particularité, le test KW est modérément significatif, mais seules
quelques comparaisons du test de Dunn présentent une faible
significativité. La preuve de l'existence d'un système XY-LG5 chez
Shuja horei a été discutée en détail dans la section ci-dessus
relative aux résultats du séquençage groupé.
La découverte des chromosomes
sexuels à partir de données individuelles a été entravée par un bruit de
fond important dans les analyses de SNP spécifiques au sexe (par
exemple, Petrochromis sp. « géant » dans la figure supplémentaire
S2 ). Les données individuelles ne sont pas idéales pour
l'identification des chromosomes sexuels, quelle que soit la
méthodologie analytique. Nous espérons que la mise en évidence de ces
signaux potentiels sur les chromosomes sexuels encouragera la poursuite
des recherches.
.
Origines des chromosomes
sexuels dans les clades 1 et 2
.
Les clades 1 et 2 incluent tous
deux des espèces dont le système XY implique LG19. Afin de déterminer si
ces espèces partagent des éléments d'un système ancestral de
détermination du sexe, nous avons comparé les k-mers spécifiques aux
mâles entre les clades 1 et 2.2. Nous n'avons trouvé que 10 k-mers
communs alignés sur l'assemblage de référence. Parmi ceux-ci, huit
k-mers représentent deux SNP alignés sur LG19, un sur LG2 et le dernier
sur LG6. Parmi les k-mers associés à LG19, tous se situaient dans la
même région (~ 10,1 Mbp) du gène kiaa1109 , bien à l'intérieur de la
région liée au sexe dans la clade 1, mais juste à l'extérieur de la
limite droite de la région liée au sexe dans la clade 2.2. Par
conséquent, il ne s'agit probablement pas d'un gène candidat déterminant
le sexe, et il est peu probable que ces quelques k-mers communs,
représentant seulement deux SNP, témoignent d'une origine commune de
LG19.
Les espèces du clade
1 possédant un système XY-LG19 partagent 320 209 k-mers. Parmi ceux-ci,
245 240 (76 %) sont des k-mers spécifiques de Y sur LG19, représentant
environ 10 000 SNP. Ce grand nombre de SNP partagés sur LG19 indique un
système de chromosomes sexuels ancien, avec une période relativement
longue d'ascendance commune avant la divergence des espèces actuelles.
Les SNP sont répartis de manière relativement uniforme sur une grande
partie de LG19 et ne permettent donc pas de localiser un gène candidat à
la détermination du sexe.
Nous avons également quantifié
les k-mers partagés pour les espèces avec le système XY-LG5/19 dans le
clade 2. Les quatre sous-clades ( 2.2–2.5) du clade 2 ne partagent que
20 k-mers spécifiques à Y, dont 18 alignés sur LG5. La majorité de ces
k-mers (14) correspondent à un seul SNP qui se situe à ~ 5,127 Mbp dans
un intron du gène bin2b , qui n'a pas de fonction évidente dans la
détermination du sexe. Les quatre autres k-mers sur LG5 représentent un
seul SNP qui se situe à ~ 17,57 Mbp dans une région qui ne contenait
aucune annotation. L'absence d'un grand nombre de SNP partagés entre les
clades suggère que la radiation des espèces s'est produite très
rapidement après l'émergence du nouveau déterminant du sexe. Par
conséquent, la majeure partie de la différenciation des séquences dans
la région déterminant le sexe s'est produite indépendamment dans chaque
lignée.
La tribu Cyprichromini,
éloignée, possède également un système XY sur LG5 52 . Nous avons compté
les k-mers partagés entre Cyprichromis pavo et P. trewavasae
(XY-LG5/19). Ces deux espèces partageaient légèrement plus de k-mers sur
LG5 et LG19 que sur les autres chromosomes (Suppl Tableau S3 ).
Cependant, étant donné la distance phylogénétique entre ces clades, il
est peu probable que ces similitudes représentent une origine commune
des systèmes de chromosomes sexuels dans ces deux tribus. Une
comparaison entre Cyprichromis pavo et le système XY-LG5
récemment évolué chez S. horei n'a pas montré d'excès de k-mers
partagés sur LG5.
.
Strates évolutives
.
Les systèmes de chromosomes
sexuels partagés par plusieurs espèces ont permis d'étudier la
divergence précoce des régions liées au sexe au sein des strates
évolutives. Nous avons caractérisé la densité de SNP spécifiques aux
mâles par fenêtre de 100 kb et constaté une variation interspécifique
dans l'étendue et les niveaux de différenciation des séquences des
régions déterminant le sexe, suggérant la présence de multiples strates
évolutives.
Six espèces du
clade 1 partagent le système XY-LG19. Bien que le nombre de SNP à motif
XY varie selon les espèces, il n'existe pas de différences évidentes
dans le motif ou l'étendue chromosomique de la différenciation (Suppl.
Fig. S3 ). La variation du nombre de SNP à motif sexuel reflète
probablement des différences de N e entre les espèces.
Seize espèces du clade 2
partagent le système XY-LG5/19. Les 9 premiers Mb du LG5 montrent une
différenciation chez toutes les espèces (Suppl. Fig. S4 ). Les espèces
des clades 2.2, 2.3 et 2.4 ne montrent aucune expansion supplémentaire à
partir des 9 Mb du noyau. Dans le clade 2.5, P. babaulti South ne
semble pas s'être étendu au-delà des 9 Mb du noyau, mais les 3 espèces
restantes partagent une strate qui s'étend sur environ 4 Mb
supplémentaires. Pseudosimochromis babaulti semble avoir une
strate supplémentaire qui s'étend sur environ 4 Mb supplémentaires
au-delà du noyau.
L'expansion des strates évolutives sur LG19 semble s'être produite
indépendamment dans chaque clade (Suppl Fig. S5 ). Les espèces du clade
2.2 partagent une strate de 0 à 5 Mb. Les espèces du clade 2.3 partagent
une strate de 0 à 6 Mb, tandis que dans le clade 2.4 ( P. famula
) elle s'étend sur environ 0 à 8 Mb. Dans le clade 2.5, la région
différenciée chez P. curvifrons s'étend sur 0 à 5 Mb, mais chez P.
babaulti South , P. marginatus et P. marginatus North
elle s'étend sur 0 à 7 Mb, et chez P. babaulti elle s'étend sur
toute la longueur de 0 à 9 Mb. L'expansion de ces deux régions dans
chaque espèce est résumée dans la Fig. 4 .
.
Figure 4
Expansion du chromosome sexuel
XY-LG5/19 dans la phylogénie du clade 2, estimée à partir des données de
densité de SNP spécifiques au sexe. Les cercles indiquent l'expansion de
LG5, les étoiles celle de LG19. Pour LG5, le motif en pointillés indique
ce qui est vraisemblablement la région d'origine, tout comme le motif en
carreaux pour LG19, les ajouts ultérieurs dans différents motifs
représentant des strates évolutives potentielles. Phylogénie adaptée de
Ronco et al. 44 .
.
Taux et schémas de
renouvellement des chromosomes sexuels
.
Les cichlidés constituent un
système idéal pour étudier les taux et les schémas de renouvellement des
chromosomes sexuels, en raison de leur grande diversité spécifique et de
leur divergence relativement récente. Notre analyse de la tribu
Tropheini confirme l'idée que les cichlidés d'Afrique de l'Est
présentent des taux de renouvellement des chromosomes sexuels parmi les
plus élevés chez les vertébrés.
L'état des chromosomes sexuels
ancestraux de la tribu Tropheini est inconnu. Nous n'avons pas pu
identifier de systèmes de chromosomes sexuels dans la lignée la plus
profonde du clade 1 ( T. duboisi ) ou du clade 2 ( L. labiatus
). Compte tenu du taux élevé de renouvellement des chromosomes sexuels
dans le groupe et de la grande distance phylogénétique avec les tribus
voisines, nous ne sommes pas en mesure de reconstituer l'état ancestral
de la tribu avec certitude. Une étude antérieure a révélé des
probabilités significatives pour cinq états ancestraux différents pour
l'ancêtre commun de la tribu 42 .
Bien que nous n'ayons pas pu
identifier de système de chromosomes sexuels dans la lignée la plus
profonde du clade 1 ( T. duboisi ), l'état ancestral du reste du
clade 1 semble avoir été XY-LG19. Le signal pour LG19 chez plusieurs
espèces du clade 1.2 et chez T. polli (clade 1.3) est fort et
englobe au moins 60 % du chromosome. Ce signal devrait être détectable
chez d'autres espèces du clade 1 avec notre méthodologie actuelle, même
dans des échantillons de mâles et de femelles isolés. L'absence de tels
signaux chez six espèces des clades 1.2 et 1.3 témoigne donc d'au moins
trois renouvellements supplémentaires des chromosomes sexuels.
Nous n'avons pas non plus pu
identifier le système de chromosomes sexuels dans la lignée la plus
ancienne du clade 2 ( L. labiatus ). L'état ancestral du reste du
clade 2 semble avoir été XY-LG5/19, présent dans chacun des principaux
sous-clades (2.2, 2.3 et 2.5). Ce système présente également une forte
différenciation entre les chromosomes X et Y sur environ 30 % des
sous-clades LG5 et LG19. Ce signal aurait également dû être détectable
dans des échantillons d'individus isolés. L'absence de ce signal chez 12
espèces du clade 2 suggère qu'au moins dix renouvellements
supplémentaires de chromosomes sexuels ont eu lieu.
Un changement de gène vers le
système XY-LG11/15 chez G. pfefferi est fortement corroboré par
les données de pool-seq. Les régions différenciées selon le sexe chez
G. pfefferi englobent environ la moitié de chaque chromosome et
présentent une différenciation d'ampleur similaire à celle du système XY-LG5/19,
ce qui est relativement ancien. Nos données suggèrent également un
changement récent vers le système XY-LG5 chez S. horei . La
région de différenciation ne mesure qu'environ 100 kb, mais présente
déjà 82 SNP à motifs XY.
Les 9 autres espèces
dépourvues du système XY-LG5/19 représentent au moins 7 pertes
indépendantes, vraisemblablement accompagnées par l'émergence d'un
système différent de détermination génétique du sexe. Au total, depuis
la racine de la tribu Tropheini, il y a eu au moins 12
renouvellements de chromosomes sexuels, sans compter les systèmes
sexuels inconnus chez T. duboisi et L. labiatus (Fig. 3 ).
En supposant 12 renouvellements et les longueurs des branches de la
phylogénie calibrée dans le temps de Singh et al. 48 qui suggère que la
tribu Tropheini a 3,6 à 3,8 millions d'années, nous estimons que
le taux de renouvellement des chromosomes sexuels pour cette tribu est
d'au moins 0,259 renouvellement par million d'années.
.
Détermination polygénique du
sexe
.
Il existe un désaccord sur la
stabilité des systèmes de chromosomes sexuels polygéniques, car certains
soutiennent qu'ils devraient être des intermédiaires instables ou le
résultat d'une hybridation récente 70 , 71 . Cependant, des preuves chez
les mouches domestiques ( Musca domestica ) 72 , 73 et chez les
cichlidés, où de multiples systèmes de chromosomes sexuels peuvent
persister au sein d'une espèce pendant des périodes allant jusqu'à un
million d'années, suggèrent le contraire. Ceci est mis en évidence par
des travaux sur les cichlidés du lac Malawi, où les locus sexuels
associés à l'inversion de la tache orange (OB) 74 , 75 et aux
chromosomes B 57 , 76 , 77 sont largement partagés entre les espèces. Un
autre soutien vient du polymorphisme des chromosomes sexuels chez
Astatotilapia burtoni 57 , 74 , 75 , 77 , 78 . Enfin, un
polymorphisme à long terme des chromosomes sexuels a été décrit dans la
tribu Cyprichromini du lac Tanganyika 52 . Des polymorphismes
similaires ont peut-être été négligés dans des clades moins riches en
espèces, notamment parce que la plupart des stratégies d’échantillonnage
ne sont pas conçues pour détecter la ségrégation de plusieurs systèmes
de chromosomes sexuels dans une population.
Nous avons découvert des preuves de
polymorphisme des chromosomes sexuels chez S. diagramma .
L'analyse pool-seq a révélé une forte différenciation sur LG7, mais
l'analyse d'individus isolés d'un autre échantillon a suggéré des
systèmes XY sur LG8 et 16. L'absence de signal chromosomique sexuel chez
les autres espèces, qui ne présentent ni le système XY-LG19 ni le
système XY-LG5/19, peut très probablement être attribuée à l'invasion
récente d'un nouveau chromosome sexuel relativement indifférencié, non
détectable par nos approches GWAS. Mais cela pourrait également indiquer
la ségrégation de plusieurs systèmes chromosomiques sexuels, ce qui
tendrait à masquer le signal dans les analyses pool-seq.
.
Fusions chromosomiques
.
La relation entre l'évolution
des caryotypes, les chromosomes sexuels et la spéciation a fait l'objet
de recherches considérables 79 , 80 . Les chromosomes sexuels peuvent
conduire à l'évolution globale du caryotype via des inversions, des
délétions et des fusions 40 . Il a été proposé que les fusions
chromosomiques soient impliquées dans le renouvellement des chromosomes
sexuels 38 , ce qui peut en outre entraîner une spéciation comme cela a
été proposé chez l'épinoche 34 . Les chromosomes B surnuméraires sont
devenus déterminants pour le sexe chez certains cichlidés du lac Malawi
81 , et nous avons suggéré qu'une fusion entre un chromosome B et un
chromosome sexuel a généré le chromosome géant LG3 trouvé uniquement
dans la lignée du Tilapia 76 .
Le nombre chromosomique diploïde
typique des cichlidés est (2n = 44) 82 . Les données caryotypiques ne
sont pas disponibles pour la plupart des espèces de Tropheini ,
mais nous prédisons au moins deux fusions dans ce clade. La première est
prédite par les forts signaux sexuels d'un système XY-LG5/19 dans le
clade 2. Nous prédisons que les caryotypes de ces espèces afficheront 2n
= 42. Le second est le système XY-LG11/15 chez G. pfefferi , dont nous
prédisons qu'il affichera 2n = 40. Dans les deux cas, les fusions ont
probablement précédé le développement des caractéristiques des
chromosomes sexuels. Les régions différenciées se trouvent à l'extrémité
de ces chromosomes, où les taux de recombinaison des cichlidés sont
généralement faibles 54 . Ces régions de recombinaison réduite peuvent
avoir facilité le développement des chromosomes sexuels chez ces
espèces.
.
Strates évolutives
.
Les multiples versions des
chromosomes Y dans ces clades offrent une opportunité d'étudier la
dynamique de la formation des strates évolutives sur les chromosomes
sexuels. Nous résumons nos résultats dans la Fig. 4.
Pseudosimochromis babaulti dans le clade 2.5 semble avoir la plus
grande région de différenciation sur LG5 et LG19. Les autres espèces des
clades 2.4 et 2.5 ont également connu une certaine expansion, mais pas
dans la même mesure que P. babaulti . Le schéma global suggère
que la strate initiale s'est établie sur les ~ 5 Mb régions terminales
de chaque chromosome, qui étaient des régions télomériques avant la
fusion des chromosomes. De faibles taux de recombinaison semblent
persister dans ces anciennes régions télomériques pendant des millions
d'années après la fusion des chromosomes (par exemple LG23) 54 . Ces
régions de recombinaison intrinsèquement faible peuvent représenter un
environnement favorable à l'évolution de nouveaux chromosomes sexuels.
La définition des strates évolutives très jeunes demeure un défi de
taille. Les niveaux de différenciation étant faibles et les différences
entre strates encore plus réduites, il est difficile de délimiter les
limites des strates individuelles à partir des seules mesures de
différenciation séquentielle. Une définition rigoureuse de ces strates
pourrait nécessiter des assemblages phasés des chromosomes sexuels pour
chaque espèce.
.
Conclusion
.
À chaque nouvelle étude, il apparaît clairement que la
variabilité des chromosomes sexuels chez les cichlidés d'Afrique de
l'Est est plus importante que prévu. Il s'agit d'une observation
importante, car sous-estimer le nombre de systèmes de chromosomes
sexuels revient à sous-estimer le nombre de renouvellements et à inférer
un schéma différent de remplacement des chromosomes sexuels. Nous
sous-estimons également le nombre d'autosomes devenus des chromosomes
sexuels, ce qui fausse notre compréhension des chromosomes et des gènes
impliqués dans la détermination du sexe. L'essentiel de nos
connaissances sur l'évolution des chromosomes sexuels provient
d'organismes éloignés, dotés de chromosomes sexuels anciens et très
divergents. Seuls des groupes comme les cichlidés, dotés de clades
récents et riches en espèces, permettent de commencer à comprendre les
premiers stades de l'évolution des chromosomes sexuels.
.
Disponibilité des données
.
Les nouvelles données de séquence pour Pseudosimochromis
babaulti, Shuja horei (anciennement
appelé Ctenochromis
horei ) ,
Gnathochromis pfefferi, Simochromis diagramma et Interochromis
loocki sont
disponibles sur NCBI sous BioProject : PRJNA802233. Les données
précédemment publiées sont disponibles sous leurs BioProjects respectifs
sur NCBI : Gammerdinger et al. 2018 BioProject : PRJNA400462 et El Taher
et al. 2021 BioProject : PRJNA552202.