La
phylogénomique révèle une hybridation précoce et des loci adaptatifs
façonnant le rayonnement des poissons cichlidés du lac Tanganyika -
Publié:
Iker Irisarri , Pooja Singh , Stephan Koblmüller , Julián Torres-Dowdall ,
Frédéric Henning , Paolo Franchini ,
Christoph Fischer , Alan R. Lemmon , Emily Moriarty Lemmon ,
Gerhard G. Thallinger , Christian Sturmbauer &
Axel Meyer
.
Le lac Tanganyika est le plus
ancien et le plus diversifié phénotypiquement des trois radiations
adaptatives des cichlidés d'Afrique de l'Est. Il est également le
berceau des radiations parallèles plus récentes des cichlidés
haplochromines des lacs Malawi et Victoria. Malgré son importance
évolutive, les relations entre les principales lignées du lac Tanganyika
sont restées non résolues, tout comme la chronologie générale de
l'évolution des cichlidés. Nous démêlons ici la structure phylogénétique
profonde de la radiation du lac Tanganyika grâce à la phylogénomique
ancrée et mettons en évidence l'hybridation à sa base, ainsi qu'au début
de la radiation des haplochromines. Cela suggère que l'hybridation
pourrait avoir facilité ces poussées de spéciation. Des arbres temporels
calibrés soutiennent que la radiation des cichlidés du Tanganyika a
coïncidé avec la formation du lac et que la vicariance gondwanienne a
coïncidé avec les premières divisions de l'arbre généalogique des
cichlidés. Les gènes liés aux innovations clés montrent des signes d'introgression
ou de sélection positive suite à la colonisation des habitats lacustres,
et les adaptations alimentaires des espèces se révèlent être des moteurs
majeurs de l'évolution de la vision des couleurs. Ces résultats
éclairent les processus qui façonnent l’évolution des radiations
adaptatives.
.
La spéciation rapide,
lorsqu'elle est associée à une opportunité écologique, peut donner
naissance à une multitude d'espèces en peu de temps, un processus connu
sous le nom de radiation adaptative 1 . Plusieurs lignées se sont
diversifiées grâce à ce processus, notamment les épées argentées d'Hawaï
2 , les pinsons de Darwin 3 et les cichlidés d'Afrique de l'Est 4 .
L'étude des radiations adaptatives est cruciale pour mieux comprendre
les facteurs qui déterminent la spéciation 5 . Cependant, il s'est avéré
difficile de démêler le cadre géographique, l'écologie, les causes
génétiques, les points communs et les particularités des différentes
radiations adaptatives 6 , 7 . Des changements abiotiques soudains tels
que de nouvelles îles volcaniques ou de nouveaux lacs peuvent fournir
des niches vides qui facilitent la diversification. La spéciation peut
également être favorisée par des traits clés qui permettent
l'exploitation de nouvelles niches, ou par un flux génétique entre des
lignées divergentes qui produisent des phénotypes transgressifs montrant
des réponses plus rapides à la sélection divergente 8 .
Les poissons cichlidés (Cichlidae), avec plus de 1700 espèces décrites,
sont un système modèle pour l'étude du rayonnement adaptatif, de la
diversification écomorphologique et de la spéciation 4 , 6 . Les Grands
Lacs d'Afrique de l'Est abritent environ 90 % de toutes les espèces de
cichlidés décrites à ce jour 9 , qui sont le résultat d'une évolution
réussie façonnée par une spéciation axée sur la vicariance et les
opportunités 10 . Comprendre l'histoire évolutive des cichlidés et les
facteurs contribuant à leur diversification a été une quête majeure pour
une communauté toujours croissante de biologistes évolutionnistes.
Cependant, malgré des décennies de recherche, certaines relations
évolutives cruciales restent non résolues et le moment des divergences
entre les principales lignées est toujours controversé. Ainsi,
l'établissement d'une phylogénie robuste et calibrée dans le temps est
une première exigence pour retracer les modèles de diversification (dans
le temps et l'espace) et pour mieux comprendre les facteurs qui ont
façonné leur rayonnement adaptatif. De plus, le rôle et l’importance
relative de l’hybridation, de l’écologie ou du cycle biologique dans la
formation des radiations des cichlidés restent mal compris.
L'inférence phylogénétique des lignées à rayonnement adaptatif s'est
avérée difficile à la fois avec la morphologie 4 et les molécules 11 .
La diversification rapide empêche l'accumulation de changements dérivés
partagés et augmente la rétention du tri de lignée incomplet (ILS) dans
les génomes, tandis que la convergence écomorphologique et l'hybridation
compliquent davantage les méthodes d'inférence phylogénétique. Malgré
les nombreuses études qui ont contribué à clarifier la phylogénie des
cichlidés (revues dans Koblmüller et al. 12 ), des désaccords
considérables existent toujours concernant les relations clés, en partie
à cause du peu de marqueurs peu informatifs disponibles et de la rareté
des fossiles, qui sont également problématiques en raison de l'évolution
parallèle fréquente d'écomorphologies similaires 13 , 14 . L'une des
principales questions ouvertes est la structure phylogénétique profonde
du rayonnement du lac Tanganyika, le plus ancien des Grands Lacs
d'Afrique de l'Est. Le lac Tanganyika abrite l'assemblage d'espèces le
plus diversifié sur le plan écologique, morphologique et génétique 12 .
Français Elle détient également la clé pour comprendre l'origine des
cichlidés haplochromines, la lignée la plus riche en espèces qui a
ensemencé les radiations dans les lacs Malawi et Victoria et a également
recolonisé le lac Tanganyika 9 , 15 . Alors que la monophylie des tribus
de cichlidés est bien établie, leurs interrelations restent vivement
débattues 11 , 15 , 16 , 17 , 18 . Plusieurs études ont examiné la
macroévolution des cichlidés 19 , mais étant donné les incertitudes
phylogénétiques actuelles, les arbres utilisés pourraient ne pas
refléter la « véritable » histoire de l'espèce 16 . Une hypothèse
phylogénétique robuste pour les cichlidés permettra non seulement de
résoudre les controverses existantes, mais elle permettra également de
comprendre l'origine et l'évolution des innovations clés, des
changements du cycle biologique et de clarifier davantage les modèles de
convergence et d'évolution parallèle qui caractérisent les radiations
des cichlidés.
La diversification rapide des cichlidés d'Afrique de l'Est a été
attribuée à des innovations clés, notamment (i) le découplage
fonctionnel des mâchoires orales et pharyngiennes facilitant
l'exploitation de diverses sources trophiques 20 , (ii) l'adaptation de
la vision à différentes turbidités de l'eau 21 , et (iii) la coloration
corporelle associée à la sélection sexuelle et à l'isolement reproductif
22 . L'importance relative de ces innovations est mal comprise, étant
donné que la plupart des études précédentes se sont concentrées sur
l'effet de facteurs uniques sur ces traits, ou ont analysé les traits
isolément. Le manque d'études modélisant simultanément différents
facteurs écologiques et du cycle biologique entrave l'identification des
relations hiérarchiques entre eux, ainsi que l'identification des
changements spécifiques à la lignée 6 .
En plus des innovations clés, l'hybridation a également été proposée
comme un facteur majeur façonnant les radiations des cichlidés d'Afrique
de l'Est 8 . L'hybridation a été démontrée au début des troupeaux de
cichlidés du lac Malawi et de Victoria 23 , 24 et suggérée pour
alimenter ces radiations. Certaines études ont proposé un scénario
similaire pour le lac Tanganyika 18 , 25 , mais jusqu'à présent aucune
étude n'a démontré la présence d'hybridation à la base de cette
radiation, un impératif pour invoquer son rôle dans la stimulation de
cette diversification.
L'intégration de la datation moléculaire aux événements géologiques peut
identifier les facteurs écologiques pertinents facilitant les radiations
et fournir un contrôle indépendant pour les hypothèses d'hybridation. On
suppose que le groupe d'espèces du lac Tanganyika est apparu au même
moment que la formation et la maturation du lac il y a 12 à 9 Ma 26 .
Cependant, les analyses de datation moléculaire ont suggéré des âges
nettement différents d'environ 51 à 16 Ma 9 , 27 , 28 , 29 , 30 , 31 .
Une controverse persiste également concernant les estimations d'âge pour
les divergences les plus profondes dans l'arbre généalogique des
cichlidés. On a initialement supposé que celles-ci suivaient la
vicariance gondwanienne 32 , 33 , 34 , 35 . Les datations moléculaires
récentes ont récupéré des âges significativement plus jeunes pour ces
divisions qui contredisent le scénario de vicariance et ont donc émis
l'hypothèse d'une dispersion transocéanique à longue distance des
cichlidés 25 , 29 , 30 . Français En revanche, les datations
moléculaires antérieures utilisant des étalonnages vicariants ont estimé
des divergences beaucoup plus anciennes chez les cichlidés africains qui
sont difficiles à concilier avec l'âge et l'histoire géologique des
Grands Lacs africains et la biologie de leurs espèces endémiques 9 , 12
. La difficulté d'estimer des divergences cohérentes simultanément dans
les régions plus profondes et moins profondes de l'arbre provient en
partie de la rareté des fossiles fiables pour l'étalonnage (le plus
ancien connu n'a que 45 millions d'années 36 ) et de l'absence d'une
estimation fiable de la fréquence de l'horloge moléculaire pour les
cichlidés.
Ici, nous tentons de
reconstruire un arbre généalogique robuste de cichlidés en nous
concentrant sur le troupeau du lac Tanganyika, qui est calibré dans le
temps en utilisant un fossile de cichlidé d'Afrique de l'Est récemment
décrit 37 . Les réseaux phylogénétiques et les statistiques D de
Patterson sont utilisés pour examiner les signaux d'hybridation entre
les tribus de cichlidés. Nous trouvons des preuves d'hybridations à la
base du troupeau du lac Tanganyika et de la tribu Haplochromini
qui a ensemencé les radiations dans les lacs Malawi et Victoria. Ces
résultats soutiennent le rôle de l'hybridation dans l'amplification de
toutes les radiations majeures des cichlidés en Afrique de l'Est. En
utilisant le nouveau cadre phylogénétique, nous analysons l'évolution
moléculaire des gènes associés aux innovations clés des cichlidés. Nous
trouvons une sélection positive associée à la colonisation du lac
Tanganyika et identifions le régime alimentaire comme l'un des facteurs
écologiques les plus importants.
.
Résultats et discussion
.
La phylogénomique ancrée résout
le rayonnement du lac Tanganyika
.
Notre ensemble de données
comprend 533 loci ancrés pour 149 espèces (950 518 positions
nucléotidiques alignées filtrées, 5,1 % de données manquantes),
représentant toutes les principales lignées de cichlidés en mettant
l'accent sur le rayonnement du lac Tanganyika (tableau supplémentaire 1
). L'arbre coalescent (Fig. 1 ) et l'arbre concaténé (Fig. 1
supplémentaire ) ont tous deux produit des topologies d'arbres hautement
(~ 91 %) congruentes, la plupart des nœuds recevant un support bootstrap
complet. Les différences entre les deux arbres (27/297 ou ~ 9 % des
nœuds) sont limitées aux cichlidés d'Afrique de l'Est et affectent
principalement les relations au sein des tribus, à deux exceptions près
(voir ci-dessous). La difficulté de reconstruire de manière fiable les
relations intertribales dans le lac Tanganyika est bien illustrée par la
faible certitude entre les nœuds 38 pour ces nœuds, contrairement aux
valeurs relativement élevées (> 80 %) pour la monophylie de la plupart
des tribus (Fig. 1 et Fig. 2 supplémentaire ). La congruence entre les
arbres coalescents et concaténés peut surprendre au premier abord, étant
donné que la concaténation, contrairement à la coalescence, ne prend pas
en compte l'ILS. En fait, la faible certitude entre les nœuds provient
principalement de branches courtes, ce qui corrobore la présence de
l'ILS 39 (Fig. 3 supplémentaire ). Les analyses jackknife génétiques
montrent que l'ILS a un impact négatif sur la concaténation (RAxML)
utilisant 400 locus ou moins, tandis que la coalescence (ASTRAL)
récupère systématiquement davantage de bipartitions de l'arbre final
(Fig. 1 ). En utilisant 500 locus ou plus, les deux méthodes convergent
vers des topologies très similaires, ce qui suggère que le signal
phylogénétique authentique peut surmonter l'effet confondant de l'ILS
ignoré par la concaténation. De plus, l'utilisation d'un plus grand
nombre de gènes atténue probablement l'effet négatif des flux génétiques
(par exemple, l'introgression) sur les approches de concaténation et de
coalescence.
.
Figure 1
Arbre coalescent des espèces de
cichlidés (ASTRAL). Les nombres aux nœuds sont des valeurs de support
issues respectivement des probabilités a posteriori locales et des
proportions de bootstrap multilocus, et les points noirs représentent un
support complet. Les nœuds sans nombre réel ont reçu un support complet
des deux mesures. Les longueurs des branches sont exprimées en unités
coalescentes et les couleurs des branches reflètent les valeurs de
certitude entre les nœuds. Le graphique en médaillon montre le
pourcentage de nœuds fortement supportés (proportion jackknife de locus
> 75 %) reconstruits par ASTRAL et RAxML avec un nombre croissant de
locus. Crédits photo : Wolfgang Gessl
.
La monophylie de toutes les
tribus de cichlidés a été retrouvée sans ambiguïté (Fig. 1 ). La
monophylie de la radiation des cichlidés d'Afrique de l'Est 11 , 15 , 17
, 40 , 41 est confirmée après l'inclusion, pour la première fois, de
plusieurs espèces fluviales actuellement distribuées en dehors du lac
Tanganyika qui sont essentielles pour tester cette monophylie. Les
divisions les plus profondes de l'arbre correspondent très bien aux
schémas de distribution à travers les masses continentales dérivées du
Gondwana : ramification successive des Etroplinae (Madagascar et
Inde/Sri Lanka), des Ptychochrominae (Madagascar) et des
cichlidés néotropicaux (Cichlasomatini + Heroini) et
africains comme clades frères 28 , 31 . Comme dans l'étude la plus
récente et la plus exhaustive sur le plan taxonomique des cichlidés
africains 41 , nous avons retrouvé une ramification précoce des
Heterochromidini et des Tylochromini, mais avons trouvé des
relations alternatives parmi la plupart des autres tribus (Fig. 1 ). En
particulier, nous avons retrouvé un fort soutien pour Tilapiini
comme frère d'un clade composé de Steatocranini et du groupe
d'espèces du lac Tanganyika.
L'arbre des espèces coalescent a
retrouvé Steatocranini ( Steatocranus casuarius ) au sein
du groupe du lac Tanganyika, comme groupe frère de toutes les autres
tribus à l'exclusion de Bathybathini + Boulengerochromini
(Fig. 1 ), tandis que l'arbre de vraisemblance maximale (Fig. 1
supplémentaire ) a retrouvé Steatocranini comme groupe frère du groupe
d'espèces du lac Tanganyika qui comprend Bathybathini et
Boulengerochromini. Nous interprétons cette différence comme
résultant de l'hybridation (voir ci-dessous). Le deuxième désaccord
topologique intertribal majeur concernait les relations au sein de la
lignée H 42 (voir également Fig. 1 ) : les analyses coalescentes ont
retrouvé la ramification successive de (i) Cyprichromini comme
groupe frère de Benthochromini + Perissodini et (ii)
Limnochromini + Ectodini, tandis que les analyses concaténées
ont retrouvé ces deux clades comme groupe frère.
Les études précédentes concordent généralement avec notre position
retrouvée pour les Haplochromini (y compris les Tropheini)
et la ramification plus profonde des Boulengerochromini,
Bathybatini et Lamprologini, mais les interrelations précises
entre toutes les autres tribus diffèrent significativement 11 , 15 , 17
, 18 , 25 , 41 . Les Eretmodini, dont le placement a été
controversé dans les études précédentes 14 , 43 , 44 , 45 se trouvent
dans la lignée H 11 , 17 , 25 , 30 , 42 , spécifiquement comme groupe
frère d'Orthochromini + Haplochromini (y compris les
Tropheini). Au sein des Haplochromini, les genres fluviaux
Astatoreochromis et Astatotilapia se ramifient avant les deux
clades majeurs représentant les radiations adaptatives dans le lac
Victoria (> 500 spp.) et le lac Malawi (> 800 spp.). Notre phylogénie
soutient l'évolution des Tropheini endémiques du Tanganyika à
partir d'ancêtres fluviaux qui ont recolonisé le lac Tanganyika et se
sont diversifiés parallèlement au rayonnement déjà existant 11 , 12 , 15
.
..
L'arbre temporel des
cichlidés réconcilie deux événements géologiques majeurs
.
Nous avons effectué des analyses
d'arbres temporels indépendants en utilisant 10 schémas d'étalonnage
basés sur des fossiles ou la biogéographie (Tableau supplémentaire 2 ).
Ces analyses ont fourni une compréhension globale de l'effet des
étalonnages basés sur des fossiles ou la vicariance sur les parties
profondes et récentes de l'arbre des cichlidés. Notamment, c'est la
première fois que le rayonnement du lac Tanganyika est ancré avec le
fossile récemment décrit † Tugenchromis pickfordi 37 , et nous évaluons
son effet en comparant les schémas d'étalonnage avec ou sans ce fossile.
Nos estimations de temps de divergence ont daté l'origine du groupe
d'espèces du lac Tanganyika au Miocène supérieur, environ 13,7–12,7 Ma
pour les schémas d'étalonnage C06-C10 (Fig. 2 ) et un peu plus récemment
(11,1–5,9 Ma) pour les schémas d'étalonnage C01-C05 n'incluant pas † T.
pickfordi (Données supplémentaires 1 ).
En prenant en compte les
intervalles de confiance de 95 %, les deux aires de répartition
concordent avec une diversification du troupeau d'espèces du lac
Tanganyika associée à la colonisation du nouveau bassin lacustre
(originaire de 12 à 9 Ma 46 ), qui a fourni de nouvelles niches et
opportunités écologiques nécessaires à la radiation adaptative 10 . De
même, il n'est pas possible d'exclure un scénario alternatif d'une
origine plus ancienne de certaines lignées majeures. Cependant, le fait
que toutes les tribus endémiques du Tanganyika, à l'exception des
Lamprologini à ramification précoce, occupent des niches
fondamentales brutes distinctes (guildes écologiques) 12 suggère que la
radiation initiale s'est probablement produite dans les limites du
système lacustre émergent. Au lieu de cela, si une grande partie de la
divergence initiale s'était produite dans différents systèmes fluviaux
avant la formation du lac (c'est-à-dire en allopatrie), on pourrait
s'attendre à ce que chaque lignée rayonne en un éventail d'espèces
occupant des niches plus larges, ce qui contredit le modèle observé
aujourd'hui. Français Il est important de noter que les membres des
tribus de cichlidés du groupe du lac Tanganyika ne sont présents dans
aucun système fluvial voisin, à seulement trois exceptions près : (i)
les Orthochromini, que l'on trouve exclusivement dans le bassin
versant de Malagarazi et les rivières voisines qui se jettent dans le
lac Tanganyika ; (ii) les Haplochromini originaires du
Tanganyika, qui ont colonisé de grandes parties de l'Afrique, puis ont
recolonisé le Tanganyika (Tropheini) ; et (iii) les
Lamprologini qui contiennent deux lignées qui se sont dispersées du
lac Tanganyika dans les systèmes fluviaux du Congo et de Malagarazi 47 .
Là encore, une origine du groupe d'espèces du lac Tanganyika bien
antérieure à la formation du lac devrait expliquer l'extinction de
nombreux membres fluviaux des tribus tanganyikaises. En fait, d'autres
lignées de cichlidés étroitement apparentées, dont certaines ont
également colonisé le lac Tanganyika 41 , continuent d'être présentes
dans les plans d'eau voisins.
.
Figure 2
Phylogénie des cichlidés
calibrée dans le temps. Les temps de divergence ont été déduits avec
RelTime et le schéma d'étalonnage C10. Les barres des nœuds représentent
des intervalles de confiance à 95 %. Les ombres verticales représentent
les divisions des masses continentales dérivées du Gondwana (marron) et
la formation du lac Tanganyika (bleu). Les schémas de distribution
pertinents (actuels) des principales lignées de cichlidés et les
événements de colonisation des Grands Lacs d'Afrique de l'Est sont
indiqués. L'échelle est en millions d'années et les principales périodes
géologiques sont mises en évidence. Les temps de divergence détaillés
pour chaque nœud et arbre temporel selon les schémas d'étalonnage C01 à
C10 sont disponibles dans les Données supplémentaires 1.
.
Nos analyses datent l'origine de
la famille des cichlidés entre le Jurassique et le Crétacé inférieur,
selon le schéma d'étalonnage supposé, ce qui est clairement antérieur au
plus ancien fossile de cichlidé connu (~46 Ma 36 ). Les temps de
divergence estimés pour les divisions les plus profondes de l'arbre, à
savoir celles entre Etroplinae-Ptychochrominae à 175,8-121,0 Ma et entre
les cichlidés africains et néotropicaux à 143,9-98,9 Ma, sont
globalement cohérents avec un scénario de vicariance de fragmentation
gondwanienne 27 , 28 , 34 , 35 mais contredisent d'autres scénarios
proposés 29 , 30 , 31 . La vicariance gondwanienne est solidement
soutenue par tous les schémas d'étalonnage basés sur les fossiles, à
l'exception des schémas C03 et C08, qui produisent des estimations plus
anciennes apparemment biaisées et des intervalles de confiance plus
larges (Données supplémentaires 1 ). Français La différence entre les
schémas C03 et C08 avec leurs analogues C02 et C07 est le placement de †
Mahengechromis , qui a une position phylogénétique incertaine 48 . Sa
position est probablement plus proche de l'origine de tous les cichlidés
africains plutôt que du nœud immédiatement après (à l'exclusion d'Heterochromis
) et devrait donc être appliquée pour calibrer cet événement.
L'utilisation de limites maximales dans les schémas C05 et C10 diminue
l'effet néfaste du mauvais placement de † Mahengechromis (Données
supplémentaires 1 ). Le scénario de vicariance proposé ici explique plus
facilement les schémas de distribution actuels des cichlidés à travers
les masses continentales dérivées du Gondwana sans nécessiter de
dispersion transocéanique. Cette dernière nécessiterait une forte
tolérance physiologique aux conditions de salinité dans lesquelles la
plupart des cichlidés modernes ne survivraient pas (à l'exception de
quelques espèces qui vivent dans des conditions saumâtres ou marines ou
peuvent les tolérer 49 , 50 ). De plus, la divergence estimée du groupe
d’espèces du Tanganyika concorde avec le rayonnement se produisant dans
les limites du lac naissant.
L'étude récente proposant une
dispersion transocéanique à longue distance des cichlidés a inféré des
divergences apparemment trop anciennes (~50 Ma) pour le groupe d'espèces
du Tanganyika 31 . Outre des différences substantielles dans la
méthodologie de datation, les désaccords dans les temps de divergence
entre cette étude et nos analyses pourraient être en partie dus à
l'ensemble de données moléculaires sous-jacent, qui était sensiblement
plus petit (40 loci) et dominé par des marqueurs mitochondriaux (~66 %)
et des données manquantes (~40 %). L'élargissement de notre ensemble de
données de loci ancrés pour inclure d'autres taxons non cichlidés, ce
qui est simple pour les loci ancrés, permettrait d'incorporer des
fossiles informatifs supplémentaires dans le groupe externe comme dans
Matschiner et al. 31 et aiderait à clarifier les désaccords actuels sur
la diversification des cichlidés. Une compréhension plus approfondie de
la contradiction apparente entre les arbres temporels existants des
cichlidés serait possible en menant une étude approfondie comparant
différents logiciels/méthodologies de datation et ensembles de données
moléculaires avec des hypothèses et des modèles comparables.
.
Les hybridations anciennes
ont alimenté les radiations est-africaines
.
Nous avons étudié notre ensemble
de données pour les signaux d'hybridation/introgression en analysant les
discordances à haute fréquence dans les réseaux gallés 51 , et proposons
des hypothèses d'hybridation intertribale qui sont ensuite testées en
utilisant la statistique D de Patterson (ou le test ABBA/BABA) 52 . Les
réseaux gallés montrent une discordance topologique substantielle entre
les loci (Fig. 4 supplémentaire ) qui peut provenir soit de l'ILS, soit
de l'hybridation. Cependant, étant donné la stochasticité de l'ILS, les
événements réticulés supportés par un nombre relativement élevé d'arbres
génétiques représentent probablement des événements d'hybridation. En
suivant cette stratégie, nous émettons l'hypothèse de deux hybridations
intertribales : (i) une première entre Steatocranini (
Steatocranus casuarius ), l'ancêtre de Bathybathini +
Boulengerochromini, et les lignées restantes (tribus " modernes ")
du troupeau du lac Tanganyika, et (ii) une seconde hybridation entre
Benthochromini et Perissodini.
Les tests D de Patterson ont été
effectués sur toutes les permutations possibles de quatre individus
appartenant à chacun des trois groupes tests et le flux génétique a été
interprété à partir des distributions des statistiques D (Fig. 3 ). Nous
avons trouvé un signal fort de flux génétique entre Steatocranini
et l'ancêtre des tribus « modernes » du lac Tanganyika (toutes les
tribus sauf Bathybatini et Boulengerochromini ) représenté
par des valeurs D négatives ( Z -score > 3 ; p ajusté par Benjamini-Hochberg
< 0,05). Ce signal d'hybridation était cohérent que Bathybatini
ou Boulengerochromini soient utilisés comme P2 et quels que
soient les taxons externes utilisés, alors qu'il disparaissait
clairement lorsque Steatocranini (P3) était remplacé par d'autres
lignées non tanganyikaises proches (c'est-à-dire Heterotilapiini
ou Hemichromini ) (Fig. 3b et Tableau supplémentaire 3 ). Nous
avons également trouvé un soutien solide à la deuxième hypothèse
d'hybridation entre Benthochromini et Perissodini, montrée
par des valeurs D systématiquement négatives ( Z -score > 3 ; p ajusté
< 0,05 ; Tableau supplémentaire 3 ).
.
Figure 3
Hybridation dans le groupe
d'espèces du lac Tanganyika. a Représentation schématique du test D de
Patterson . Les flèches bleues représentent le flux génétique entre des
lignées éloignées, soit P2–P3 (excès ABBA ; D > 0), soit P1–P3 (excès
BABA ; D < 0). b Scénario proposé pour l'hybridation entre
Steatocranini et les tribus « modernes » du lac Tanganyika. c
Hybridation entre Cyphotilapiini et haplochromines. Les
graphiques en violon montrent les distributions des statistiques D de
Patterson à partir de permutations individuelles utilisant différentes
combinaisons de taxons, telles qu'indiquées dans la phylogénie. Les
configurations taxonomiques suivent l'arbre de vraisemblance maximale
concaténé (Fig. 1 supplémentaire ), car il permet de tester les
hypothèses d'hybridation.
.
Sur la base des schémas observés
de flux génétique, nous émettons l'hypothèse que les Steatocranini
fluviaux ont contribué au matériel génétique du rayonnement du lac
Tanganyika, ce qui correspond à un scénario d'essaim hybride. La théorie
de l'essaim hybride a été proposée comme un mécanisme capable de générer
instantanément de nouvelles combinaisons génétiques à partir de
variations permanentes, facilitant ainsi un rayonnement rapide ultérieur
8 . L'hybridation surmonte la nécessité de l'apparition de nouvelles
mutations et favorise ainsi une divergence rapide des traits par la
génération de phénotypes dits transgressifs avec des réponses plus
élevées à la sélection divergente disruptive 8 . La distribution des
statistiques D pour l'introgression entre les Steatocranini et
les tribus « modernes » du lac Tanganyika montre des signaux de flux
génétique plus forts pour la lignée H (en particulier Haplochromini) et
plus faibles pour Lamprologini (Données supplémentaires 2 ). Cela
suggère que le flux génétique entre les Steatocranini et la lignée H
s'est poursuivi après la divergence initiale des lignées tanganyikanes,
peut-être dans des protolacs géographiquement structurés.
Il est intéressant de noter que les tests D par locus ont identifié
plusieurs loci avec un signal d'introgression plus fort, qui sont
associés à la vision, à la coloration du corps, au développement des
nageoires, à la régulation des gènes et à l'immunité (selon les
annotations de l'ontologie des gènes ; Tableau supplémentaire 4 ). De
plus, deux gènes liés aux innovations clés des cichlidés, le gène sp7
(impliqué dans la plasticité phénotypique de la mâchoire 53 ) et
l'opsine sws1 , présentaient de forts signaux d'introgression ( D =
−0,74 et D = −0,14, respectivement). Ensemble, ces éléments de preuve
suggèrent une introgression différentielle des gènes à l'origine de la
radiation adaptative dans le lac Tanganyika.
Des études antérieures ont démontré plusieurs cas d'hybridation
interspécifique parmi les brindilles plutôt que parmi les branches plus
profondes des cichlidés du lac Tanganyika, parfois suggérées par une
discordance cytonucléaire 18 , 23 , 40 , 54 mais aucune preuve
n'existait jusqu'à présent de l'hybridation entre les plus anciennes
lignées majeures (tribus) à la base du rayonnement du lac Tanganyika.
Curieusement, des scénarios d'hybridation comparables avec des lignées
fluviales ont été proposés pour renforcer les radiations des cichlidés
dans les lacs Malawi, Victoria et les lacs de cratère camerounais 23 ,
24 , 55 .En plus de tester les deux événements d'hybridation
nouvellement proposés, nous avons utilisé notre ensemble de données pour
revisiter les événements d'hybridation proposés par Meyer et al. 25 qui
ont utilisé une nouvelle approche basée sur la distribution d'âge des
arbres génétiques. Meyer et al. ont proposé l'introgression de
Cyphotilapiini dans (a) l'ancêtre commun des haplochromines du lac
Tanganyika (c'est-à-dire les Tropheini) et (b)
Pseudocrenilabrus . Nos analyses ont révélé que non seulement
Tropheini, mais aussi Astatoreochromis et les haplochromines
du lac Malawi et de Victoria présentaient des signes d'introgression,
mais que Pseudocrenilabrus n'en présentait pas ( scores Z > 3, p ajusté
< 0,05 ; Fig. 3c et Tableau supplémentaire 3 ). Français Ces résultats
suggèrent qu'un seul événement d'hybridation s'est probablement produit
chez l'ancêtre haplochromine avant la colonisation des lacs Malawi et
Victoria (Fig. 3c ), renforçant ainsi l'hypothèse d'une hybridation
alimentant les radiations adaptatives des haplochromines « modernes » 23
, 24 , 55 . Le rôle de l'hybridation dans l'augmentation des radiations
adaptatives est reconnu depuis longtemps chez les plantes 2 , et il
s'accumule lentement chez les animaux à rayonnement adaptatif également,
y compris chez les pinsons de Darwin 3 et les grenouilles à bouche
étroite 56 . Avec les grenouilles à bouche étroite, nos résultats
contribuent à l'un des cas d'hybridation les plus anciens décrits chez
les animaux (13,7–12,7 Ma).
Meyer et al. 25 ont proposé des
événements d'introgression supplémentaires impliquant
Boulengerochromini (ou l'ancêtre commun de Boulengerochromini
+ Bathybatini) et soit (i) la lignée H, soit (ii) l'ancêtre de
Perissodini + Cyprichromini. Nos résultats montrent des
schémas de flux génétiques contradictoires lorsque Boulengerochromini
ou Bathybatini sont testés (tableau complémentaire 3 ), suggérant
ainsi un scénario d'introgression beaucoup plus complexe.
.
Évolution moléculaire des
gènes associée à des innovations clés
.
Afin de comprendre le rôle et
l'importance relative de l'écologie et du cycle biologique dans la
formation des populations d'espèces du lac Tanganyika, nous avons étudié
l'évolution moléculaire de 29 gènes précédemment associés à des
innovations clés chez les cichlidés : développement des os et des dents
(développement de la mâchoire), coloration et vision des couleurs. Le
lien entre les caractères et les gènes repose sur des recherches
antérieures, notamment des études de génétique prospective sur des
organismes modèles, des annotations d'ontologies génétiques ou des
profils d'expression génétique différentielle chez les cichlidés
(tableau supplémentaire 5 ). En tirant parti du cadre phylogénétique
déduit précédemment (figure 1 ), nous avons étudié les variations des
taux de substitution (d N /d S ) en fonction de la fonction des gènes,
de la phylogénie (effets de lignée), de l'écologie et des caractères du
cycle biologique. Français Les mesures générales de d N /d S (ou
coefficient de sélection, ω M0 ) ont montré que les trois catégories de
gènes ont évolué sous différentes forces de sélection purificatrice : la
plus forte pour les gènes de développement des dents et des os ( ω M0 =
0,014–0,321), la plus faible pour les gènes de la vision des couleurs (
ω M0 = 0,223–0,469) et intermédiaire pour les gènes de coloration ( ω
M0 = 0,105–0,463). Tous les autres loci ancrés non pris en compte dans
les trois catégories précédentes avaient une large gamme de coefficients
de sélection (moyenne ω M0 = 0,166 ± 0,14) (Fig. 4a ). Les différentes
tailles de cibles mutationnelles et les différents niveaux de
pléiotropie des trois classes de gènes peuvent expliquer ce schéma : les
gènes de développement des os et des dents ont une pléiotropie élevée
(beaucoup sont de ménage) et la vision des couleurs est déterminée par
un petit ensemble de gènes d'opsine avec peu d'effets pléiotropes
connus, tandis que les gènes de coloration sont intermédiaires. Français
De plus, la vision des couleurs est déterminée par un petit nombre de
gènes, ce qui facilite l'identification des changements de sélection par
rapport à d'autres caractères quantitatifs tels que le développement de
la mâchoire qui sont contrôlés par de nombreux gènes en interaction de
faible effet. Six des 356 « loci ancrés » non pris en compte dans les
trois catégories étudiées présentaient un d N /d S relativement élevé (
ω M0 > 0,4) et ceux-ci avaient des fonctions liées à la reproduction, à
la croissance cranio-faciale ou aux systèmes digestif et immunitaire
(Tableau supplémentaire 6 ).
.
Figure 4
Évolution moléculaire des gènes
associés aux innovations des cichlidés. a. Force de la sélection
naturelle sur les gènes impliqués dans le développement des dents et des
os (mâchoires), la coloration et la vision des couleurs (cônes-opsines)
par rapport au modèle génomique représenté par les loci ancrés restants.
b. Proportion de sites variables dirigés vers la poche de liaison aux
chromophores des gènes des cônes-opsines. Les barres ombrées
représentent le sous-ensemble de substitutions d'acides aminés
entraînant des changements de polarité. c. Répartitions des espèces
utilisées dans les tests du modèle Clade C (CmC) selon les
caractéristiques phylogénétiques, écologiques ou biologiques. Les noms
des gènes sont indiqués sous les modèles CmC présentant le pouvoir
explicatif le plus élevé (AIC le plus faible) pour les partitions basées
sur la phylogénie et l'écologie/le cycle biologique. LT, lac Tanganyika
; Haplo., Haplochromini
.
Treize des 29 gènes étudiés ont
montré des preuves significatives de sélection positive (détectées en
utilisant des modèles de sites aléatoires M2a/M1a dans PAML 57 , test du
χ 2 avec 2 df, après correction de Benjamini-Hochberg pour les tests
multiples) (tableau supplémentaire 7 ). Tous les gènes responsables de
la vision des couleurs étaient sous sélection positive et analysés
ultérieurement en détail. Deux des onze gènes associés au développement
des os et des dents ( c-fos, col6a1 ) ont montré des signes de sélection
positive. La régulation différentielle de ces gènes dans la mâchoire
pharyngienne inférieure à travers les stades de développement et dans
les études expérimentales de la plasticité en réponse au régime
alimentaire 58 , 59 suggère qu'ils jouent un rôle dans la détermination
de la taille et de la forme de la mâchoire pharyngienne inférieure, une
innovation clé étroitement associée à la source de nourriture 60 .
Français Quatre des onze gènes de coloration précédemment associés à la
survie, à la différenciation et à la migration des mélanocytes (tableau
supplémentaire 7 ) ont montré des signes de sélection positive : csf1ra,
dlc, kita et kitla . On a émis l'hypothèse que le gène csf1ra était
soumis à une sélection positive chez les haplochromines et impliqué dans
la formation des taches d'œufs 61 , mais nos analyses du modèle Clade C
(CmC) ont révélé qu'un scénario alternatif de changements de taux à
l'origine du troupeau du lac Tanganyika et dans les Haplochromini
était plus probable (δAIC = 28,33 ; groupe externe ω = 0,808, lac
Tanganyika ω = 0,047, Haplochromini ω = 1,089 ; tableau
supplémentaire 9 ). Le scénario de changement à trois taux a également
été privilégié pour kita , impliqué dans le développement des
mélanophores, mais les cichlidés non haplochromines du Tanganyika ont
affiché les taux les plus rapides (exogroupe ω = 2,834, lac Tanganyika ω
= 6,492, Haplochromini ω = 3,796 ; tableau supplémentaire 9 ).
Le gène dlc , un contributeur majeur à la formation des motifs de
rayures chez le poisson zèbre, montre une accélération de la sélection
positive chez les Haplochromini (Fig. 4c , tableau supplémentaire
9 ; non haplochromines ω = 0,658, Haplochromini ω = 18,527).
Les modèles CmC pour kitla ne se sont pas avérés statistiquement
déviants de l'évolution neutre. Bien que le test du site M2a/M1a ne soit
pas significatif pour hag (tableau supplémentaire 7 ), ce gène avait été
précédemment supposé être soumis à une sélection positive chez les
haplochromines 62, un résultat confirmé par nos analyses qui révèlent
une différence de taux significative (non-haplochromines ω = 0,103,
Haplochromini ω = 10,945 ; Tableau supplémentaire 9 ). Pour les
cinq gènes associés à la couleur mentionnés, les CmC tenant compte des
effets de lignée correspondaient mieux aux données que ceux tenant
compte des changements de taux associés à la présence d'un dimorphisme
de couleur lié au sexe (Tableau supplémentaire 9 ).
Les radiations adaptatives, qui
présentent une vaste diversité phénotypique en l'absence de différences
moléculaires prononcées, pourraient être considérées comme un
laboratoire de « mutants naturels » qui peuvent aider à identifier des
variantes fonctionnelles de gènes, un peu comme les criblages de
mutagenèse dans les organismes modèles 6 , 7 . Le criblage de variantes
aux effets potentiellement importants a révélé des codons stop
prématurés dans mitfa et kita , deux gènes essentiels à la survie des
mélanophores qui pourraient contribuer aux phénotypes xanthiques (par
exemple, Ctenochromis horei ). Les codons stop prématurés étaient
également répandus chez Bathybatini pour dlc et hag , où
certaines espèces naturelles ont perturbé les motifs barrés ressemblant
à des mutants knockout du poisson zèbre de ces gènes 63 .
..
L'alimentation est une force
majeure qui façonne l'évolution des opsines
.
L'évolution moléculaire des
cônes-opsines (vision des couleurs) a été analysée plus en détail.
L'association génotype-phénotype des cônes-opsines est simple, les
conséquences phénotypiques des remplacements d'acides aminés sont bien
comprises et des travaux approfondis sur l'opsine 21 de cichlidés
fournissent une base solide pour l'interprétation de nos résultats. Les
sites des poches de liaison aux chromophores sont très variables dans
tous les gènes des cônes-opsines (Fig. 4b ) et souvent soumis à une
sélection positive (Tableau supplémentaire 7 ). Cela suggère
l'apparition de modifications structurelles dans les opsines étudiées,
susceptibles de modifier la sensibilité spectrale. Cependant, des
preuves directes de modifications de la sensibilité spectrale
nécessiteraient des expériences de microspectrophotométrie et de
validation fonctionnelle.
Six des sept gènes d'opsine ont montré des taux plus rapides de
sélection positive dans le troupeau d'espèces du lac Tanganyika (Fig. 4c
et Tableau supplémentaire 10 ), ce qui suggère que ce rayonnement
adaptatif a coïncidé avec la diversification du système visuel 64 . Pour
le septième gène lws , un modèle montrant une décélération de la
sélection positive dans le troupeau du lac Tanganyika suivie d'une
accélération dans Haplochromini correspondait le mieux aux données.
Selon l'AIC, CmC prenant en compte les taux divergents associés aux
traits écologiques expliquait mieux la variation de séquence que les
modèles neutres dans cinq des sept opsines (Fig. 4c et Tableau
supplémentaire 11 ). Dans quatre de ces cinq gènes, le régime
alimentaire avait le pouvoir explicatif le plus élevé parmi tous les
facteurs écologiques et du cycle biologique testés (Fig. 4c ). Par
exemple, les cichlidés planctonophages affichent des taux d'évolution
plus rapides pour l'opsine sws1 sensible aux UV , ce qui concorde avec
l'expression plus élevée observée de ce gène par rapport aux autres
cichlidés 65 . Français Cette découverte concorde avec le fait qu'une
sensibilité accrue aux UV conférerait une plus grande efficacité dans la
recherche de nourriture sur le plancton, qui est translucide sauf sous
la lumière UV. En revanche, les cichlidés broutant des Aufwuchs (algues
adhérant aux surfaces ouvertes et autres petits organismes et matières
organiques qui y sont attachés) présentent les taux les plus rapides
dans l'opsine rh2a-α sensible au vert . La CmC permettant des taux
différents chez les cichlidés vivant en eau peu profonde et ceux vivant
en eau profonde s'adapte mieux aux données pour lws (absorption λ max
~565 nm) et en deuxième position pour sws1 (absorption λ max ~375 nm),
dans les deux cas les cichlidés vivant en eau peu profonde ayant des
taux de sélection positive plus rapides. En revanche, les cichlidés
vivant en eau profonde avaient des taux plus élevés pour sws2b
(absorption λ max ~425 nm). Cela est logique étant donné que les UV et
la lumière rouge sont diminués du spectre lumineux en eau profonde 66 .
Ces données corroborent la pseudogénisation de sws1 chez la tribu des
Bathybatini vivant en eaux profondes (tous les individus présentaient
des codons stop prématurés). Malgré des différences notables dans l'AIC
avec d'autres modèles, la répartition de CmC en fonction de la
profondeur n'était pas significative pour lws après correction de
Benjamini-Hochberg. Ces résultats, combinés à des études antérieures
ayant révélé une évolution divergente de l'opsine rh1 de faible
luminosité entre les cichlidés du Tanganyika d'eaux profondes et peu
profondes 67, soutiennent la profondeur comme un moteur important dans
l'évolution des opsines sensibles à la couleur. Les modèles CmC tenant
compte des différences entre les espèces avec et sans dimorphisme de
couleur lié au sexe et entre les cichlidés se reproduisant sur substrat
et les cichlidés se reproduisant dans la bouche s'ajustent aux données
significativement mieux que le modèle nul (évolution neutre) uniquement
pour les gènes d'opsines sensibles aux courtes longueurs d'onde
(absorption λ max < 470 nm). Dans tous les cas, les espèces
sexuellement monomorphes et se reproduisant sur substrat avaient des
taux plus rapides que les cichlidés sexuellement dimorphes ou se
reproduisant dans la bouche (tableau supplémentaire 11 ). Les analyses
évolutives moléculaires des 29 loci associés à l'innovation sélectionnés
ont révélé des schémas intéressants liés aux radiations adaptatives, à
l'écologie et au cycle biologique des cichlidés, mais la généralité de
ces résultats devra être confirmée, réfutée ou ajustée en utilisant des
approches génomiques plus larges telles que le reséquençage du génome.
.
Conclusions
.
À partir d'un vaste ensemble de
données phylogénomiques ancrées, nous avons pu formuler une hypothèse
phylogénétique robuste et calibrée temporellement pour la famille des
cichlidés, en nous concentrant sur la radiation du lac Tanganyika,
réservoir évolutif de toutes les principales radiations des cichlidés
d'Afrique de l'Est. Notre arbre est le plus complet à ce jour en termes
de diversité phylogénétique, de taxons et de nombre de gènes. Les dates
de divergence estimées ici concordent avec deux événements géologiques
majeurs de l'histoire des cichlidés : la radiation du groupe d'espèces
du lac Tanganyika coïncide avec la formation du lac, et les divisions
les plus profondes de l'arbre des cichlidés concordent avec la
vicariance gondwanienne. Nous avons trouvé de nouvelles preuves
d'hybridation au début du groupe d'espèces du Tanganyika et suggérons
que cet événement aurait pu amplifier la radiation adaptative
ultérieure. À l'appui de cette hypothèse, nous avons trouvé un signal
fort d'introgression dans les gènes responsables de la vision des
couleurs et du développement de la mâchoire, deux innovations clés chez
les cichlidés. Grâce à ce nouveau cadre phylogénétique robuste, nous
avons examiné l'évolution moléculaire de 29 gènes associés à des
innovations clés chez les cichlidés afin d'évaluer la contribution
relative des effets de lignée, de l'écologie et des traits du cycle
biologique. Plusieurs de ces gènes associés à l'innovation présentent
une accélération de la sélection positive qui coïncide avec l'origine du
groupe du lac Tanganyika, et parmi les traits écologiques étudiés, le
régime alimentaire explique une grande partie de la variabilité.
L'ensemble de nos résultats contribue à une meilleure compréhension des
schémas et des processus qui façonnent la radiation adaptative des
cichlidés du lac Tanganyika et des Grands Lacs d'Afrique de l'Est.
.
Méthodes
.
Séquençage de loci ancrés et
assemblage de jeux de données
.
Nous avons inclus des
représentants de cichlidés de toutes les principales lignées et régions
géographiques (Inde 2 sp., Madagascar 4 sp., Néotropiques 6 sp., Grands
Lacs d'Afrique de l'Est 114 sp. et espèces fluviales africaines 23 sp.).
L'échantillonnage taxonomique a mis l'accent sur le rayonnement du lac
Tanganyika en incluant toutes les tribus à l'exception des Trematocarini
(aucun tissu de qualité suffisante n'était disponible). Des informations
détaillées sur l'échantillonnage taxonomique sont disponibles dans le
tableau supplémentaire 1. Les échantillons de tissus ont été acquis
auprès du commerce d'aquariums ou de populations sauvages. Pour ces
dernières, l'échantillonnage et l'exportation ont été effectués dans le
cadre d'un protocole d'accord entre le Département des pêches, le
Ministère de l'agriculture et de l'élevage, la République de Zambie, et
les universités de Zambie à Lusaka, Graz, Berne et Bâle (2008-2013). Des
prélèvements et des exportations supplémentaires ont été autorisés par
le ministère de l'Agriculture de Zambie (permis S1248/08 à C. Sturmbauer)
et le ministère de l'Environnement et des Ressources naturelles du
Nicaragua (permis DGPN/DB/DAP/IC-0003-2012 à A. Meyer). Les prélèvements
et les exportations de tissus ont été effectués conformément à la
réglementation locale et aux normes éthiques en vigueur.
Les données phylogénomiques ont été
générées au Center for Anchored Phylogenetics (
www.anchoredphylogeny.com ) en utilisant la méthodologie
d'enrichissement hybride ancré 68 . Brièvement, l'ADN a été extrait des
clips de nageoires à l'aide du ZR-96 Genomic DNA Tissue MiniPrep (Zymo,
CA, États-Unis) et les extraits d'ADN ont été cisaillés à 150-300 pb à
l'aide d'un ultrasonateur focalisé Covaris E220. Les bibliothèques
indexées ont été préparées sur un robot de manipulation de liquides
Beckman-Coulter Biomek FXp selon Meyer et al. 69 avec une étape
supplémentaire de sélection de taille après la réparation des extrémités
franches à l'aide de billes SPRIselect (Beckman-Coulter ; rapport
billes:volume d'échantillon de 0,93). Les échantillons indexés ont été
regroupés en quantités égales (12-16 échantillons par pool) et des
enrichissements ont été effectués sur chaque pool multi-échantillons à
l'aide d'un kit Agilent Custom SureSelect (Agilent Technologies,
Californie, États-Unis). Après enrichissement, les pools ont été
regroupés en quantités égales pour le séquençage en quatre pistes
Illumina HiSeq2000 de 150 pb appariées. Le séquençage a été réalisé au
Translational Science Laboratory de la faculté de médecine de
l'université d'État de Floride. Les lectures appariées se chevauchant
provenant de fragments < 280 pb ont été fusionnées, les erreurs de
séquençage corrigées et les séquences adaptatrices supprimées. Les
lectures ont été assemblées à l'aide d'une approche quasi-de novo dans
un pipeline interne 70 . Des ensembles orthologues ont été identifiés à
partir des séquences consensus assemblées en utilisant la similarité des
séquences et le clustering dans un processus de type neighbor-joining 70
.
Les loci ciblés correspondent aux
loci ancrés pour les téléostéens 71 , conçus à partir d'exons
individuels de 260 familles de gènes sélectionnées pour leur bonne
performance phylogénétique et leur faible nombre de copies. De plus,
nous avons complété l'ensemble d'appâts avec 29 gènes (176 exons) avec
des fonctions liées à la vision des couleurs, à la coloration et à la
formation des os et des dents (Tableau supplémentaire 5 ). Des sondes
pour les 29 gènes candidats ont été conçues à partir d'alignements
d'exons de trois cichlidés africains ( Oreochromis niloticus ,
Metriaclima zebra et Pundamilia nyererei ) en utilisant les
annotations du génome d'O. niloticus (Orenil1.0).
En plus des espèces
échantillonnées, des séquences homologues de neuf génomes de cichlidés
disponibles ont été ajoutées aux alignements de loci ancrés : O.
niloticus 72 , Astotilapia burtoni 72 , M. zebra 72 ,
Neolamprologus brichardi 72 , P. nyererei 72 ,
Amphilophus citrinellus (A. Meyer, Université de Constance),
Andinoacara coeruleopunctatus (M. Malinsky, Wellcome Trust Sanger
Institute), Petrochromis trewavasae et Tropheus moorii (C.
Sturmbauer, Université de Graz). Les orthologues ont été identifiés par
des recherches BLAST réciproques et les coordonnées des correspondances
ont été étendues de 500 pb en amont et en aval pour capturer les régions
moins conservées flanquant les exons. Les loci individuels ont été
alignés avec MAFFT v.7245 73 et les positions avec >80% d'écarts ont été
supprimées. Huit des 541 loci initialement assemblés ont été exclus en
raison d'une paralogie suspectée : un locus (KCNJ13) a produit des
correspondances BLAST dans deux régions du génome d'O. niloticus
et a été identifié comme dupliqué 72 ; les sept loci restants
présentaient une proportion élevée (> 3 %) d'appels de bases ambigus,
suggérant que des séquences consensus pourraient avoir été assemblées à
partir de lectures provenant de plusieurs paralogues. Des distances
génétiques par paires et une visualisation manuelle des alignements ont
été utilisées pour garantir une orthologie correcte et supprimer toute
séquence non homologue dans les génomes ajoutés.
.
Analyses phylogénomiques et
estimation des temps de divergence
.
Un arbre de vraisemblance
maximale concaténé a été construit avec RAxML v.7.3.1 74 en utilisant
des modèles GTR + Γ indépendants par gène et le support de branche
évalué par 500 pseudo-répliques de bootstrapping non paramétrique. Un
arbre coalescent a été estimé avec ASTRAL II 75 avec des paramètres par
défaut en utilisant des arbres de locus de vraisemblance maximale
estimés avec RAxML. Le support de branche pour l'arbre coalescent a été
évalué par des probabilités postérieures locales et 100 réplicats de
bootstrapping multi-locus avec rééchantillonnage de site. Nous avons
évalué le degré de conflit au niveau des branches internes en utilisant
la certitude inter-nœud telle qu'implémentée dans RAxML v.8.1.20 après
application d'une correction probabiliste pour les arbres génétiques
partiels 38 . Une analyse de jackknifing génétique 76 a été réalisée
pour estimer la proportion de bipartitions de l'arbre final récupérées
par coalescence ou concaténation en fonction de la taille de l'ensemble
de données. 100 réplicats jackknife ont été générés pour chacun des
ensembles de 10, 100, 200, 300, 400 et 500 loci sélectionnés au hasard
et analysés séparément avec ASTRAL et RAxML.
La datation moléculaire a été
réalisée avec RelTime 77 tel qu'implémenté dans MEGA-CC v.7.0.20 78 .
Nous avons utilisé le GTR + Γ avec cinq catégories gamma (le modèle
prédominant pour les loci uniques identifiés avec jModeltest 79 ),
supposé le modèle « horloges locales », réglé le filtre d'échange de
branches sur « Aucun » et fixé la topologie à celle de l'arbre de
vraisemblance maximale (Fig. 1 supplémentaire ). Pour obtenir des temps
de divergence robustes et comprendre l'effet de différents étalonnages
fossiles, nous avons effectué des analyses indépendantes en utilisant
dix schémas d'étalonnage : Le premier schéma (C01) supposait des
divisions vicariantes associées à la fragmentation gondwanienne. Les
schémas C02-C03 utilisent respectivement cinq et quatre étalonnages
fossiles et sont donc indépendants des hypothèses de vicariance. Les
schémas C04-C05 étendent respectivement C02-C03 en appliquant des
contraintes maximales pour les nœuds affectés par la vicariance dans
C01. Les schémas C06–C10 correspondent exactement aux schémas C01–C05, à
la différence qu'ils incluent tous † Tugenchromis pickfordi 37 (voir le
tableau supplémentaire 2 pour plus de détails sur les schémas
d'étalonnage). RelTime utilise uniquement les bornes d'étalonnage
minimales et maximales sans supposer de distribution de probabilité
spécifique. Le logiciel BEAST, couramment utilisé, s'est avéré peu
performant sur ce vaste ensemble de données, qui n'a pas pu converger
malgré de longs temps d'exécution sur de puissants serveurs multi-CPU et
multi-GPU.
.
Tests d'hybridation
.
Le signal d'hybridation a été
exploré à l'aide de réseaux gallés, construits comme suit : SplitsTree4
80 a été utilisé pour générer un super-réseau filtré à partir de 533
arbres de locus de vraisemblance maximale non enracinés en utilisant la
méthode de fermeture Z 81 , qui tient compte de l'échantillonnage
incomplet des taxons sur les loci. Après avoir filtré les divisions
supportées par < 50 arbres de locus, nous estimons les réseaux gallés
avec la méthode de fermeture Z dans Dendroscope3 82 en utilisant
différents seuils (10, 15, 20, 25, 30, 40, 50) qui correspondent au
pourcentage d'arbres de locus qui supportent les arêtes du réseau. Nous
avons utilisé le réseau gallé avec des arêtes réticulées supportées par
≥ 20 % d'arbres de locus (Fig. 4 supplémentaire ) pour formuler des
hypothèses d'hybridation car il représente un bon compromis entre le
support de l'arbre de locus et le nombre total d'hybridations. Français
Suivant cette stratégie, deux hybridations intertribales ont été
hypothétisées et testées plus en détail en utilisant la statistique D de
Patterson 52 telle qu'implémentée dans le package R evobiR ( https://github.com/coleoguy/evobir
) d'après Durand et al. 83 . De plus, nous avons revisité les hypothèses
d'hybridation proposées par Meyer et al. 25 . Pour chaque hypothèse,
nous avons sélectionné trois lignées pertinentes et un groupe externe
conformes à un arbre asymétrique à quatre taxons requis par les tests D
, en suivant la topologie de vraisemblance maximale (Fig. 1
supplémentaire ) et en veillant à ce que tous les événements de flux
génétique hypothétiques puissent être testés. Les tests D de Patterson
ont été effectués sur toutes les permutations possibles d'individus
appartenant à chacun des quatre groupes de test, générant des
distributions de statistiques D (résumées dans des graphiques en
violon). Pour mesurer la signification de ces tests, les scores Z et les
valeurs p ont été calculés à partir de 100 réplicats bootstrap des
tests. Les valeurs de p ont été ajustées pour les tests multiples à
l'aide de la méthode de Benjamini-Hochberg. Pour l'hypothèse
d'hybridation principale (Fig. 3b ), des tests D par gène ont été
réalisés en regroupant tous les taxons pertinents en quatre groupes
tests (LTm, Bou + Bat, Ste, Til ; sensu Fig. 3b ) ; les loci avec trop
peu (< 5) de sites ABBA ou BABA ont été filtrés, et les loci avec un
fort signal d'hybridation ont été annotés à l'aide d'ontologies
génétiques (dérivées d' O. niloticus 64 ) et synthétisés avec REVIGO 84
. Afin d'éviter d'éventuels biais dans l'appel des bases dus à
l'hétérozygotie, tous les tests D ont été réalisés sur des haplotypes
phasés bioinformatiquement 85, en choisissant aléatoirement un allèle
par individu et par locus. Afin d'exclure les biais dus au choix d'un
groupe externe lors des tests D , ces tests ont été répétés avec
différents groupes externes. Le résumé de tous les tests D est
disponible dans le tableau supplémentaire 3 et les informations
détaillées sur toutes les permutations dans les données supplémentaires
2 .
.
Analyses évolutives
moléculaires des loci liés à l'innovation
.
Les séquences codantes de 176
alignements de loci individuels ont été extraites et concaténées en 29
alignements de gènes en utilisant le génome d'O. niloticus comme
référence. Toute séquence contenant des codons stop prématurés dans l'ORF
a été exclue. Les alignements de gènes pour rh2a-α et rh2a-ß ont été
dérivés d'allèles phasés bioinformatiquement 85 car le pipeline
d'assemblage par défaut ne pouvait pas démêler ces paralogues proches.
Nous avons analysé d N /d S en utilisant des modèles de sites aléatoires
dans PAML v.4.8 57 . Des tests de rapport de vraisemblance (LRT) ont été
utilisés pour calculer la significativité des modèles de sites
aléatoires testant la variation de d N /d S entre les sites (M3/M0) et
la sélection positive (M2a/M1a) et dans ce dernier cas, les sites sous
sélection positive ont été identifiés en utilisant la méthode Bayes
empirique de Bayes dans PAML et les résultats ont été comparés à ceux
obtenus par les méthodes SLAC, MEME, FUBAR et FEL dans HYPHY 86 .
Français En utilisant le modèle Clade C (CmC) dans PAML, nous avons
testé les effets de lignée et les facteurs écologiques et du cycle de
vie comme moteurs de l'évolution moléculaire, de manière similaire aux
travaux précédents sur le gène rh1 des cichlidés néotropicaux 64 . Le
CmC permet aux taux de sites sélectionnés positivement de varier parmi
des groupes d'espèces définis a priori (branches d'arrière-plan vs. de
premier plan). La signification du CmC a été testée par rapport à un
modèle nul d'évolution neutre (M2a_rel 87 ) par LRT et l'ajustement
relatif des différents modèles CmC en supposant différentes partitions
de taxons a été comparé par AIC. Les partitions spécifiques à la lignée
suivantes ont été utilisées : (i) groupes d'espèces du Tanganyika vs.
tous les autres cichlidés, (ii) Haplochromini vs. tous les autres
cichlidés, et (iii) Tanganyika-Haplochromini, similaire à (i) mais en
supposant des taux indépendants pour les Haplochromini (Fig. 4c ). Afin
de tester la variation associée au cycle biologique ou aux facteurs
écologiques des opsines, les analyses ont été centrées sur le groupe du
lac Tanganyika, car celui-ci présentait des taux nettement plus élevés
que le groupe externe. Des partitions taxonomiques pour les traits
d'écologie et de cycle biologique ont été définies à partir de
reconstructions des états de caractères ancestraux afin de définir ces
partitions de manière plus objective. Tout d'abord, les espèces ont été
classées selon (i) leur régime alimentaire (zoobenthos, necton,
plancton, Aufwuchs ou généraliste), (ii) leur habitat (eaux profondes ou
eaux peu profondes), (iii) leur mode de reproduction (incubateurs sur
substrat ou incubateurs buccaux) et (iv) la présence ou l'absence de
dimorphisme sexuel de couleur (Fig. 4c ). Les états ancestraux ont été
déduits pour chaque caractère (Fig. 5 à 8 supplémentaires ) grâce à la
méthode de réenracinement implémentée dans le package R phytools 88.Le
codage des caractères chez les taxons terminaux a suivi un certain
nombre de ressources, y compris la littérature, les bases de données
numériques ( www.fishbase.org ) et les observations de terrain (S.
Koblmüller). Pour minimiser le nombre de transitions et éviter les
erreurs stochastiques des arbres géniques uniques, les reconstructions
ancestrales et les calculs d N /d S ont supposé la topologie de
vraisemblance maximale (Fig. 1 supplémentaire ) et seuls les changements
avec une probabilité postérieure marginale > 0,85 ont été pris en
compte. Les analyses basées sur les arbres géniques n'ont pas modifié
qualitativement les résultats obtenus. Tous les tests ont été ajustés
pour les tests multiples en utilisant la procédure de Benjamini-Hochberg.
.
Les ensembles de données finaux
sont disponibles sur Figshare ( https://doi.org/10.6084/m9.figshare.6182519
).