Texte à méditer :   Les cons de l'an passé se sont nettement améliorés ... Si, si ... Ils ont acquis un an d'expérience supplémentaire ...eek   
 
 
► News ... ◄
► Menu ◄
►++++++◄
► Divers ◄
Recherches
Recherches
 ↑  
Compteur

   visiteurs

   visiteurs en ligne

 ↑  
Infos Webmaster
La phylogénomique révèle une hybridation précoce et des loci adaptatifs façonnant le rayonnement des poissons cichlidés du lac Tanganyika -  Publié:
.
Le lac Tanganyika est le plus ancien et le plus diversifié phénotypiquement des trois radiations adaptatives des cichlidés d'Afrique de l'Est. Il est également le berceau des radiations parallèles plus récentes des cichlidés haplochromines des lacs Malawi et Victoria. Malgré son importance évolutive, les relations entre les principales lignées du lac Tanganyika sont restées non résolues, tout comme la chronologie générale de l'évolution des cichlidés. Nous démêlons ici la structure phylogénétique profonde de la radiation du lac Tanganyika grâce à la phylogénomique ancrée et mettons en évidence l'hybridation à sa base, ainsi qu'au début de la radiation des haplochromines. Cela suggère que l'hybridation pourrait avoir facilité ces poussées de spéciation. Des arbres temporels calibrés soutiennent que la radiation des cichlidés du Tanganyika a coïncidé avec la formation du lac et que la vicariance gondwanienne a coïncidé avec les premières divisions de l'arbre généalogique des cichlidés. Les gènes liés aux innovations clés montrent des signes d'introgression ou de sélection positive suite à la colonisation des habitats lacustres, et les adaptations alimentaires des espèces se révèlent être des moteurs majeurs de l'évolution de la vision des couleurs. Ces résultats éclairent les processus qui façonnent l’évolution des radiations adaptatives.
.
La spéciation rapide, lorsqu'elle est associée à une opportunité écologique, peut donner naissance à une multitude d'espèces en peu de temps, un processus connu sous le nom de radiation adaptative 1 . Plusieurs lignées se sont diversifiées grâce à ce processus, notamment les épées argentées d'Hawaï 2 , les pinsons de Darwin 3 et les cichlidés d'Afrique de l'Est 4 . L'étude des radiations adaptatives est cruciale pour mieux comprendre les facteurs qui déterminent la spéciation 5 . Cependant, il s'est avéré difficile de démêler le cadre géographique, l'écologie, les causes génétiques, les points communs et les particularités des différentes radiations adaptatives 6 , 7 . Des changements abiotiques soudains tels que de nouvelles îles volcaniques ou de nouveaux lacs peuvent fournir des niches vides qui facilitent la diversification. La spéciation peut également être favorisée par des traits clés qui permettent l'exploitation de nouvelles niches, ou par un flux génétique entre des lignées divergentes qui produisent des phénotypes transgressifs montrant des réponses plus rapides à la sélection divergente 8 .
Les poissons cichlidés (Cichlidae), avec plus de 1700 espèces décrites, sont un système modèle pour l'étude du rayonnement adaptatif, de la diversification écomorphologique et de la spéciation 4 , 6 . Les Grands Lacs d'Afrique de l'Est abritent environ 90 % de toutes les espèces de cichlidés décrites à ce jour 9 , qui sont le résultat d'une évolution réussie façonnée par une spéciation axée sur la vicariance et les opportunités 10 . Comprendre l'histoire évolutive des cichlidés et les facteurs contribuant à leur diversification a été une quête majeure pour une communauté toujours croissante de biologistes évolutionnistes. Cependant, malgré des décennies de recherche, certaines relations évolutives cruciales restent non résolues et le moment des divergences entre les principales lignées est toujours controversé. Ainsi, l'établissement d'une phylogénie robuste et calibrée dans le temps est une première exigence pour retracer les modèles de diversification (dans le temps et l'espace) et pour mieux comprendre les facteurs qui ont façonné leur rayonnement adaptatif. De plus, le rôle et l’importance relative de l’hybridation, de l’écologie ou du cycle biologique dans la formation des radiations des cichlidés restent mal compris.
L'inférence phylogénétique des lignées à rayonnement adaptatif s'est avérée difficile à la fois avec la morphologie 4 et les molécules 11 . La diversification rapide empêche l'accumulation de changements dérivés partagés et augmente la rétention du tri de lignée incomplet (ILS) dans les génomes, tandis que la convergence écomorphologique et l'hybridation compliquent davantage les méthodes d'inférence phylogénétique. Malgré les nombreuses études qui ont contribué à clarifier la phylogénie des cichlidés (revues dans Koblmüller et al. 12 ), des désaccords considérables existent toujours concernant les relations clés, en partie à cause du peu de marqueurs peu informatifs disponibles et de la rareté des fossiles, qui sont également problématiques en raison de l'évolution parallèle fréquente d'écomorphologies similaires 13 , 14 . L'une des principales questions ouvertes est la structure phylogénétique profonde du rayonnement du lac Tanganyika, le plus ancien des Grands Lacs d'Afrique de l'Est. Le lac Tanganyika abrite l'assemblage d'espèces le plus diversifié sur le plan écologique, morphologique et génétique 12 . Français Elle détient également la clé pour comprendre l'origine des cichlidés haplochromines, la lignée la plus riche en espèces qui a ensemencé les radiations dans les lacs Malawi et Victoria et a également recolonisé le lac Tanganyika 9 , 15 . Alors que la monophylie des tribus de cichlidés est bien établie, leurs interrelations restent vivement débattues 11 , 15 , 16 , 17 , 18 . Plusieurs études ont examiné la macroévolution des cichlidés 19 , mais étant donné les incertitudes phylogénétiques actuelles, les arbres utilisés pourraient ne pas refléter la « véritable » histoire de l'espèce 16 . Une hypothèse phylogénétique robuste pour les cichlidés permettra non seulement de résoudre les controverses existantes, mais elle permettra également de comprendre l'origine et l'évolution des innovations clés, des changements du cycle biologique et de clarifier davantage les modèles de convergence et d'évolution parallèle qui caractérisent les radiations des cichlidés.
La diversification rapide des cichlidés d'Afrique de l'Est a été attribuée à des innovations clés, notamment (i) le découplage fonctionnel des mâchoires orales et pharyngiennes facilitant l'exploitation de diverses sources trophiques 20 , (ii) l'adaptation de la vision à différentes turbidités de l'eau 21 , et (iii) la coloration corporelle associée à la sélection sexuelle et à l'isolement reproductif 22 . L'importance relative de ces innovations est mal comprise, étant donné que la plupart des études précédentes se sont concentrées sur l'effet de facteurs uniques sur ces traits, ou ont analysé les traits isolément. Le manque d'études modélisant simultanément différents facteurs écologiques et du cycle biologique entrave l'identification des relations hiérarchiques entre eux, ainsi que l'identification des changements spécifiques à la lignée 6 .
En plus des innovations clés, l'hybridation a également été proposée comme un facteur majeur façonnant les radiations des cichlidés d'Afrique de l'Est 8 . L'hybridation a été démontrée au début des troupeaux de cichlidés du lac Malawi et de Victoria 23 , 24 et suggérée pour alimenter ces radiations. Certaines études ont proposé un scénario similaire pour le lac Tanganyika 18 , 25 , mais jusqu'à présent aucune étude n'a démontré la présence d'hybridation à la base de cette radiation, un impératif pour invoquer son rôle dans la stimulation de cette diversification.

L'intégration de la datation moléculaire aux événements géologiques peut identifier les facteurs écologiques pertinents facilitant les radiations et fournir un contrôle indépendant pour les hypothèses d'hybridation. On suppose que le groupe d'espèces du lac Tanganyika est apparu au même moment que la formation et la maturation du lac il y a 12 à 9 Ma 26 . Cependant, les analyses de datation moléculaire ont suggéré des âges nettement différents d'environ 51 à 16 Ma 9 , 27 , 28 , 29 , 30 , 31 . Une controverse persiste également concernant les estimations d'âge pour les divergences les plus profondes dans l'arbre généalogique des cichlidés. On a initialement supposé que celles-ci suivaient la vicariance gondwanienne 32 , 33 , 34 , 35 . Les datations moléculaires récentes ont récupéré des âges significativement plus jeunes pour ces divisions qui contredisent le scénario de vicariance et ont donc émis l'hypothèse d'une dispersion transocéanique à longue distance des cichlidés 25 , 29 , 30 . Français En revanche, les datations moléculaires antérieures utilisant des étalonnages vicariants ont estimé des divergences beaucoup plus anciennes chez les cichlidés africains qui sont difficiles à concilier avec l'âge et l'histoire géologique des Grands Lacs africains et la biologie de leurs espèces endémiques 9 , 12 . La difficulté d'estimer des divergences cohérentes simultanément dans les régions plus profondes et moins profondes de l'arbre provient en partie de la rareté des fossiles fiables pour l'étalonnage (le plus ancien connu n'a que 45 millions d'années 36 ) et de l'absence d'une estimation fiable de la fréquence de l'horloge moléculaire pour les cichlidés.

 Ici, nous tentons de reconstruire un arbre généalogique robuste de cichlidés en nous concentrant sur le troupeau du lac Tanganyika, qui est calibré dans le temps en utilisant un fossile de cichlidé d'Afrique de l'Est récemment décrit 37 . Les réseaux phylogénétiques et les statistiques D de Patterson sont utilisés pour examiner les signaux d'hybridation entre les tribus de cichlidés. Nous trouvons des preuves d'hybridations à la base du troupeau du lac Tanganyika et de la tribu Haplochromini qui a ensemencé les radiations dans les lacs Malawi et Victoria. Ces résultats soutiennent le rôle de l'hybridation dans l'amplification de toutes les radiations majeures des cichlidés en Afrique de l'Est. En utilisant le nouveau cadre phylogénétique, nous analysons l'évolution moléculaire des gènes associés aux innovations clés des cichlidés. Nous trouvons une sélection positive associée à la colonisation du lac Tanganyika et identifions le régime alimentaire comme l'un des facteurs écologiques les plus importants.

.
Résultats et discussion
.
La phylogénomique ancrée résout le rayonnement du lac Tanganyika
.
Notre ensemble de données comprend 533 loci ancrés pour 149 espèces (950 518 positions nucléotidiques alignées filtrées, 5,1 % de données manquantes), représentant toutes les principales lignées de cichlidés en mettant l'accent sur le rayonnement du lac Tanganyika (tableau supplémentaire 1 ). L'arbre coalescent (Fig. 1 ) et l'arbre concaténé (Fig. 1 supplémentaire ) ont tous deux produit des topologies d'arbres hautement (~ 91 %) congruentes, la plupart des nœuds recevant un support bootstrap complet. Les différences entre les deux arbres (27/297 ou ~ 9 % des nœuds) sont limitées aux cichlidés d'Afrique de l'Est et affectent principalement les relations au sein des tribus, à deux exceptions près (voir ci-dessous). La difficulté de reconstruire de manière fiable les relations intertribales dans le lac Tanganyika est bien illustrée par la faible certitude entre les nœuds 38 pour ces nœuds, contrairement aux valeurs relativement élevées (> 80 %) pour la monophylie de la plupart des tribus (Fig. 1 et Fig. 2 supplémentaire ). La congruence entre les arbres coalescents et concaténés peut surprendre au premier abord, étant donné que la concaténation, contrairement à la coalescence, ne prend pas en compte l'ILS. En fait, la faible certitude entre les nœuds provient principalement de branches courtes, ce qui corrobore la présence de l'ILS 39 (Fig. 3 supplémentaire ). Les analyses jackknife génétiques montrent que l'ILS a un impact négatif sur la concaténation (RAxML) utilisant 400 locus ou moins, tandis que la coalescence (ASTRAL) récupère systématiquement davantage de bipartitions de l'arbre final (Fig. 1 ). En utilisant 500 locus ou plus, les deux méthodes convergent vers des topologies très similaires, ce qui suggère que le signal phylogénétique authentique peut surmonter l'effet confondant de l'ILS ignoré par la concaténation. De plus, l'utilisation d'un plus grand nombre de gènes atténue probablement l'effet négatif des flux génétiques (par exemple, l'introgression) sur les approches de concaténation et de coalescence.
.
Figure 1

Arbre coalescent des espèces de cichlidés (ASTRAL). Les nombres aux nœuds sont des valeurs de support issues respectivement des probabilités a posteriori locales et des proportions de bootstrap multilocus, et les points noirs représentent un support complet. Les nœuds sans nombre réel ont reçu un support complet des deux mesures. Les longueurs des branches sont exprimées en unités coalescentes et les couleurs des branches reflètent les valeurs de certitude entre les nœuds. Le graphique en médaillon montre le pourcentage de nœuds fortement supportés (proportion jackknife de locus > 75 %) reconstruits par ASTRAL et RAxML avec un nombre croissant de locus. Crédits photo : Wolfgang Gessl
.
La monophylie de toutes les tribus de cichlidés a été retrouvée sans ambiguïté (Fig. 1 ). La monophylie de la radiation des cichlidés d'Afrique de l'Est 11 , 15 , 17 , 40 , 41 est confirmée après l'inclusion, pour la première fois, de plusieurs espèces fluviales actuellement distribuées en dehors du lac Tanganyika qui sont essentielles pour tester cette monophylie. Les divisions les plus profondes de l'arbre correspondent très bien aux schémas de distribution à travers les masses continentales dérivées du Gondwana : ramification successive des Etroplinae (Madagascar et Inde/Sri Lanka), des Ptychochrominae (Madagascar) et des cichlidés néotropicaux (Cichlasomatini + Heroini) et africains comme clades frères 28 , 31 . Comme dans l'étude la plus récente et la plus exhaustive sur le plan taxonomique des cichlidés africains 41 , nous avons retrouvé une ramification précoce des Heterochromidini et des Tylochromini, mais avons trouvé des relations alternatives parmi la plupart des autres tribus (Fig. 1 ). En particulier, nous avons retrouvé un fort soutien pour Tilapiini comme frère d'un clade composé de Steatocranini et du groupe d'espèces du lac Tanganyika.

L'arbre des espèces coalescent a retrouvé Steatocranini ( Steatocranus casuarius ) au sein du groupe du lac Tanganyika, comme groupe frère de toutes les autres tribus à l'exclusion de Bathybathini + Boulengerochromini (Fig. 1 ), tandis que l'arbre de vraisemblance maximale (Fig. 1 supplémentaire ) a retrouvé Steatocranini comme groupe frère du groupe d'espèces du lac Tanganyika qui comprend Bathybathini et Boulengerochromini. Nous interprétons cette différence comme résultant de l'hybridation (voir ci-dessous). Le deuxième désaccord topologique intertribal majeur concernait les relations au sein de la lignée H 42 (voir également Fig. 1 ) : les analyses coalescentes ont retrouvé la ramification successive de (i) Cyprichromini comme groupe frère de Benthochromini + Perissodini et (ii) Limnochromini + Ectodini, tandis que les analyses concaténées ont retrouvé ces deux clades comme groupe frère. 
Les études précédentes concordent généralement avec notre position retrouvée pour les Haplochromini (y compris les Tropheini) et la ramification plus profonde des Boulengerochromini, Bathybatini et Lamprologini, mais les interrelations précises entre toutes les autres tribus diffèrent significativement 11 , 15 , 17 , 18 , 25 , 41 . Les Eretmodini, dont le placement a été controversé dans les études précédentes 14 , 43 , 44 , 45 se trouvent dans la lignée H 11 , 17 , 25 , 30 , 42 , spécifiquement comme groupe frère d'Orthochromini + Haplochromini (y compris les Tropheini). Au sein des Haplochromini, les genres fluviaux Astatoreochromis et Astatotilapia se ramifient avant les deux clades majeurs représentant les radiations adaptatives dans le lac Victoria (> 500 spp.) et le lac Malawi (> 800 spp.). Notre phylogénie soutient l'évolution des Tropheini endémiques du Tanganyika à partir d'ancêtres fluviaux qui ont recolonisé le lac Tanganyika et se sont diversifiés parallèlement au rayonnement déjà existant 11 , 12 , 15 .

..
L'arbre temporel des cichlidés réconcilie deux événements géologiques majeurs
.
Nous avons effectué des analyses d'arbres temporels indépendants en utilisant 10 schémas d'étalonnage basés sur des fossiles ou la biogéographie (Tableau supplémentaire 2 ). Ces analyses ont fourni une compréhension globale de l'effet des étalonnages basés sur des fossiles ou la vicariance sur les parties profondes et récentes de l'arbre des cichlidés. Notamment, c'est la première fois que le rayonnement du lac Tanganyika est ancré avec le fossile récemment décrit † Tugenchromis pickfordi 37 , et nous évaluons son effet en comparant les schémas d'étalonnage avec ou sans ce fossile. Nos estimations de temps de divergence ont daté l'origine du groupe d'espèces du lac Tanganyika au Miocène supérieur, environ 13,7–12,7 Ma pour les schémas d'étalonnage C06-C10 (Fig. 2 ) et un peu plus récemment (11,1–5,9 Ma) pour les schémas d'étalonnage C01-C05 n'incluant pas † T. pickfordi (Données supplémentaires 1 ).

En prenant en compte les intervalles de confiance de 95 %, les deux aires de répartition concordent avec une diversification du troupeau d'espèces du lac Tanganyika associée à la colonisation du nouveau bassin lacustre (originaire de 12 à 9 Ma 46 ), qui a fourni de nouvelles niches et opportunités écologiques nécessaires à la radiation adaptative 10 . De même, il n'est pas possible d'exclure un scénario alternatif d'une origine plus ancienne de certaines lignées majeures. Cependant, le fait que toutes les tribus endémiques du Tanganyika, à l'exception des Lamprologini à ramification précoce, occupent des niches fondamentales brutes distinctes (guildes écologiques) 12 suggère que la radiation initiale s'est probablement produite dans les limites du système lacustre émergent. Au lieu de cela, si une grande partie de la divergence initiale s'était produite dans différents systèmes fluviaux avant la formation du lac (c'est-à-dire en allopatrie), on pourrait s'attendre à ce que chaque lignée rayonne en un éventail d'espèces occupant des niches plus larges, ce qui contredit le modèle observé aujourd'hui. Français Il est important de noter que les membres des tribus de cichlidés du groupe du lac Tanganyika ne sont présents dans aucun système fluvial voisin, à seulement trois exceptions près : (i) les Orthochromini, que l'on trouve exclusivement dans le bassin versant de Malagarazi et les rivières voisines qui se jettent dans le lac Tanganyika ; (ii) les Haplochromini originaires du Tanganyika, qui ont colonisé de grandes parties de l'Afrique, puis ont recolonisé le Tanganyika (Tropheini) ; et (iii) les Lamprologini qui contiennent deux lignées qui se sont dispersées du lac Tanganyika dans les systèmes fluviaux du Congo et de Malagarazi 47 . Là encore, une origine du groupe d'espèces du lac Tanganyika bien antérieure à la formation du lac devrait expliquer l'extinction de nombreux membres fluviaux des tribus tanganyikaises. En fait, d'autres lignées de cichlidés étroitement apparentées, dont certaines ont également colonisé le lac Tanganyika 41 , continuent d'être présentes dans les plans d'eau voisins.

.
Figure 2

Phylogénie des cichlidés calibrée dans le temps. Les temps de divergence ont été déduits avec RelTime et le schéma d'étalonnage C10. Les barres des nœuds représentent des intervalles de confiance à 95 %. Les ombres verticales représentent les divisions des masses continentales dérivées du Gondwana (marron) et la formation du lac Tanganyika (bleu). Les schémas de distribution pertinents (actuels) des principales lignées de cichlidés et les événements de colonisation des Grands Lacs d'Afrique de l'Est sont indiqués. L'échelle est en millions d'années et les principales périodes géologiques sont mises en évidence. Les temps de divergence détaillés pour chaque nœud et arbre temporel selon les schémas d'étalonnage C01 à C10 sont disponibles dans les Données supplémentaires 1.
.
Nos analyses datent l'origine de la famille des cichlidés entre le Jurassique et le Crétacé inférieur, selon le schéma d'étalonnage supposé, ce qui est clairement antérieur au plus ancien fossile de cichlidé connu (~46 Ma 36 ). Les temps de divergence estimés pour les divisions les plus profondes de l'arbre, à savoir celles entre Etroplinae-Ptychochrominae à 175,8-121,0 Ma et entre les cichlidés africains et néotropicaux à 143,9-98,9 Ma, sont globalement cohérents avec un scénario de vicariance de fragmentation gondwanienne 27 , 28 , 34 , 35 mais contredisent d'autres scénarios proposés 29 , 30 , 31 . La vicariance gondwanienne est solidement soutenue par tous les schémas d'étalonnage basés sur les fossiles, à l'exception des schémas C03 et C08, qui produisent des estimations plus anciennes apparemment biaisées et des intervalles de confiance plus larges (Données supplémentaires 1 ). Français La différence entre les schémas C03 et C08 avec leurs analogues C02 et C07 est le placement de † Mahengechromis , qui a une position phylogénétique incertaine 48 . Sa position est probablement plus proche de l'origine de tous les cichlidés africains plutôt que du nœud immédiatement après (à l'exclusion d'Heterochromis ) et devrait donc être appliquée pour calibrer cet événement. L'utilisation de limites maximales dans les schémas C05 et C10 diminue l'effet néfaste du mauvais placement de † Mahengechromis (Données supplémentaires 1 ). Le scénario de vicariance proposé ici explique plus facilement les schémas de distribution actuels des cichlidés à travers les masses continentales dérivées du Gondwana sans nécessiter de dispersion transocéanique. Cette dernière nécessiterait une forte tolérance physiologique aux conditions de salinité dans lesquelles la plupart des cichlidés modernes ne survivraient pas (à l'exception de quelques espèces qui vivent dans des conditions saumâtres ou marines ou peuvent les tolérer 49 , 50 ). De plus, la divergence estimée du groupe d’espèces du Tanganyika concorde avec le rayonnement se produisant dans les limites du lac naissant.

L'étude récente proposant une dispersion transocéanique à longue distance des cichlidés a inféré des divergences apparemment trop anciennes (~50 Ma) pour le groupe d'espèces du Tanganyika 31 . Outre des différences substantielles dans la méthodologie de datation, les désaccords dans les temps de divergence entre cette étude et nos analyses pourraient être en partie dus à l'ensemble de données moléculaires sous-jacent, qui était sensiblement plus petit (40 loci) et dominé par des marqueurs mitochondriaux (~66 %) et des données manquantes (~40 %). L'élargissement de notre ensemble de données de loci ancrés pour inclure d'autres taxons non cichlidés, ce qui est simple pour les loci ancrés, permettrait d'incorporer des fossiles informatifs supplémentaires dans le groupe externe comme dans Matschiner et al. 31 et aiderait à clarifier les désaccords actuels sur la diversification des cichlidés. Une compréhension plus approfondie de la contradiction apparente entre les arbres temporels existants des cichlidés serait possible en menant une étude approfondie comparant différents logiciels/méthodologies de datation et ensembles de données moléculaires avec des hypothèses et des modèles comparables.

.
Les hybridations anciennes ont alimenté les radiations est-africaines
.
Nous avons étudié notre ensemble de données pour les signaux d'hybridation/introgression en analysant les discordances à haute fréquence dans les réseaux gallés 51 , et proposons des hypothèses d'hybridation intertribale qui sont ensuite testées en utilisant la statistique D de Patterson (ou le test ABBA/BABA) 52 . Les réseaux gallés montrent une discordance topologique substantielle entre les loci (Fig. 4 supplémentaire ) qui peut provenir soit de l'ILS, soit de l'hybridation. Cependant, étant donné la stochasticité de l'ILS, les événements réticulés supportés par un nombre relativement élevé d'arbres génétiques représentent probablement des événements d'hybridation. En suivant cette stratégie, nous émettons l'hypothèse de deux hybridations intertribales : (i) une première entre Steatocranini ( Steatocranus casuarius ), l'ancêtre de Bathybathini + Boulengerochromini, et les lignées restantes (tribus " modernes ") du troupeau du lac Tanganyika, et (ii) une seconde hybridation entre Benthochromini et Perissodini.

Les tests D de Patterson ont été effectués sur toutes les permutations possibles de quatre individus appartenant à chacun des trois groupes tests et le flux génétique a été interprété à partir des distributions des statistiques D (Fig. 3 ). Nous avons trouvé un signal fort de flux génétique entre Steatocranini et l'ancêtre des tribus « modernes » du lac Tanganyika (toutes les tribus sauf Bathybatini et Boulengerochromini ) représenté par des valeurs D négatives ( Z -score > 3 ; p ajusté par Benjamini-Hochberg  < 0,05). Ce signal d'hybridation était cohérent que Bathybatini ou Boulengerochromini soient utilisés comme P2 et quels que soient les taxons externes utilisés, alors qu'il disparaissait clairement lorsque Steatocranini (P3) était remplacé par d'autres lignées non tanganyikaises proches (c'est-à-dire Heterotilapiini ou Hemichromini ) (Fig. 3b et Tableau supplémentaire 3 ). Nous avons également trouvé un soutien solide à la deuxième hypothèse d'hybridation entre Benthochromini et Perissodini, montrée par des valeurs D systématiquement négatives ( Z -score > 3 ; p ajusté  < 0,05 ; Tableau supplémentaire 3 ).

.
Figure 3

Hybridation dans le groupe d'espèces du lac Tanganyika. a Représentation schématique du test D de Patterson . Les flèches bleues représentent le flux génétique entre des lignées éloignées, soit P2–P3 (excès ABBA ; D  > 0), soit P1–P3 (excès BABA ; D  < 0). b Scénario proposé pour l'hybridation entre Steatocranini et les tribus « modernes » du lac Tanganyika. c Hybridation entre Cyphotilapiini et haplochromines. Les graphiques en violon montrent les distributions des statistiques D de Patterson à partir de permutations individuelles utilisant différentes combinaisons de taxons, telles qu'indiquées dans la phylogénie. Les configurations taxonomiques suivent l'arbre de vraisemblance maximale concaténé (Fig. 1 supplémentaire ), car il permet de tester les hypothèses d'hybridation.
.
Sur la base des schémas observés de flux génétique, nous émettons l'hypothèse que les Steatocranini fluviaux ont contribué au matériel génétique du rayonnement du lac Tanganyika, ce qui correspond à un scénario d'essaim hybride. La théorie de l'essaim hybride a été proposée comme un mécanisme capable de générer instantanément de nouvelles combinaisons génétiques à partir de variations permanentes, facilitant ainsi un rayonnement rapide ultérieur 8 . L'hybridation surmonte la nécessité de l'apparition de nouvelles mutations et favorise ainsi une divergence rapide des traits par la génération de phénotypes dits transgressifs avec des réponses plus élevées à la sélection divergente disruptive 8 . La distribution des statistiques D pour l'introgression entre les Steatocranini et les tribus « modernes » du lac Tanganyika montre des signaux de flux génétique plus forts pour la lignée H (en particulier Haplochromini) et plus faibles pour Lamprologini (Données supplémentaires 2 ). Cela suggère que le flux génétique entre les Steatocranini et la lignée H s'est poursuivi après la divergence initiale des lignées tanganyikanes, peut-être dans des protolacs géographiquement structurés.
Il est intéressant de noter que les tests D par locus ont identifié plusieurs loci avec un signal d'introgression plus fort, qui sont associés à la vision, à la coloration du corps, au développement des nageoires, à la régulation des gènes et à l'immunité (selon les annotations de l'ontologie des gènes ; Tableau supplémentaire 4 ). De plus, deux gènes liés aux innovations clés des cichlidés, le gène sp7 (impliqué dans la plasticité phénotypique de la mâchoire 53 ) et l'opsine sws1 , présentaient de forts signaux d'introgression ( D  = −0,74 et D  = −0,14, respectivement). Ensemble, ces éléments de preuve suggèrent une introgression différentielle des gènes à l'origine de la radiation adaptative dans le lac Tanganyika. 
Des études antérieures ont démontré plusieurs cas d'hybridation interspécifique parmi les brindilles plutôt que parmi les branches plus profondes des cichlidés du lac Tanganyika, parfois suggérées par une discordance cytonucléaire 18 , 23 , 40 , 54 mais aucune preuve n'existait jusqu'à présent de l'hybridation entre les plus anciennes lignées majeures (tribus) à la base du rayonnement du lac Tanganyika. Curieusement, des scénarios d'hybridation comparables avec des lignées fluviales ont été proposés pour renforcer les radiations des cichlidés dans les lacs Malawi, Victoria et les lacs de cratère camerounais 23 , 24 , 55 .En plus de tester les deux événements d'hybridation nouvellement proposés, nous avons utilisé notre ensemble de données pour revisiter les événements d'hybridation proposés par Meyer et al. 25 qui ont utilisé une nouvelle approche basée sur la distribution d'âge des arbres génétiques. Meyer et al. ont proposé l'introgression de Cyphotilapiini dans (a) l'ancêtre commun des haplochromines du lac Tanganyika (c'est-à-dire les Tropheini) et (b) Pseudocrenilabrus . Nos analyses ont révélé que non seulement Tropheini, mais aussi Astatoreochromis et les haplochromines du lac Malawi et de Victoria présentaient des signes d'introgression, mais que Pseudocrenilabrus n'en présentait pas ( scores Z > 3, p ajusté  < 0,05 ; Fig. 3c et Tableau supplémentaire 3 ). Français Ces résultats suggèrent qu'un seul événement d'hybridation s'est probablement produit chez l'ancêtre haplochromine avant la colonisation des lacs Malawi et Victoria (Fig. 3c ), renforçant ainsi l'hypothèse d'une hybridation alimentant les radiations adaptatives des haplochromines « modernes » 23 , 24 , 55 . Le rôle de l'hybridation dans l'augmentation des radiations adaptatives est reconnu depuis longtemps chez les plantes 2 , et il s'accumule lentement chez les animaux à rayonnement adaptatif également, y compris chez les pinsons de Darwin 3 et les grenouilles à bouche étroite 56 . Avec les grenouilles à bouche étroite, nos résultats contribuent à l'un des cas d'hybridation les plus anciens décrits chez les animaux (13,7–12,7 Ma).

Meyer et al. 25 ont proposé des événements d'introgression supplémentaires impliquant Boulengerochromini (ou l'ancêtre commun de Boulengerochromini + Bathybatini) et soit (i) la lignée H, soit (ii) l'ancêtre de Perissodini + Cyprichromini. Nos résultats montrent des schémas de flux génétiques contradictoires lorsque Boulengerochromini ou Bathybatini sont testés (tableau complémentaire 3 ), suggérant ainsi un scénario d'introgression beaucoup plus complexe.

.
Évolution moléculaire des gènes associée à des innovations clés
.
Afin de comprendre le rôle et l'importance relative de l'écologie et du cycle biologique dans la formation des populations d'espèces du lac Tanganyika, nous avons étudié l'évolution moléculaire de 29 gènes précédemment associés à des innovations clés chez les cichlidés : développement des os et des dents (développement de la mâchoire), coloration et vision des couleurs. Le lien entre les caractères et les gènes repose sur des recherches antérieures, notamment des études de génétique prospective sur des organismes modèles, des annotations d'ontologies génétiques ou des profils d'expression génétique différentielle chez les cichlidés (tableau supplémentaire 5 ). En tirant parti du cadre phylogénétique déduit précédemment (figure 1 ), nous avons étudié les variations des taux de substitution (d N /d S ) en fonction de la fonction des gènes, de la phylogénie (effets de lignée), de l'écologie et des caractères du cycle biologique. Français Les mesures générales de d N /d S (ou coefficient de sélection, ω M0 ) ont montré que les trois catégories de gènes ont évolué sous différentes forces de sélection purificatrice : la plus forte pour les gènes de développement des dents et des os ( ω M0  = 0,014–0,321), la plus faible pour les gènes de la vision des couleurs ( ω M0  = 0,223–0,469) et intermédiaire pour les gènes de coloration ( ω M0  = 0,105–0,463). Tous les autres loci ancrés non pris en compte dans les trois catégories précédentes avaient une large gamme de coefficients de sélection (moyenne ω M0  = 0,166 ± 0,14) (Fig. 4a ). Les différentes tailles de cibles mutationnelles et les différents niveaux de pléiotropie des trois classes de gènes peuvent expliquer ce schéma : les gènes de développement des os et des dents ont une pléiotropie élevée (beaucoup sont de ménage) et la vision des couleurs est déterminée par un petit ensemble de gènes d'opsine avec peu d'effets pléiotropes connus, tandis que les gènes de coloration sont intermédiaires. Français De plus, la vision des couleurs est déterminée par un petit nombre de gènes, ce qui facilite l'identification des changements de sélection par rapport à d'autres caractères quantitatifs tels que le développement de la mâchoire qui sont contrôlés par de nombreux gènes en interaction de faible effet. Six des 356 « loci ancrés » non pris en compte dans les trois catégories étudiées présentaient un d N /d S relativement élevé ( ω M0  > 0,4) et ceux-ci avaient des fonctions liées à la reproduction, à la croissance cranio-faciale ou aux systèmes digestif et immunitaire (Tableau supplémentaire 6 ).
.
Figure 4

Évolution moléculaire des gènes associés aux innovations des cichlidés. a. Force de la sélection naturelle sur les gènes impliqués dans le développement des dents et des os (mâchoires), la coloration et la vision des couleurs (cônes-opsines) par rapport au modèle génomique représenté par les loci ancrés restants. b. Proportion de sites variables dirigés vers la poche de liaison aux chromophores des gènes des cônes-opsines. Les barres ombrées représentent le sous-ensemble de substitutions d'acides aminés entraînant des changements de polarité. c. Répartitions des espèces utilisées dans les tests du modèle Clade C (CmC) selon les caractéristiques phylogénétiques, écologiques ou biologiques. Les noms des gènes sont indiqués sous les modèles CmC présentant le pouvoir explicatif le plus élevé (AIC le plus faible) pour les partitions basées sur la phylogénie et l'écologie/le cycle biologique. LT, lac Tanganyika ; Haplo., Haplochromini
.
Treize des 29 gènes étudiés ont montré des preuves significatives de sélection positive (détectées en utilisant des modèles de sites aléatoires M2a/M1a dans PAML 57 , test du χ 2 avec 2 df, après correction de Benjamini-Hochberg pour les tests multiples) (tableau supplémentaire 7 ). Tous les gènes responsables de la vision des couleurs étaient sous sélection positive et analysés ultérieurement en détail. Deux des onze gènes associés au développement des os et des dents ( c-fos, col6a1 ) ont montré des signes de sélection positive. La régulation différentielle de ces gènes dans la mâchoire pharyngienne inférieure à travers les stades de développement et dans les études expérimentales de la plasticité en réponse au régime alimentaire 58 , 59 suggère qu'ils jouent un rôle dans la détermination de la taille et de la forme de la mâchoire pharyngienne inférieure, une innovation clé étroitement associée à la source de nourriture 60 . Français Quatre des onze gènes de coloration précédemment associés à la survie, à la différenciation et à la migration des mélanocytes (tableau supplémentaire 7 ) ont montré des signes de sélection positive : csf1ra, dlc, kita et kitla . On a émis l'hypothèse que le gène csf1ra était soumis à une sélection positive chez les haplochromines et impliqué dans la formation des taches d'œufs 61 , mais nos analyses du modèle Clade C (CmC) ont révélé qu'un scénario alternatif de changements de taux à l'origine du troupeau du lac Tanganyika et dans les Haplochromini était plus probable (δAIC = 28,33 ; groupe externe ω  = 0,808, lac Tanganyika ω  = 0,047, Haplochromini ω  = 1,089 ; tableau supplémentaire 9 ). Le scénario de changement à trois taux a également été privilégié pour kita , impliqué dans le développement des mélanophores, mais les cichlidés non haplochromines du Tanganyika ont affiché les taux les plus rapides (exogroupe ω = 2,834, lac Tanganyika ω = 6,492, Haplochromini ω  = 3,796 ; tableau supplémentaire 9 ). Le gène dlc , un contributeur majeur à la formation des motifs de rayures chez le poisson zèbre, montre une accélération de la sélection positive chez les Haplochromini (Fig. 4c , tableau supplémentaire 9 ; non haplochromines ω  = 0,658, Haplochromini ω  = 18,527). Les modèles CmC pour kitla ne se sont pas avérés statistiquement déviants de l'évolution neutre. Bien que le test du site M2a/M1a ne soit pas significatif pour hag (tableau supplémentaire 7 ), ce gène avait été précédemment supposé être soumis à une sélection positive chez les haplochromines 62, un résultat confirmé par nos analyses qui révèlent une différence de taux significative (non-haplochromines ω  = 0,103, Haplochromini ω  = 10,945 ; Tableau supplémentaire 9 ). Pour les cinq gènes associés à la couleur mentionnés, les CmC tenant compte des effets de lignée correspondaient mieux aux données que ceux tenant compte des changements de taux associés à la présence d'un dimorphisme de couleur lié au sexe (Tableau supplémentaire 9 ).

Les radiations adaptatives, qui présentent une vaste diversité phénotypique en l'absence de différences moléculaires prononcées, pourraient être considérées comme un laboratoire de « mutants naturels » qui peuvent aider à identifier des variantes fonctionnelles de gènes, un peu comme les criblages de mutagenèse dans les organismes modèles 6 , 7 . Le criblage de variantes aux effets potentiellement importants a révélé des codons stop prématurés dans mitfa et kita , deux gènes essentiels à la survie des mélanophores qui pourraient contribuer aux phénotypes xanthiques (par exemple, Ctenochromis horei ). Les codons stop prématurés étaient également répandus chez Bathybatini pour dlc et hag , où certaines espèces naturelles ont perturbé les motifs barrés ressemblant à des mutants knockout du poisson zèbre de ces gènes 63 .

..
L'alimentation est une force majeure qui façonne l'évolution des opsines
.
L'évolution moléculaire des cônes-opsines (vision des couleurs) a été analysée plus en détail. L'association génotype-phénotype des cônes-opsines est simple, les conséquences phénotypiques des remplacements d'acides aminés sont bien comprises et des travaux approfondis sur l'opsine 21 de cichlidés fournissent une base solide pour l'interprétation de nos résultats. Les sites des poches de liaison aux chromophores sont très variables dans tous les gènes des cônes-opsines (Fig. 4b ) et souvent soumis à une sélection positive (Tableau supplémentaire 7 ). Cela suggère l'apparition de modifications structurelles dans les opsines étudiées, susceptibles de modifier la sensibilité spectrale. Cependant, des preuves directes de modifications de la sensibilité spectrale nécessiteraient des expériences de microspectrophotométrie et de validation fonctionnelle.

Six des sept gènes d'opsine ont montré des taux plus rapides de sélection positive dans le troupeau d'espèces du lac Tanganyika (Fig. 4c et Tableau supplémentaire 10 ), ce qui suggère que ce rayonnement adaptatif a coïncidé avec la diversification du système visuel 64 . Pour le septième gène lws , un modèle montrant une décélération de la sélection positive dans le troupeau du lac Tanganyika suivie d'une accélération dans Haplochromini correspondait le mieux aux données. Selon l'AIC, CmC prenant en compte les taux divergents associés aux traits écologiques expliquait mieux la variation de séquence que les modèles neutres dans cinq des sept opsines (Fig. 4c et Tableau supplémentaire 11 ). Dans quatre de ces cinq gènes, le régime alimentaire avait le pouvoir explicatif le plus élevé parmi tous les facteurs écologiques et du cycle biologique testés (Fig. 4c ). Par exemple, les cichlidés planctonophages affichent des taux d'évolution plus rapides pour l'opsine sws1 sensible aux UV , ce qui concorde avec l'expression plus élevée observée de ce gène par rapport aux autres cichlidés 65 . Français Cette découverte concorde avec le fait qu'une sensibilité accrue aux UV conférerait une plus grande efficacité dans la recherche de nourriture sur le plancton, qui est translucide sauf sous la lumière UV. En revanche, les cichlidés broutant des Aufwuchs (algues adhérant aux surfaces ouvertes et autres petits organismes et matières organiques qui y sont attachés) présentent les taux les plus rapides dans l'opsine rh2a-α sensible au vert . La CmC permettant des taux différents chez les cichlidés vivant en eau peu profonde et ceux vivant en eau profonde s'adapte mieux aux données pour lws (absorption λ max ~565 nm) et en deuxième position pour sws1 (absorption λ max ~375 nm), dans les deux cas les cichlidés vivant en eau peu profonde ayant des taux de sélection positive plus rapides. En revanche, les cichlidés vivant en eau profonde avaient des taux plus élevés pour sws2b (absorption λ max ~425 nm). Cela est logique étant donné que les UV et la lumière rouge sont diminués du spectre lumineux en eau profonde 66 . Ces données corroborent la pseudogénisation de sws1 chez la tribu des Bathybatini vivant en eaux profondes (tous les individus présentaient des codons stop prématurés). Malgré des différences notables dans l'AIC avec d'autres modèles, la répartition de CmC en fonction de la profondeur n'était pas significative pour lws après correction de Benjamini-Hochberg. Ces résultats, combinés à des études antérieures ayant révélé une évolution divergente de l'opsine rh1 de faible luminosité entre les cichlidés du Tanganyika d'eaux profondes et peu profondes 67, soutiennent la profondeur comme un moteur important dans l'évolution des opsines sensibles à la couleur. Les modèles CmC tenant compte des différences entre les espèces avec et sans dimorphisme de couleur lié au sexe et entre les cichlidés se reproduisant sur substrat et les cichlidés se reproduisant dans la bouche s'ajustent aux données significativement mieux que le modèle nul (évolution neutre) uniquement pour les gènes d'opsines sensibles aux courtes longueurs d'onde (absorption λ max  < 470 nm). Dans tous les cas, les espèces sexuellement monomorphes et se reproduisant sur substrat avaient des taux plus rapides que les cichlidés sexuellement dimorphes ou se reproduisant dans la bouche (tableau supplémentaire 11 ). Les analyses évolutives moléculaires des 29 loci associés à l'innovation sélectionnés ont révélé des schémas intéressants liés aux radiations adaptatives, à l'écologie et au cycle biologique des cichlidés, mais la généralité de ces résultats devra être confirmée, réfutée ou ajustée en utilisant des approches génomiques plus larges telles que le reséquençage du génome.

.
Conclusions
.
À partir d'un vaste ensemble de données phylogénomiques ancrées, nous avons pu formuler une hypothèse phylogénétique robuste et calibrée temporellement pour la famille des cichlidés, en nous concentrant sur la radiation du lac Tanganyika, réservoir évolutif de toutes les principales radiations des cichlidés d'Afrique de l'Est. Notre arbre est le plus complet à ce jour en termes de diversité phylogénétique, de taxons et de nombre de gènes. Les dates de divergence estimées ici concordent avec deux événements géologiques majeurs de l'histoire des cichlidés : la radiation du groupe d'espèces du lac Tanganyika coïncide avec la formation du lac, et les divisions les plus profondes de l'arbre des cichlidés concordent avec la vicariance gondwanienne. Nous avons trouvé de nouvelles preuves d'hybridation au début du groupe d'espèces du Tanganyika et suggérons que cet événement aurait pu amplifier la radiation adaptative ultérieure. À l'appui de cette hypothèse, nous avons trouvé un signal fort d'introgression dans les gènes responsables de la vision des couleurs et du développement de la mâchoire, deux innovations clés chez les cichlidés. Grâce à ce nouveau cadre phylogénétique robuste, nous avons examiné l'évolution moléculaire de 29 gènes associés à des innovations clés chez les cichlidés afin d'évaluer la contribution relative des effets de lignée, de l'écologie et des traits du cycle biologique. Plusieurs de ces gènes associés à l'innovation présentent une accélération de la sélection positive qui coïncide avec l'origine du groupe du lac Tanganyika, et parmi les traits écologiques étudiés, le régime alimentaire explique une grande partie de la variabilité. L'ensemble de nos résultats contribue à une meilleure compréhension des schémas et des processus qui façonnent la radiation adaptative des cichlidés du lac Tanganyika et des Grands Lacs d'Afrique de l'Est.
.
Méthodes
.
Séquençage de loci ancrés et assemblage de jeux de données
.
Nous avons inclus des représentants de cichlidés de toutes les principales lignées et régions géographiques (Inde 2 sp., Madagascar 4 sp., Néotropiques 6 sp., Grands Lacs d'Afrique de l'Est 114 sp. et espèces fluviales africaines 23 sp.). L'échantillonnage taxonomique a mis l'accent sur le rayonnement du lac Tanganyika en incluant toutes les tribus à l'exception des Trematocarini (aucun tissu de qualité suffisante n'était disponible). Des informations détaillées sur l'échantillonnage taxonomique sont disponibles dans le tableau supplémentaire 1. Les échantillons de tissus ont été acquis auprès du commerce d'aquariums ou de populations sauvages. Pour ces dernières, l'échantillonnage et l'exportation ont été effectués dans le cadre d'un protocole d'accord entre le Département des pêches, le Ministère de l'agriculture et de l'élevage, la République de Zambie, et les universités de Zambie à Lusaka, Graz, Berne et Bâle (2008-2013). Des prélèvements et des exportations supplémentaires ont été autorisés par le ministère de l'Agriculture de Zambie (permis S1248/08 à C. Sturmbauer) et le ministère de l'Environnement et des Ressources naturelles du Nicaragua (permis DGPN/DB/DAP/IC-0003-2012 à A. Meyer). Les prélèvements et les exportations de tissus ont été effectués conformément à la réglementation locale et aux normes éthiques en vigueur.

Les données phylogénomiques ont été générées au Center for Anchored Phylogenetics ( www.anchoredphylogeny.com ) en utilisant la méthodologie d'enrichissement hybride ancré 68 . Brièvement, l'ADN a été extrait des clips de nageoires à l'aide du ZR-96 Genomic DNA Tissue MiniPrep (Zymo, CA, États-Unis) et les extraits d'ADN ont été cisaillés à 150-300 pb à l'aide d'un ultrasonateur focalisé Covaris E220. Les bibliothèques indexées ont été préparées sur un robot de manipulation de liquides Beckman-Coulter Biomek FXp selon Meyer et al. 69 avec une étape supplémentaire de sélection de taille après la réparation des extrémités franches à l'aide de billes SPRIselect (Beckman-Coulter ; rapport billes:volume d'échantillon de 0,93). Les échantillons indexés ont été regroupés en quantités égales (12-16 échantillons par pool) et des enrichissements ont été effectués sur chaque pool multi-échantillons à l'aide d'un kit Agilent Custom SureSelect (Agilent Technologies, Californie, États-Unis). Après enrichissement, les pools ont été regroupés en quantités égales pour le séquençage en quatre pistes Illumina HiSeq2000 de 150 pb appariées. Le séquençage a été réalisé au Translational Science Laboratory de la faculté de médecine de l'université d'État de Floride. Les lectures appariées se chevauchant provenant de fragments < 280 pb ont été fusionnées, les erreurs de séquençage corrigées et les séquences adaptatrices supprimées. Les lectures ont été assemblées à l'aide d'une approche quasi-de novo dans un pipeline interne 70 . Des ensembles orthologues ont été identifiés à partir des séquences consensus assemblées en utilisant la similarité des séquences et le clustering dans un processus de type neighbor-joining 70 .

Les loci ciblés correspondent aux loci ancrés pour les téléostéens 71 , conçus à partir d'exons individuels de 260 familles de gènes sélectionnées pour leur bonne performance phylogénétique et leur faible nombre de copies. De plus, nous avons complété l'ensemble d'appâts avec 29 gènes (176 exons) avec des fonctions liées à la vision des couleurs, à la coloration et à la formation des os et des dents (Tableau supplémentaire 5 ). Des sondes pour les 29 gènes candidats ont été conçues à partir d'alignements d'exons de trois cichlidés africains ( Oreochromis niloticus , Metriaclima zebra et Pundamilia nyererei ) en utilisant les annotations du génome d'O. niloticus (Orenil1.0).

En plus des espèces échantillonnées, des séquences homologues de neuf génomes de cichlidés disponibles ont été ajoutées aux alignements de loci ancrés : O. niloticus 72 , Astotilapia burtoni 72 , M. zebra 72 , Neolamprologus brichardi 72 , P. nyererei 72 , Amphilophus citrinellus (A. Meyer, Université de Constance), Andinoacara coeruleopunctatus (M. Malinsky, Wellcome Trust Sanger Institute), Petrochromis trewavasae et Tropheus moorii (C. Sturmbauer, Université de Graz). Les orthologues ont été identifiés par des recherches BLAST réciproques et les coordonnées des correspondances ont été étendues de 500 pb en amont et en aval pour capturer les régions moins conservées flanquant les exons. Les loci individuels ont été alignés avec MAFFT v.7245 73 et les positions avec >80% d'écarts ont été supprimées. Huit des 541 loci initialement assemblés ont été exclus en raison d'une paralogie suspectée : un locus (KCNJ13) a produit des correspondances BLAST dans deux régions du génome d'O. niloticus et a été identifié comme dupliqué 72 ; les sept loci restants présentaient une proportion élevée (> 3 %) d'appels de bases ambigus, suggérant que des séquences consensus pourraient avoir été assemblées à partir de lectures provenant de plusieurs paralogues. Des distances génétiques par paires et une visualisation manuelle des alignements ont été utilisées pour garantir une orthologie correcte et supprimer toute séquence non homologue dans les génomes ajoutés.

.
Analyses phylogénomiques et estimation des temps de divergence
.
Un arbre de vraisemblance maximale concaténé a été construit avec RAxML v.7.3.1 74 en utilisant des modèles GTR + Γ indépendants par gène et le support de branche évalué par 500 pseudo-répliques de bootstrapping non paramétrique. Un arbre coalescent a été estimé avec ASTRAL II 75 avec des paramètres par défaut en utilisant des arbres de locus de vraisemblance maximale estimés avec RAxML. Le support de branche pour l'arbre coalescent a été évalué par des probabilités postérieures locales et 100 réplicats de bootstrapping multi-locus avec rééchantillonnage de site. Nous avons évalué le degré de conflit au niveau des branches internes en utilisant la certitude inter-nœud telle qu'implémentée dans RAxML v.8.1.20 après application d'une correction probabiliste pour les arbres génétiques partiels 38 . Une analyse de jackknifing génétique 76 a été réalisée pour estimer la proportion de bipartitions de l'arbre final récupérées par coalescence ou concaténation en fonction de la taille de l'ensemble de données. 100 réplicats jackknife ont été générés pour chacun des ensembles de 10, 100, 200, 300, 400 et 500 loci sélectionnés au hasard et analysés séparément avec ASTRAL et RAxML.

La datation moléculaire a été réalisée avec RelTime 77 tel qu'implémenté dans MEGA-CC v.7.0.20 78 . Nous avons utilisé le GTR + Γ avec cinq catégories gamma (le modèle prédominant pour les loci uniques identifiés avec jModeltest 79 ), supposé le modèle « horloges locales », réglé le filtre d'échange de branches sur « Aucun » et fixé la topologie à celle de l'arbre de vraisemblance maximale (Fig. 1 supplémentaire ). Pour obtenir des temps de divergence robustes et comprendre l'effet de différents étalonnages fossiles, nous avons effectué des analyses indépendantes en utilisant dix schémas d'étalonnage : Le premier schéma (C01) supposait des divisions vicariantes associées à la fragmentation gondwanienne. Les schémas C02-C03 utilisent respectivement cinq et quatre étalonnages fossiles et sont donc indépendants des hypothèses de vicariance. Les schémas C04-C05 étendent respectivement C02-C03 en appliquant des contraintes maximales pour les nœuds affectés par la vicariance dans C01. Les schémas C06–C10 correspondent exactement aux schémas C01–C05, à la différence qu'ils incluent tous † Tugenchromis pickfordi 37 (voir le tableau supplémentaire 2 pour plus de détails sur les schémas d'étalonnage). RelTime utilise uniquement les bornes d'étalonnage minimales et maximales sans supposer de distribution de probabilité spécifique. Le logiciel BEAST, couramment utilisé, s'est avéré peu performant sur ce vaste ensemble de données, qui n'a pas pu converger malgré de longs temps d'exécution sur de puissants serveurs multi-CPU et multi-GPU.

.
Tests d'hybridation
.
Le signal d'hybridation a été exploré à l'aide de réseaux gallés, construits comme suit : SplitsTree4 80 a été utilisé pour générer un super-réseau filtré à partir de 533 arbres de locus de vraisemblance maximale non enracinés en utilisant la méthode de fermeture Z 81 , qui tient compte de l'échantillonnage incomplet des taxons sur les loci. Après avoir filtré les divisions supportées par < 50 arbres de locus, nous estimons les réseaux gallés avec la méthode de fermeture Z dans Dendroscope3 82 en utilisant différents seuils (10, 15, 20, 25, 30, 40, 50) qui correspondent au pourcentage d'arbres de locus qui supportent les arêtes du réseau. Nous avons utilisé le réseau gallé avec des arêtes réticulées supportées par ≥ 20 % d'arbres de locus (Fig. 4 supplémentaire ) pour formuler des hypothèses d'hybridation car il représente un bon compromis entre le support de l'arbre de locus et le nombre total d'hybridations. Français Suivant cette stratégie, deux hybridations intertribales ont été hypothétisées et testées plus en détail en utilisant la statistique D de Patterson 52 telle qu'implémentée dans le package R evobiR ( https://github.com/coleoguy/evobir ) d'après Durand et al. 83 . De plus, nous avons revisité les hypothèses d'hybridation proposées par Meyer et al. 25 . Pour chaque hypothèse, nous avons sélectionné trois lignées pertinentes et un groupe externe conformes à un arbre asymétrique à quatre taxons requis par les tests D , en suivant la topologie de vraisemblance maximale (Fig. 1 supplémentaire ) et en veillant à ce que tous les événements de flux génétique hypothétiques puissent être testés. Les tests D de Patterson ont été effectués sur toutes les permutations possibles d'individus appartenant à chacun des quatre groupes de test, générant des distributions de statistiques D (résumées dans des graphiques en violon). Pour mesurer la signification de ces tests, les scores Z et les valeurs p ont été calculés à partir de 100 réplicats bootstrap des tests. Les valeurs de p ont été ajustées pour les tests multiples à l'aide de la méthode de Benjamini-Hochberg. Pour l'hypothèse d'hybridation principale (Fig. 3b ), des tests D par gène ont été réalisés en regroupant tous les taxons pertinents en quatre groupes tests (LTm, Bou + Bat, Ste, Til ; sensu Fig. 3b ) ; les loci avec trop peu (< 5) de sites ABBA ou BABA ont été filtrés, et les loci avec un fort signal d'hybridation ont été annotés à l'aide d'ontologies génétiques (dérivées d' O. niloticus 64 ) et synthétisés avec REVIGO 84 . Afin d'éviter d'éventuels biais dans l'appel des bases dus à l'hétérozygotie, tous les tests D ont été réalisés sur des haplotypes phasés bioinformatiquement 85, en choisissant aléatoirement un allèle par individu et par locus. Afin d'exclure les biais dus au choix d'un groupe externe lors des tests D , ces tests ont été répétés avec différents groupes externes. Le résumé de tous les tests D est disponible dans le tableau supplémentaire 3 et les informations détaillées sur toutes les permutations dans les données supplémentaires 2 .
.
Analyses évolutives moléculaires des loci liés à l'innovation
.
Les séquences codantes de 176 alignements de loci individuels ont été extraites et concaténées en 29 alignements de gènes en utilisant le génome d'O. niloticus comme référence. Toute séquence contenant des codons stop prématurés dans l'ORF a été exclue. Les alignements de gènes pour rh2a-α et rh2a-ß ont été dérivés d'allèles phasés bioinformatiquement 85 car le pipeline d'assemblage par défaut ne pouvait pas démêler ces paralogues proches. Nous avons analysé d N /d S en utilisant des modèles de sites aléatoires dans PAML v.4.8 57 . Des tests de rapport de vraisemblance (LRT) ont été utilisés pour calculer la significativité des modèles de sites aléatoires testant la variation de d N /d S entre les sites (M3/M0) et la sélection positive (M2a/M1a) et dans ce dernier cas, les sites sous sélection positive ont été identifiés en utilisant la méthode Bayes empirique de Bayes dans PAML et les résultats ont été comparés à ceux obtenus par les méthodes SLAC, MEME, FUBAR et FEL dans HYPHY 86 . Français En utilisant le modèle Clade C (CmC) dans PAML, nous avons testé les effets de lignée et les facteurs écologiques et du cycle de vie comme moteurs de l'évolution moléculaire, de manière similaire aux travaux précédents sur le gène rh1 des cichlidés néotropicaux 64 . Le CmC permet aux taux de sites sélectionnés positivement de varier parmi des groupes d'espèces définis a priori (branches d'arrière-plan vs. de premier plan). La signification du CmC a été testée par rapport à un modèle nul d'évolution neutre (M2a_rel 87 ) par LRT et l'ajustement relatif des différents modèles CmC en supposant différentes partitions de taxons a été comparé par AIC. Les partitions spécifiques à la lignée suivantes ont été utilisées : (i) groupes d'espèces du Tanganyika vs. tous les autres cichlidés, (ii) Haplochromini vs. tous les autres cichlidés, et (iii) Tanganyika-Haplochromini, similaire à (i) mais en supposant des taux indépendants pour les Haplochromini (Fig. 4c ). Afin de tester la variation associée au cycle biologique ou aux facteurs écologiques des opsines, les analyses ont été centrées sur le groupe du lac Tanganyika, car celui-ci présentait des taux nettement plus élevés que le groupe externe. Des partitions taxonomiques pour les traits d'écologie et de cycle biologique ont été définies à partir de reconstructions des états de caractères ancestraux afin de définir ces partitions de manière plus objective. Tout d'abord, les espèces ont été classées selon (i) leur régime alimentaire (zoobenthos, necton, plancton, Aufwuchs ou généraliste), (ii) leur habitat (eaux profondes ou eaux peu profondes), (iii) leur mode de reproduction (incubateurs sur substrat ou incubateurs buccaux) et (iv) la présence ou l'absence de dimorphisme sexuel de couleur (Fig. 4c ). Les états ancestraux ont été déduits pour chaque caractère (Fig. 5 à 8 supplémentaires ) grâce à la méthode de réenracinement implémentée dans le package R phytools 88.Le codage des caractères chez les taxons terminaux a suivi un certain nombre de ressources, y compris la littérature, les bases de données numériques ( www.fishbase.org ) et les observations de terrain (S. Koblmüller). Pour minimiser le nombre de transitions et éviter les erreurs stochastiques des arbres géniques uniques, les reconstructions ancestrales et les calculs d N /d S ont supposé la topologie de vraisemblance maximale (Fig. 1 supplémentaire ) et seuls les changements avec une probabilité postérieure marginale > 0,85 ont été pris en compte. Les analyses basées sur les arbres géniques n'ont pas modifié qualitativement les résultats obtenus. Tous les tests ont été ajustés pour les tests multiples en utilisant la procédure de Benjamini-Hochberg.
.
Les ensembles de données finaux sont disponibles sur Figshare ( https://doi.org/10.6084/m9.figshare.6182519 ).
.
.
Sources : https://www.nature.com/articles/s41467-018-05479-9
Les ensembles de données finaux sont disponibles sur Figshare ( https://doi.org/10.6084/m9.figshare.6182519 ).
.
.

© mic.mag 2015 - tous droits réservés - All right reserved ©


Catégorie : ► ◘◘◘◘◘◘ ◄ - Articles Scientifiques
Précédent  
  Suivant


Réactions à cet article

Personne n'a encore laissé de commentaire.
Soyez donc le premier !