Méthodes statistiques utilisées dans le cadre du relevé des oiseaux nicheurs
Le Relevé des oiseaux nicheurs (BBS) de l'Amérique du Nord est un recensement annuel des oiseaux nicheurs réalisé aux États-Unis, au Canada, et depuis 2008, dans le nord du Mexique. Le BBS permet de suivre les tendances en ce qui concerne l'abondance relative des oiseaux nicheurs nord-américains à l'échelle continentale, nationale et régionale. Le Service canadien de la faune d'Environnement et Changement climatique Canada et le Patuxent Wildlife Research Center (en anglais seulement) du U.S. Geological Survey (USGS) coordonnent conjointement le BBS.
Collecte des données
Les données du BBS sont recueillies par des observateurs bénévoles qualifiés, le long de parcours établis au hasard. Les parcours, d'une longueur de 39,2 km chacun, comportent 50 arrêts espacés de 0,8 km, le long de routes secondaires praticables en tout temps. Leur point de départ et leur direction sont fixés au hasard à l'intérieur de blocs d'observations (quadrilatères d'un degré de latitude et de longitude, considérés comme l'unité d'échantillonnage de base pour le BBS), de façon à échantillonner une variété d'habitats représentatifs de la région. Au Canada, les dates acceptables pour effectuer les parcours du BBS sont entre le 28 mai et le 7 juillet; toutefois, la plupart des observations sont effectuées durant les trois premières semaines de juin. Les observateurs sont invités à effectuer leur parcours pendant le plus grand nombre d'années consécutives possible, et ce, afin de réduire les effets de la variabilité de l'observateur sur les estimations des tendances. Par ailleurs, puisque le BBS vise à surveiller les changements à long terme dans les populations d'oiseaux, on s'attend à des changements d'habitat le long des parcours. Cependant, un parcours peut être modifié ou abandonné si le réseau routier est modifié, ou si le bruit ambiant interfère avec la capacité de l'observateur de repérer les oiseaux, ou encore si les conditions routières sont dangereuses pour l'observateur.
À chacun des 50 arrêts, les observateurs doivent compter le nombre total d'oiseaux de chaque espèce vus dans un rayon de 0,4 km ou entendus, et ce, pour une période de trois minutes. Les participants doivent consigner les heures de début et de fin du parcours. L'état du ciel et la vitesse du vent sont consignés à tous les 10 arrêts et à la fin du parcours. Le nombre de véhicules qui circulent et tout autre bruit excessif au cours de chaque période d'arrêt doivent aussi être consignés. Les observateurs saisissent leurs données dans la base de données en ligne ou ils les envoient à l'un des bureaux nationaux du BBS pour qu'elles soient entrées. Toutes les données du BBS sont stockées dans la base de données nord-américaine du Patuxent Wildlife Research Center de l'USGS et sont accessibles sur le site Web de l'USGS consacré au BBS (en anglais seulement). Les feuilles de données originales pour le Canada sont stockées par le Service canadien de la faune d'Environnement et Changement climatique Canada. Pour la description complète des méthodes de collecte des données sur le terrain du BBS, consulter Robbins et coll. (1986).
Analyse des données
En plus des changements dans les populations d'oiseaux, plusieurs facteurs contribuent à faire varier les données du BBS. Il peut s'agir notamment de changements dans les conditions météorologiques, les dates et les heures de début et de fin des parcours et des différences parmi les observateurs. Afin de réduire la variabilité extrinsèque dans les données, les données sont analysées afin de supprimer celles qui se rapportent à des relevés effectués dans des conditions inacceptables (p. ex. pluie ou vents forts, dates et heures inacceptables). Tous les critères sont énumérés sur le site Web de l'USGS consacré au BBS (en anglais seulement).
Strates géographiques d'analyse
Les données sont analysées à l'intérieur de strates géographiques définies par l'intersection des régions de conservation des oiseaux (RCO) et les provinces et territoires. Par exemple, la Colombie-Britannique est divisée en quatre strates par les RCO 4, 5, 9 et 10. Pour une espèce donnée, seules les strates ayant suffisamment de données sont incluses dans l'analyse. Les données sont considérées suffisantes s'il y a au moins trois parcours où l'espèce a été observée, si au moins un de ces parcours a fait l'objet de relevés pendant cinq ans ou plus et si au moins un parcours utilisé par l'espèce a été observé au moins trois fois. Les tendances et les estimations en ce qui concerne l'abondance relative sont modélisées séparément pour chacune de ces strates d'analyse afin de tenir compte des différences dans la situation et les tendances de populations entre différentes régions, et de permettre de fusionner les estimations dans chaque strate avec les estimations régionales composites, en fonction des RCO ou des unités politiques.
En raison de la nature géographique de ces strates, les utilisateurs des résultats d'analyses devraient tenir soigneusement compte de la portée spatiale des estimations nationales et régionales des tendances et des indices annuels fondés sur les données du BBS. Les estimations s'appliquent aux strates spécifiques dans lesquelles les données ont été recueillies, et la couverture géographique de ces strates ne correspond pas toujours exactement à une région d'intérêt donnée. Par exemple, nous indiquons des tendances « nationales »; toutefois, le BBS ne couvrant pas le territoire canadien au complet, une partie des populations edes espèces peut ne pas être échantillonnée par le BBS. Par conséquent, chaque tendance et indice annuel est présentée sur une carte annexée montrant les régions auxquelles les estimations s'appliquent. Les cartes permettent d'évaluer d'un coup d'œil la portée spatiale de chaque estimation de tendance et d'indice annuel.
De plus, ces cartes comprennent désormais des informations sur les tendances dans chaque partie de l'aire de répartition de l'espèce. Les régions sont colorées en fonction de la direction (augmentation en bleu ou diminution en rouge) et l'intensité de la couleur indique l'ampleur de la tendance (couleurs plus foncées pour des taux de changement plus importants).
Méthodes analytiques
Nous analysons le BBS au moyen d'un modèle bayésien hiérarchique qui tient compte de divers facteurs comme les effets de la variation parmi les observateurs et les parcours, les effets de la première année d'observation, les variations de l'abondance et le schéma non linéaire de l'évolution de la population parmi les strates, ainsi que les fluctuations annuelles de la population. On présume que les dénombrements observés suivent une distribution de Poisson avec surdispersion. Le modèle est ajusté à l'aide des méthodes standard de la modélisation bayésienne : utilisation des méthodes de Hamiltonian Markov Chain (HMC) au moyen du logiciel Stan et le paquet R « bbsBayes » (Edwards et Smith 2020). Le modèle utilisé ici estime les tendances de changement de population dans le temps en utilisant une composante de lissage non linéaire (modèle additif généralisé hiérarchique) avec des fluctuations annuelles supplémentaires. Le modèle est décrit dans un article scientifique, disponible en libre accès, publié dans la revue scientifique « Ornithological Applications » (Smith et Edwards 2020).
La structure hiérarchique du modèle non linéaire utilise les données de façon efficace et elle rend les estimations beaucoup moins sensibles à l'erreur d'échantillonnage aléatoire (p. ex. la variation du nombre de parcours effectués dans une année ou région donnée). Les trajectoires des populations dans chaque strate géographique sont estimées de manière à partager certaines informations sur l'ensemble de l'aire de répartition de l'espèce.
Les estimations des trajectoires des populations dans les strates pour lesquelles on dispose relativement peu de données sont alors plus proches de la trajectoire moyenne de l'espèce à l'échelle de l'aire de répartition. Par conséquent, les taux estimés de changement dans les régions dont les données sont relativement peu nombreuses sont généralement plus précis et moins extrêmes (par comparaison avec la pente moyenne à l'échelle de l'aire de répartition de l'espèce) que les estimations provenant de modèles qui ne partagent pas l'information à travers l'aire de répartition.
L'influence relative des données locales et des données provenant d'autres parties de l'aire de répartition de l'espèce sur les estimations de la trajectoire de la population varie selon deux facteurs : 1) la qualité des données dans la région; 2) la forme relative de la trajectoire de la population locale par comparaison avec la trajectoire moyenne à l'échelle de l'aire de répartition (c.- à - d. les moyennes à l'échelle de l'aire de répartition ont une plus grande influence lorsque les estimations locales sont très imprécises et / ou sont différentes de l'estimation à l'échelle de l'aire de répartition). Nous croyons que la présente hypothèse statistique est raisonnable parce que les populations locales d'une espèce donnée sont liées dans l'ensemble de l'aire de répartition de l'espèce, en raison d'un mélange des individus par déplacements et dispersion. Aussi, de nombreux utilisateurs des estimations des tendances du BBS sont probablement à l'aise avec l'idée de prendre en compte des estimations de tendances d'autres régions pour éclairer leur compréhension de la situation d'une espèce dans des régions où les estimations de la tendance locale sont particulièrement mauvaises (c.- à - d. de faible précision) ou ont une amplitude inattendue (p.ex. augmentation abrupte lorsque d'autres tendances régionales semblent indiquer que l'espèce est stable ou en déclin). La conséquence importante est que les données du BBS de l'extérieur du Canada sont maintenant incorporées dans les analyses des tendances canadiennes. Il s'agit d'une caractéristique justifiable de cette nouvelle approche pour les raisons suivantes: 1) les populations des espèces aviaires sont reliées par-delà les frontières nationales; 2) elle améliore la précision des estimations des tendances régionales et nationales; 3) pour les régions disposant de données d'excellente qualité, elle a peu ou pas d'influence; 4) elle réduit la probabilité d'estimer des tendances anormalement extrêmes de très mauvaise qualité(p.ex.tendances à la hausse très marquées et de précision exceptionnellement faible); 5) il nous permet d'estimer les tendances pour d'autres espèces, plus particulièrement pour celles dont l'aire de répartition est limitée au Canada.
Mesures de fiabilité
Afin de quantifier la pertinence des estimations du BBS sur les tendances de la population globale, trois mesures de fiabilité sont calculées : la précision, la couverture et le poids des données locales. En plus de ces trois mesures de la crédibilité, on peut aussi tenir compte des mesures suivantes indiquées dans les dernières colonnes des tableaux de données sur les tendances : le nombre de parcours utilisés pour produire les tendances, les estimations des probabilités qu'une population donnée ait diminué ou augmenté, ou les probabilités que l'ampleur de la variation de la population se situe dans l'une des six catégories de variation de la population. Ces probabilités fournissent une évaluation concise et intuitive de l'incertitude entourant certaines interprétations couramment souhaitées. Par exemple, une tendance positive relativement forte, mais qui est estimée de façon imprécise, peut en fait avoir une probabilité supérieure de représenter un déclin (c. à d. la tendance a été estimée dans la mauvaise direction), qu'une tendance stable ou légèrement positive, estimée avec précision.
Précision : Cette mesure reflète la largeur de l'intervalle crédible (IC) de 95 %. Les valeurs plus petites indiquent une estimation plus précise de la tendance. L'IC à 95 % définit une plage de valeurs de la tendance qui ont une probabilité de 95 % d'inclure la valeur véritable de la tendance de la population, compte tenu des données et du modèle. Par exemple, l'énoncé suivant est une interprétation valable d'un IC hypothétique de 95 % avec une limite inférieure de 1,2 et une limite supérieure de 2,3 : compte tenu des données du BBS et de l'exactitude du modèle, il y a une probabilité de 95 % que l'augmentation annuelle moyenne de la population se situe entre 1,2 % par an et 2,3 % par an.
Couverture géographique : Cette mesure indique quelle proportion de population régionale avait une certaine probabilité d'influer sur l'estimation. Elle constitue la proportion estimée de la population régionale dans les blocs d'observations où le BBS a été effectué. La valeur déclarée constitue la proportion géométrique annuelle moyenne couverte durant la période de la tendance, les blocs d'observations étant considérés comme étant couverts tous les ans, entre la première et la dernière année durant lesquelles les parcours ont été effectués dans les quadrilatères. Les estimations des proportions de la population dans une région et un quadrilatère ont été extrapolées à l'aide des cartes de la densité relative d'une espèce dans son aire de répartition au Canada. Ces cartes ont été créées en superposant les cartes existantes des aires de répartition avec les estimations de la densité relative de la population dans l'aire de répartition de l'espèce, extrapolées à partir du nombre moyen d'individus dénombrés sur les parcours du BBS effectués de 1997 à 2007, et des dénombrements comparables des autres programmes de surveillance.
Poids des données locales : Indique la proportion de la région et des séries chronologiques pour lesquelles les données locales ont contribué à l'estimation de la trajectoire de la population locale. C'est-à-dire la proportion de la région pour laquelle des données sont disponibles chaque année, en moyenne sur toutes les années incluses dans la tendance. Une valeur de 1,0 indique qu'il existe des données pour chaque année et strate qui composent la région. Des valeurs inférieures à 1,0 indiquent qu'une partie de la région (c'est-à-dire une ou plusieurs des strates incluses dans la région) n'inclut pas de données provenant de toute la gamme des séries chronologiques, et s'appuie donc sur les données d'autres régions de l'aire de répartition des espèces pour estimer ces années dans la trajectoire locale.
La précision, la couverture géographique et le poids des données locales sont combinés pour former un indicateur de fiabilité globale pour chaque tendance. Ces indicateurs de fiabilité globale donnent un aperçu qui permet à l'utilisateur de repérer les tendances potentiellement non fiables. Cependant, des mesures spécifiques peuvent également être utilisées pour prendre une décision éclairée quant à l'incertitude associée à des conclusions particulières fondées sur les tendances. Par exemple, une tendance donnée peut avoir un indicateur de fiabilité faible en raison de son imprécision relative (c.-à-d., un large intervalle crédible); par contre, si l'amplitude de la tendance estimée est suffisamment importante, cette imprécision n'empêcherait pas de conclure de manière générale que la population de l'espèce a augmenté.
Ouvrages cités
- Smith, A. C., & Edwards, B. P. M. (2020). « North American Breeding Bird Survey status and trend estimates to inform a wide range of conservation needs, using a flexible Bayesian hierarchical generalized additive model ». The Condor, duaa065. https://doi.org/10.1093/ornithapp/duaa065
- Edwards, B. P. M., & Smith, A. C. (2020). « bbsBayes: An R Package for Hierarchical Bayesian Analysis of North American Breeding Bird Survey Data ». BioRxiv, 2020.05.27.118901. https://doi.org/10.1101/2020.05.27.118901