Réaliser l'intégration de l'information dans n'importe quel domaine scientifique nécessite de comprendre le flux de données entre la production et l'utilisation, puis de concevoir une ou plusieurs solutions à partir des principes de l'informatique de l'information et des technologies disponibles. Cela implique également une ingénierie sociale pour assurer l'acceptation et soutenir la mise en œuvre.
Dans cette présentation, je passerai en revue certains des principaux modèles de production de données en science de la biodiversité, comparerai les façons dont les grandes communautés fonctionnent et comment ces différences ont façonné les plus grandes ressources développées pour chaque communauté. Je décrirai le développement de l'intégration des données dans la biodiversité des organismes, en soulignant certaines des étapes et des transformations culturelles qui ont été nécessaires pour créer une infrastructure mondiale. Un élément essentiel est le partenariat entre les Système mondial d'information sur la biodiversité (GBIF) et Norme d'information sur la biodiversités (TDWG).
Au fur et à mesure que les outils et les méthodes ont évolué, la communauté informatique de la biodiversité est devenue plus sophistiquée avec des expressions de conception de données et de ses processus. Nous disposons d'une plate-forme durable pour l'élaboration de normes et d'un Spécification de la documentation des normes (FDS). Les progrès dans la mobilisation des données ont été constants, mais il n'y a pas eu de changements révolutionnaires depuis le déploiement du GBIF Boîte à outils de publication intégrée. Néanmoins, des progrès sont en cours dans des domaines clés.
Surveiller: (une) des normes de vocabulaire plus détaillées ; (B) mise en œuvre des principes de données ouvertes liées par le biais de ressources émergentes (identificateurs persistants, ORCID, Bloodhound) ; (c) une approche bien fondée pour évaluer et améliorer la qualité des données (avec des outils); et (D) un rapprochement des normes concurrentes, comme ABCD et DarwinCore.
Inscrivez-vous au webinaire maintenant!
Revenez à la série de webinaires Pulse of the Planet.
À propos du président
Le Dr Stan Blum a été le principal analyste ou contributeur à la conception de bases de données scientifiques pour le National Museum of Natural History (Smithsonian), le Museum of Vertebrate Zoology (UC Berkeley), l'Université du Kansas (« Spécifier ») et la California Academy. des Sciences. Il a développé des normes de données qui prennent en charge l'intégration des données dans toutes les disciplines et organisations d'histoire naturelle depuis 1990, y compris la paléontologie des vertébrés, l'Association of Systematics Collections (maintenant Natural Science Collections Alliance) et le groupe de travail sur les bases de données taxonomiques (TDWG). Le plus significatif d'entre eux est le DarwinCore, la norme la plus largement utilisée pour mobiliser les données d'occurrence d'organismes. Le thème dominant de sa carrière a été l'intégration de l'information entre les organisations et les disciplines au profit de la science de la biodiversité. Il est actuellement administrateur du secrétariat du TDWG à San Francisco.