Минимальная структура базы для хранения данных о биологическом разнообразии организмов
Ключевые слова:
компоненты данных, данные об организме, географическая точка, таксономическое название, библиографическая запись, биологическая коллекция, коллекционный экземпляр, метаданныеАннотация
К настоящему времени накоплено огромное количество данных о разнообразии организмов. Сохранить и использовать эти данные для решения научных задач помогают базы данных. В литературе описано несколько десятков баз, предназначенных для хранения данных о биоразнообразии. Каждая имеет оригинальную структуру, которая плохо согласуется со структурами других баз, что, в свою очередь, затрудняет обмен данными и формирование массивов больших данных о биоразнообразии.
Причиной сложившейся ситуации является отсутствие формальных определений универсальных компонент, из которых можно построить базу с любыми данными о разнообразии организмов. Анализ литературы и исследования авторов показывают, что универсальные компоненты есть в характеристиках любых организмов. Например, таксономическое название организма и место его поимки. Таких компонент шесть, и они отвечают на один из шести вопросов: что, где, когда, кто, откуда и куда. Первые три компоненты – что, где, когда – являются фундаментальными. Они составляют минимальную основу, которая описывает экземпляр таксона в пространственно-временных координатах. Каждой компоненте соответствует отдельная таблица базы данных. Эти таблицы связаны с таблицей данных об организме (особи) и не связаны между собой. Атрибуты связей между особью и таблицами компонент хранятся в промежуточных таблицах.
Процесс создания любой базы о разнообразии живых существ начинается с определения таблицы экземпляров организмов. Ее необходимо использовать, даже если нет явных данных об организмах. Тогда следует ввести виртуальные организмы и связать с ними остальные компоненты при помощи промежуточных таблиц. Последние состыковываются с прочими данными. Минимальные структуры всех таблиц, связи между ними и примеры построения баз данных описаны в настоящей работе.
Литература
2. Шитиков В.К., Розенберг Г.С. Оценка биоразнообразия: попытка формального обобщения // Количественные методы экологии и гидробиологиию 2005. С. 91–129.
3. Скарлато О.А., Старобогатов Я.И., Лобанов А.Л., Смирнов И.С. Биоразнообразие и возможности его анализа с применением компьютерных банков данных // Биоразнообразие: Степень таксономической изученности. 1994. С. 20–43.
4. Запевалин А.А. Компьютерные структуры данных для решения проблем биоранообразия // Экология моря. 2001. Вып. 57. С. 103–108.
5. Seregin A.P. The largest digital herbarium in Russia is now available online! // Taxon. 2018. vol. 67. no. 2. pp. 465–467.
6. Pugachev O. et al. Creation of information retrieval system on the unique research collections of the Zoological Institute RAS // Information Technologies in the Research of Biodiversity. Springer Proceedings in Earth and Environmental Sciences. 2019. pp. 57–65.
7. Костина Н.В. Информационная система REGION: 25 лет развития и практического применения // Известия Самарского научного центра Российской академии наук. 2015. Т. 17. № 4-1. С. 15–24.
8. Лашин С.А. и др. Информационная система по биоресурсным коллекциям институтов ФАНО России // Вавиловский журнал генетики и селекции. 2018. № 22(3). С. 386–393.
9. Шашков М.П., Чадин И.Ф., Иванова Н.В. Методические рекомендации по стандартизации данных для публикации через глобальный портал gbif.org и подготовке статьи о данных // Труды Кольского научного центра РАН. 2017. № 6-5(8). C. 22–35.
10. Wieczorek J. et al. Darwin core: an evolving community-developed biodiversity data standard // PLoS One. 2012. vol. 7. e29715.
11. Jones K.E. et al. PanTHERIA: a species-level database of life history, ecology, and geography of extant and recently extinct mammals // Ecology. 2009. vol. 90. no. 9. pp. 2648.
12. Дмитриева Е.В. др. Электронная коллекция паразитов рыб Мирового океана Института морских биологических исследований им. А.О. Ковалевского // Морской биологический журнал. 2016. Т. 1. № 3. С. 27–31.
13. Гребенников К.А. Изучение биоразнообразия заповедников России в цифровой эпохе: опыт и перспективы // Nature Conservation Research. Заповедная наука. 2016. Т. 1. № 2. С. 1–10.
14. Лях А.М. Структура базы данных для виртуальных биологических коллекций // Системы контроля окружающей среды. 2019. № 3 (37). С. 29–34
15. Schneider F.D. et al. Towards an ecological trait-data standard // Methods in Ecology and Evolution. 2019. vol. 10. pp. 2006–2019.
16. Specht A. et al. A story of data won, data lost and data re-found: the realities of ecological data preservation // Biodiversity Data Journal. 2018. vol. 6. e28073.
17. Blair J. et al. Towards a catalogue of biodiversity databases: An ontological case study // Biodiversity Data Journal. 2020. vol. 8. e32765.
18. Parr C.S., Guralnik R., Cellinese N., Page R.D.M. Evolutionary informatics: unifying knowledge about the diversity of life // Trends in Ecology and Evolution. 2012. vol. 27. no. 2. pp. 94–103.
19. La J.S., Williams K.J., Moritz C. Biodiversity analysis in the digital era // Philosophical transactions of the Royal Society of London. Series B, Biological sciences. 2016. vol. 371. no. 1702. pp. 2150337.
20. Лях А.М., Лелеков С.Г. Модульная структура таксономической базы данных // Электронные информационные системы. 2018. № 2. С. 59–70.
21. Лобанов А.Л. и др. Эволюция стандарта ZOOCOD – концепция отражения зоологических иерархических классификаций в плоских таблицах реляционных баз данных // Труды 10-й Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» – RCDL’2008. С. 326–332.
22. Jackson J.B.C., Johnson K.G. Measuring past biodiversity // Science. 2001. 293. pp. 2401–2404.
23. Каменский П.А., Сазонов А.Э., Федянин А.А., Садовничий В.А. Биологические коллекции: стремление к идеалу // Acta Naturae. 2016. Т. 8. № 2(29). С. 6–10.
24. Чеченкина Т.В, Сотникова М.В. Можно ли оценить бесценное? К вопросу о сравнении стоимости научных коллекций // Управление наукой и наукометрия. 2019. Т. 14. № 4. 17 p.
25. Sabaj M.H. Standard symbolic codes for institutional resource collections in herpetology and ichthyology: an Online Reference. Version 6.5. URL: asih.org/sites/default/files/documents/symbolic_codes_for_collections_v6.5_2016.pdf (дата обращения: 22.06.2020).
26. Лях А.М. Уникальные семантические номера экземпляров биологических коллекций // Системы контроля окружающей среды. 2019. № 2(36). С. 43–50.
27. Guntsch A. et al. Actionable, long-term stable and semantic web compatible identifiers for access to biological collection objects // Database. 2017. vol. 2017. 9 p.
28. Касаткин М.В., Иванов А.П. Коллекция костей стеллеровой коровы Hydrodamalis gigas в Государственном биологическом музее имени К.А. Тимирязева // Зоологические исследования. 2018. № 20. С. 60–66.
29. Michener W.K. Meta-information concepts for ecological data management // Ecological Informatics. 2006. vol. 1. no. 1. pp. 3–7.
30. Berendsohn W.G., Seltman P. Using geographical and taxonomic metadata to set priorities in specimen digitization // Biodiversity Informatics. 2010. vol. 7. no. 2. pp. 120–129.
Опубликован
Как цитировать
Раздел
Copyright (c) Антон Михайлович Лях
![Лицензия Creative Commons](http://i.creativecommons.org/l/by/4.0/88x31.png)
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.
Авторы, которые публикуются в данном журнале, соглашаются со следующими условиями: Авторы сохраняют за собой авторские права на работу и передают журналу право первой публикации вместе с работой, одновременно лицензируя ее на условиях Creative Commons Attribution License, которая позволяет другим распространять данную работу с обязательным указанием авторства данной работы и ссылкой на оригинальную публикацию в этом журнале. Авторы сохраняют право заключать отдельные, дополнительные контрактные соглашения на неэксклюзивное распространение версии работы, опубликованной этим журналом (например, разместить ее в университетском хранилище или опубликовать ее в книге), со ссылкой на оригинальную публикацию в этом журнале. Авторам разрешается размещать их работу в сети Интернет (например, в университетском хранилище или на их персональном веб-сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению, а также к большему количеству ссылок на данную опубликованную работу (Смотри The Effect of Open Access).