Как бесплатно скачать данные GBIF
Обучение

Как бесплатно скачать данные GBIF

Что такое GBIF и зачем он вам

GBIF (Global Biodiversity Information Facility) — это международная база данных, где собраны 3,1 миллиарда записей о встречах с живыми организмами. Представьте: вы можете найти, где в последний раз видели снежного барса на Алтае, отследить распространение короеда в сибирских лесах — или собрать данные по борщевику Сосновского, чтобы спланировать борьбу с этим агрессивным сорняком. И всё это бесплатно.

База пополняется музеями, университетами, заповедниками и обычными людьми через приложения вроде iNaturalist. Для России это особенно ценно: здесь собраны десятилетия наблюдений, которые раньше были разбросаны по архивам и личным коллекциям.

Быстрый старт: скачать данные за 3 минуты

Шаг 1: Найти нужный вид

  1. Откройте сайт gbif.org
  2. Введите в поиск: Heracleum sosnowskyi (латинское название борщевика Сосновского)
  3. Система покажет карту со всеми находками по миру

Борщевик Сосновского часто путают с родственными видами — борщевиком Мантегацци (Heracleum mantegazzianum) и борщевиком сибирским (Heracleum sibiricum). Чтобы не пропустить ни одну точку, попробуйте поискать по всему роду Heracleum, а потом отфильтровать по виду.

Шаг 2: Отфильтровать по территории

На странице вида нажмите «View all occurrences» (посмотреть все находки). Откроется карта с точками. Теперь настройте фильтры слева:

  • Location → выберите страну Russia или нарисуйте прямоугольник на карте вокруг интересующего региона (например, Московская область или Северо-Западный федеральный округ)
  • Date → укажите период (например, с 2019 по 2026 год, чтобы видеть актуальное распространение)
  • Basis of record → тип находки:
    • Human observation — наблюдения людей (чаще всего)
    • Machine observation — редко для растений
    • Preserved specimen — гербарные образцы (исторические данные)

Шаг 3: Скачать файл

Нажмите кнопку Download вверху страницы и выберите формат. Данные набора данных предоставляются в CSV. 

Основные колонки:

  • decimalLatitude / decimalLongitude — координаты (WGS84)
  • eventDate — дата наблюдения (важно для отслеживания динамики распространения)
  • scientificName — латинское название (Heracleum sosnowskyi)
  • vernacularName — русское название («борщевик Сосновского»)
  • locality — описание места («обочина дороги М-10, 15 км от Твери»)

Если вам нужно автоматизировать скачивание с помощью Python:

from pygbif import occurrences as occ
# Поиск
res = occ.search(scientificName="Heracleum sosnowskyi ", 
                country="RU",
                limit=500)
# Сохранение в DataFrame
import pandas as pd
df = pd.DataFrame(res['results'])
df.to_csv('Heracleum_sosnowskyi .csv', index=False)

Собранные данные можно:

  • Визуализировать — тепловые карты, кластеры, анимации по времени
  • Анализировать — моделирование распространения видов (Species Distribution Modeling)
  • Интегрировать — наложить на слои рельефа, климата, растительности

GBIF.org — это бесплатный инструмент, который делает мировую науку доступной каждому. Не нужно знать программирование, не нужны подписки, не нужно писать запросы в музеи. Просто открываете сайт, вводите Heracleum sosnowskyi, выбираете территорию — и через полчаса у вас в почте готовый набор данных для составления карт распространения борщевика.

Для российских специалистов по борьбе с сорняками это особенно ценно: здесь собраны данные, которые раньше были разрознены по десяткам институтов. Теперь они в одном месте, структурированы и готовы к работе. А главное — каждый может внести свой вклад, отметив новый очаг борщевика через iNaturalist или сообщив в местный музей.

GBIF — межправительственная инициатива, финансируемая правительствами стран-участниц. Россия — участник с 2004 года.