Академические исследования объектов Солнечной системы резко возросли за последние двадцать лет. Однако информация о большинстве из примерно 1,2 миллиона объектов, обнаруженных в нашей Солнечной системе, была распространена по различным базам данных и исследовательским работам. Размещение всех этих данных в едином хранилище данных и упрощение доступа к ним позволили бы ученым сосредоточиться на своих исследованиях, а не на том, где собирать данные. Именно эта идея лежит в основе Сети открытых баз данных Солнечной системы (SsODNet), проекта специалистов по обработке данных Парижской обсерватории.
Простота доступа к данным может снизить барьеры для входа в область исследования объектов Солнечной системы (SSO), позволяя большему количеству людей участвовать в этих исследованиях. Чем больше людей исследуют SSO, тем больше вероятность, что мы обнаружим потенциально опасный или экономически интересный объект.
Кроме того, даже для ученых, уже работающих в этой области, сбор данных, имеющих отношение к их текущим исследованиям, может быть трудоемким ручным процессом. Внедрение машиночитаемых инструментов, таких как SsODNet, может значительно ускорить время, необходимое для проведения новых исследований SSO, позволяя этим исследователям выполнять работу более высокого качества.
База данных включает данные о диаметре, таксономии, тепловой инерции, периоде вращения, альбедо и многом другом – наиболее интересных характеристиках, которые ученые хотят знать о SSO. Для сбора этих данных разработчики во главе с Джеромом Бертье объединили данные из нескольких общедоступных баз данных, таких как база данных малых тел Лаборатории реактивного движения и Служба малых планет обсерватории Лоуэлла, с данными, полученными вручную, опубликованными в десятках статей об объектах Солнечной системы. Многие из этих ранее существовавших баз данных также не имели машинно-ориентированных систем, что означало, что доктору Бертье и его соавторам приходилось вручную извлекать из них данные и рукописи, чтобы включить их в SsODNet.
При создании самой SsODNet машинные интерфейсы были центральным элементом разработки. Он разработан как веб-сервис со стандартными протоколами машинного взаимодействия, принятыми для запросов, такими как Rest и веб-сервисы. Они также реализовали интерфейс Python под названием “rocks”, который можно вызвать из интерфейса командной строки.
Эти простые интерфейсы сочетают в себе функции, запрошенные научным сообществом SSO, такие как стандартизация названий 1,2 миллиона объектов в базе данных (в программе называемых quaero) и предоставление статистического анализа набора объектов (ssoBFT). Также существует несколько оценок того, какие свойства могут быть правильными, если в литературе будут обнаружены противоречивые данные.
Авторы признают, что большинство данных, имеющихся в базе в настоящее время, относятся к астероидам, поскольку они больше всего заинтересованы в изучении типа объекта. Однако, хотя астероиды составляют большой процент SSO, они не включают кометы, спутники или даже планеты, хотя это запланировано для будущих выпусков базы данных.
Однако, возможно, самой впечатляющей частью этих усилий по сбору данных является постоянное стремление к поддержке. Авторы взяли на себя обязательство еженедельно обновлять базу данных новыми данными единого входа (по крайней мере, для quaero name resolver) и ежемесячно выпускать основные обновления для других приложений. Это включало бы добавление новых данных из новых статей, опубликованных за это время. Приведение данных в устойчивый формат для запуска базы данных в первую очередь было титанической работой, и поддержание ее в обозримом будущем станет еще одной. Исследовательское сообщество SSO, несомненно, поблагодарит их за это.
На изображении:
Иллюстрация межзвездного объекта, приближающегося к нашей Солнечной системе.
Предоставлено: Обсерватория Рубина / NOIRLab / NSF / AURA / J. DaSilva