На днях специальный выпуск журнала Science был посвящен данным. Данные, данные, данные. Основа любой экспериментальной науки. Что померить, как померить, где померить? Оборудование становится все точнее и изощреннее. Там где раньше исследователь удовлетворился бы одной цифрой, сейчас требуются десятки, а то и сотни измерений. В итоге каждый год ученые производят миллиарды цифр, гигабайты информации, на свет выходят десятки тысяч научных статей. Как со всем этим управиться и вообще, зачем все это нужно? Казалось бы, ученые уже давно все знают об окружающем мире.
Как бы не так! Мы знаем очень мало! За примерами не нужно обращаться к далеким звездным системам или тайнам микромира. Приведу простой пример из своей области.
Озеро Шира. В озере живет рачок гаммарус, больше известный всем как мормыш. Традиционно мормыш считается животным, обитающим на дне. Вся научная литература основана на этом «общеизвестном факте». Раз рачок живет на дне, значит, он там и питается. В озерах на дно оседает мертвое органическое вещество, попросту говоря - трупы других животных и растений. Значит этот вид — классический «падальщик».
Для того чтобы исследовать численность мормышей обычно используют большие сетки — тралы. Опустили сетку на дно, выждали какое-то время, подняли к поверхности и посчитали всех рачков. Но в центре озера Шира на дне рачкам жить не сподручно. Глубина озера примерно 24 метра. Начиная с глубины 12-15 метров, в воде кончается кислород и появляется сероводород. Если рачок туда заплывет, он быстро умрет.
Несколько лет назад мы решили использовать погружную видеокамеру для того, чтобы посмотреть, как ведет себя гаммарус в такой среде. Согласно классическим концепциям, он не должен жить в центре озера.
Видеокамера. Такой девайс нельзя назвать высокотехнологичным прибором. Однако чаще всего исследователи озер работают сетками с лодки. Что происходит под водой, они не видят. Итак, берем камеру и опускаем ее в воду, одновременно записывая изображение на компьютер. Опустили, записали. Для того чтобы можно было говорить о какой-то достоверности данных в этот день, нужно сделать несколько измерений. Для того чтобы можно было говорить о какой-то типичности, нужно провести измерения в разные дни. Для того чтобы убедить научную общественность, нужно показать, что данные повторяются в разные годы.
Каково же было наше удивление, когда обнаружилось, что в центральной части озера все раки находятся в узком слое воды шириной 2-3 метра, на глубине примерно 6-8 метров. Эта глубина поразительным образом совпадает с глубиной, на которой температура воды в озере резко падает. Вот и еще одна необходимость проводить измерения в разные месяцы и годы. В один год озеро прогрелось до глубины 4 метра, в другой год вода теплая до глубины 8 метров. Имея много данных, можно построить график — по одной оси глубина, на которой наблюдается резкий скачок температуры, по другой оси - глубина на которой зафиксированы животные. Оказывается они коррелируют (то есть совпадают).
Все. Измерения в течение нескольких лет позволили получить вот такую простую картинку. Эта картинка появилась в научном журнале в прошлом году. А вчера я случайно обнаружил, что в одной из статей в англоязычной Википедии появилось одно короткое предложение, со ссылкой на нашу статью. Результат работы стал очень маленьким кирпичиком в современной картине мира.
Мы говорили о достаточно простых, и, казалось бы, очевидных вещах. Где живут животные? Даже для того, чтобы ответить на подобные вопросы, нужны новые методы и без преувеличения годы исследований. А теперь представим все многообразие окружающего нас мира. Даже страшно подумать, сколько еще данных нам понадобится, чтобы понять и объяснить его. Но мы будем стараться.
Егор Задереев
P.S. Скачайте картинку с обложки журнала с «данными» и погоняйте зумом — она клевая.