О том, с какими проблемами сталкивается лауреат конкурса мегагрантов 2011 года в России, мы побеседовали с профессором Владимиром Спокойным, зав. сектором математических методов предсказательного моделирования ИППИ РАН. C ноября 2011 года он заведует Лабораторией структурного анализа данных и оптимизации МФТИ. Беседовала Наталия Демина.
Перед тем, как вернуться в Россию для руководства мегагрантом, вы долгое время прожили за рубежом. Когда вы уехали из страны?
В 1992 году я уехал в докторантуру во Францию. Там получил предложение и потом почти сразу же переехал в Германию, где и остался, пройдя путь от научного сотрудника до профессора и заведующего лабораторией. Все у меня было прекрасно, и никаких мыслей о возвращении на родину не было, пока бывшие коллеги не обратились ко мне с предложением подать заявку на мегагрант.
Раньше в мои молодые годы здесь, в Москве, был своего рода научный Клондайк по большинству научных направлений, в том числе, по математической статистике, работала очень эффективная рабочая группа. Ее лидером был Рафаил Хасьминский, работавший в ИППИ РАН. Он меня и пригласил тогда работать в ИППИ. Когда я уехал, а потом из этой группы разъехались почти все, научная школа математической статистики и в Москве и фактически во всей России практически умерла. Примерно 20 лет в России не появлялись ни новые научные идеи, ни новые молодые кадры по этому направлению.
Когда возникло предложение по мегагранту, то первой моей мыслью было стремление, не то чтобы реанимировать эту научную школу, но хоть как-то активизировать исследования в этой области. Деньги у нас были, и в первые два года мы организовали активную деятельность.
Формально моя лаборатория существует в рамках Физтеха. Позиция руководства университета проста и достаточно прагматична. Математическая статистика – не их профильная специальность, они готовы иметь лабораторию по математической статистике и оптимизации, если для этого ничего не надо инвестировать. Наши публикации и достижения идут в зачет всего университета. Рядом с главным корпусом Физтеха находится здание, в котором располагается факультет прикладной математики, там для нашей лаборатории выделили одну небольшую комнату.
Физтех нас поддерживал в том смысле, что совершенно не мешал. Не пытался залезть к нам в карман. Но когда речь зашла о продлении мегагранта, о возможности соинвестирования, то тут мы столкнулись со стеной. Университет в нас вкладывать не хочет. У него есть свои любимые направления, а математика – это не их дитя.
Если вас спросят, на что пошел мегагрант, каковы результаты вашей научной деятельности, что вы ответите?
Да, меня порой спрашивают, вот вам грант дали, чем вы занимаетесь? Что вы создали? Я говорю, я приехал в Россию делать науку, а наука – это ученые. Мне приходится растить науку с нуля, практически на пустом месте.
В других математических коллективах, например у Станислава Смирнова или Федора Богомолова, не пришлось начинать с нуля, в их областях науки были научные школы, они не разрушились, была какая-то научная инфраструктура: семинары и полноценное научное общение. Да и то им пришлось многое сделать, чтобы вдохнуть в науку новую жизнь. Но в моей области не осталось почти никого и ничего. Пришлось создавать всё заново… Это не делается за год или два.
Когда я приехал, то начал с того, что прочитал студентам курс лекций. Результатом был экзамен. Так мы набрали десяток студентов, которым интересна математическая статистика. Через год еще десяток. Сейчас я читаю курс в третий раз. На экзамен записалось еще 15 человек.
Имеется в виду студенты Физтеха или любых других вузов? Вы приглашаете всех?
Я читаю лекции в Независимом Московском университете. С Физтеха там большинство студентов, но есть и с Мехмата, что меня радует, есть из ВШЭ. Отовсюду, где есть математика, ко мне на лекции приходят студенты. Мы их отбираем по очень высокой планке, я читаю лекции по материалам собственных научных разработок.
Мы стараемся работать с ребятами 3-4 курса, иначе дальше они уже расписаны по другим научным руководителям, и отбор вести поздновато. Иногда мы делаем исключение и берем студентов 5-6 курса. Итак, берем студентов 3-4 курса, начинаем их вести с бакалавриата. Потом ведём студентов до магистерского диплома, наша цель – магистерская работа на уровне кандидатской диссертации. И сразу пытаемся вовлекать студентов в активную научную работу.
Мы организовали школы, конференции и семинары. Каждый месяц у нас проходят научные события, есть студенческие и научные семинары. Мы создаём такой научный котёл, в котором молодые ребята могут вариться и расти. Моя главная продукция за эти два года – это 20 молодых специалистов, которые прошли через мою лабораторию, которые уже сейчас в состоянии пусть не самостоятельно, но активно работать в команде.
Если молодые ученые заинтересуются этой областью исследований, то на каком сайте можно получить информацию?
Наш сайт называется ПреМоЛаб (premolab.ru).
В министерстве от нас ожидают быстрого результата, прорывных проектов по новейшим направлениям. Но, для того, чтобы вести сложные проекты, нужны подготовленные кадры. Первоочередную задачу набора перспективных кадров мы решили, но за два года их не вывести на передовой научный уровень. У меня есть группа в Берлине, её я растил 15 лет, там у нас есть подобные проекты. Я мог бы перенести полученные там результаты сюда, в Россию, но ведь цель не в этом. Нам надо заложить базу для собственных научных исследований.
Я перед дилеммой, как я могу сочетать ведение прикладных проектов и зарабатывание денег в Москве и одновременно заниматься обучением молодёжи? Это 3-4 курс, разве можно их бросить на прикладные проекты? Их это только поломает. Им надо учиться, их надо постепенно выходить на научный уровень. Их надо посылать на топовые научные конференции, я вожу их к себе в Германию, показываю, как устроена наука, как надо работать по-современному.
Это главный парадокс российской программы мегагрантов, ее главная проблема, которую мы, математики, понимали уже в самом начале, но в министерстве нас не слышат. Такая программа должна быть рассчитана не на 2 года, а на 20 лет или хотя бы на 12. В Германии подобные программы рассчитана на 12 лет. Это же совсем другое дело! А у нас получается почти тупиковая ситуация: большими усилиями создан научный коллектив, но если не будет дальнейшего финансирования, то это все однозначно умрёт. И набранные и подготовленные кадры разойдутся по каким-то конторам. Получится, что вся моя работа была напрасной. Зачем было вбухивать полтораста миллионов рублей? Механизм перестройки работы лабораторий после срока финансирования в программе мегагрантов не предусмотрен.
Организаторы этой программы ждут какого-то сильного эффекта за 1-2 года. Но за такой короткий период речь может идти либо о покупке дорогостоящего оборудования, либо новых технологий на западе. Иначе такого эффекта быстро не достичь.
Если же речь идет о подъеме науки в России, то в первую очередь речь должна идти о создании научных школ, создании системы кадров. А это требует гораздо большего времени. В этом случае нельзя планировать программу на два года и требовать годовой отчетности. Такого нет ни в Германии, ни в какой-либо другой стране, с которой я сотрудничал.
А вы говорили об этом министру Ливанову и его коллегам?
Естественно, эта тема активно обсуждалась уже «первой волной» мегагрантников, когда министром был еще Андрей Фурсенко, который лично интересовался этой программой. Но сейчас наше министерство проводит реорганизацию академии, глобальную перестройку научно-образовательной сферы. Очень хочется, чтобы ошибки и недочёты программы мегагрантов учлись при проведении реформ.
В программу мегагрантов уже вбухали и вбухивают гигантские деньги, разумеется, их можно потратить разумно, но у нас нет культуры терпения. Люди не понимают, что если выделить много денег на очень короткий срок, то их трудно использовать разумно, проще быстро распилить. Ничего другого с ними сделать нельзя.
Между тем, есть известный мировой опыт. Есть примеры США и Германии. Это две страны с максимальной широкой линейкой научных программ. Там масса программ, от самых микроскопических до больших. Например, в Германии минимальный срок программы – 3+3 года.
В Российском научном фонде сейчас появилась программа 3+2.
Все равно немного маловато. Большие программы обычно идут по схеме 5+5 или 4+4+4. После каждого периода идет серьезная перезагрузка. Проводится тщательная экспертиза проектов. Это, например, делает NSF в США, либо DFG в Германии. Туда приглашаются ведущие учёные, которые оценивает каждый проект по самым высоким научным стандартам. Только жизнеспособные проекты получают продолжение и поддержку. Инструмент для контроля есть, и надо давать хорошим проектам возможность для продолжения работы.
Вам могут сказать, мол, зачем вы вернулись, неужели не хватало работы в Германии?
В Берлине я был загружен на 120%, ведь я – завлаб в институте и профессор в университете. В России же моя нагрузка как минимум удвоилась. Я всё это тяну в ущерб своей семье и здоровью. Но все компенсируется тем, что я вижу плоды, вижу, как работает моя группа, моя команда, как приходят новые и новые сильные ребята.
В России нет культуры современной научной работы. Раньше, когда я был молодым, то в одной комнате сидело по 5 человек. У меня был столик на третьем этаже ИППИ, в 303-ей комнате. Мы приходили раз в неделю, когда был семинар, общались, расходились и в основном работали дома. Такая была академическая система работы. Сейчас так в мире не работают. Сейчас в одиночку в прикладных науках работать нельзя, не будет развития. Нужно работать в командах, в коллективах.
Надо чаще встречаться в реале?
Да, вариант, когда каждый сидит в уголке, кропает что-то свое, уже не работает. Нужны регулярные совместные мероприятия. В Берлине мы стараемся проводить хотя бы 3 мероприятия в неделю, в которых участвуют члены моей группы. У меня есть большая группа, которой руковожу, есть команда моих коллег, аспирантов, студентов, группа, которой я руковожу научно. С ними я стараюсь встречаться три раза в неделю. Один семинар рабочий, один специальный, еще есть неформальная встреча.
Кроме того, провожу личные встречи. Каждую неделю каждый мой студент или аспирант приходит ко мне индивидуально, мы час с ним разговариваем, иногда дольше. Каждый в моей команде знает, чем занимается другой, по возможности мы стараемся кооперироваться, даем возможность обмениваться идеями. Мы создаем такой котел, в котором студенты и аспиранты «варятся» постоянно, закладывается культура научной работы.
Кадры – это первоочередное, что нужно восстанавливать в России. Но для этого нужен не только энтузиазм ученых, но и долговременная поддержка государства. Меня удручает то, что у нас уже на 2015 год нет мало-мальски чёткого финансирования.
Вы будете обращаться в научные фонды?
Мы будем обращаться в фонды, куда угодно, будем писать заявки по всем программам. Но должен подчеркнуть, заниматься добыванием денег и наукой одновременно совершенно несовместимо. Это проблема как внутренняя бомба-разрушитель, заложенная в программу мегагрантов. Расчет на то, что научные коллективы перейдут за 2 года на самофинансирование – это иллюзия, и это подрывает исходную идею поддержки высокой науки.
Я работаю в Берлине в Институте прикладного анализа и стохастики имени Вейерштрасса, который считается прикладным. Мы входим в так называемое сообщество Лейбница. В Германии есть разные системы организации науки. В система Макса Планка собраны институты, которые занимаются фундаментальными исследованиями, они на 100% финансируются из федерального бюджета. В свою очередь, сообщество Лейбница основывается на паритетном финансировании: деньги поступают из федерального бюджета и бюджета регионов (земель). Плюс у нас 10% самофинансирования в том смысле, что нам дают 90% требуемой суммы, а 10% мы можем либо сэкономить, либо заработать сами. Это считается нормальной планкой для того, чтобы мы могли вести научные исследования на передовом уровне. Есть другая система – общество Фраунхофер (Fraunhofer-Gesellschaft), там 60% самофинансирования, но они вообще высокой наукой не занимаются, они просто добывают деньги.
То есть существует планка самофинансирования, выше которой люди не могут заниматься передовой наукой, а работают на хлеб насущный. Если речь идет о фундаментальной науке, то самофинансирование и само-софинансирование ей просто противопоказано. Если ученых оставлять заниматься хлебом насущным, то какая наука? Эти две вещи совершенно несовместимы.
Я могу представить, что есть отдельные, очень прикладные области, где можно выйти на коммерческий уровень. Даже у нас в Берлине есть такого типа программы. Делайте выход на коммерцию, делайте старт-апы. Однако фундаментальная наука с добыванием денег несовместимы. Либо ты зарабатываешь деньги, либо ты занимаешься наукой. А требовать этого от научного коллектива, чтобы он добывал деньги и производил научную продукцию, статьи высокого уровня, это утопия. Это две вещи, которые друг друга взаимно уничтожают.
Я хочу возродить российскую школу математической статистики. Для меня это важнее, чем один конкретный проект или другой. Проекты у меня есть, их много в моей группе Берлине, сил не хватает все их вести, но работа над проектами – это уже, когда люди вышли на определённый уровень. Только дав студенту и аспиранту необходимый запас знаний, его можно подключать к практическим задачам, но для начала его нужно на этот уровень вывести, нужно создать научный коллектив. И это, я считаю, является главным продуктом на нынешнем этапе.
Однако ценность этого продукта здесь, в России, очень сильно недооценивается. Это то, что я пытаюсь объяснить, пытаюсь достучаться до принимающих решения чиновников. Хочу, чтобы меня услышали и поняли. Да, действительно, моя молодая московская группа занимается потенциально интересными прикладными задачами, иначе бы наш мегагрант не продлили. Но в плане подъема российской науки есть другой продукт, который не менее, а может быть более ценен, но который не меряется заработанными деньгами. Это наше научное будущее, наши молодые ученые.
Выращивая научные кадры, нужно иметь терпение. Если люди чего-то достигли, то им надо дать возможность все сделанное сохранить, а не бросать их на произвол судьбы в океан страстей. Понятно, чем это кончится, если нас прекратят финансировать. Это то, за что у меня душа болит. Я не хочу, чтобы все, что мы сделали, во что инвестировали свои силы и время, пошло прахом. Это меня очень сильно беспокоит.
Что кажется самым важным из того, что вы делаете?
Моя лаборатория занимается предсказательным моделированием. Задачу можно объяснить так: есть сложная система, которую наблюдают. Это может быть общество, финансы, автомобиль, электростанция, банк – сложная система, которая как-то живет и функционирует. А теперь нужно сделать предсказать поведение этой системы, чтобы принять какое-то решение.
Для этого строится математическая модель, так называемая суррогатная, т. е. не повторяющая всей сложности моделируемой системы, практическая задача переводится на математический язык и решается с использованием передовых научных разработок, часто приходится развивать новые методы. Потом математическое решение апробируется на пробных данных и только потом применяется для решения практической задачи. Часто этот процесс приходится повторять много раз.
Лучше всего это иллюстрируется на примере банков. Банки дают кредиты на короткое время, но иногда на 5 лет, на 10. Чтобы дать кредит на 10 лет вперёд, банк должен посчитать свою выгоду, чтобы выставить правильный процент. Фактически банк должен смоделировать развитие финансового рынка на 10 лет вперёд. Это одна из задач, которыми мы реально занимаемся. У меня в группе есть специалисты, которые являются мировыми специалистами в этом вопросе, как вычислять правильную цену финансовых продуктов, связанных с предсказанием будущего. Это могут быть процентные ставки, а могут быть опционы, что тоже связано с будущим, на разные временные горизонты.
Разумеется, у нас есть и другие интересные практические задачи, которыми занимается наша лаборатория. Возможно, мы совместно с моей группой в Берлине начнем большой проект по исследованию механизмов работы головного мозга. Есть запущенный проект по анализу и предсказанию поведения клиентов Сбербанка, там огромный статистический материал. Сейчас мы обсуждаем проект по участию в программе по биобезопасности. Кроме того, обсуждаем проект про кооперации с фирмой Bosсh, по испытанию систем автонавигации, автобезопасности машин. Есть еще большое число проектов по обработке данных соцсетей. Это гигантский объем данных, которые нужно обрабатывать и их них извлекать информацию.
Какой математический аппарат используется? Теория вероятностей?
Теория вероятностей, теория случайных процессов. Но этого недостаточно. Например, в финансовой сфере есть еще один аспект, связанный с тем, что кроме рынка как объекта, есть еще и субъекты. Это и люди, и банки, и фирмы, которые являются активными игроками, и каждый имеет свою стратегию. Стратегии сводятся к тому, что каждый участник рынка оптимизирует свою целевую функцию. Поэтому для того, чтобы моделировать систему, нужно моделировать эти стратегии, это сводится к теории оптимального управления, к теории оптимизации. Для решения задачи предсказательного моделирования приходится привлекать различные математические дисциплины: кроме теории вероятностей и статистики, ещё нужна теория оптимизации, теория оптимального управления, теория графов и сложных систем, теория алгоритмов и вычислений, и многие другие.
Например, моделирование цен сложных финансовых инструментов сводится к тому, что просчитываются разные сценарии развития, исходя из стохастической модели. Моделируется каждый сценарий. Для каждого решается оптимизационная задача. Потом мы итоговые результаты обрабатываются статистически. Если действовать прямолинейно, нужно просчитать 1000 в пятнадцатой степени сценариев, это немыслимо ни сейчас, ни потом, никогда. А решение надо принять за несколько минут. Тут без новейших математических методов не обойтись.
Со Сбербанком мы прогнозируем поведение клиентов. По истории клиента и по поведению других клиентов с похожими характеристиками, мы моделируем его поведение на полгода вперед.
Занимались ли вы тем же в Германии? Можно ли понять чем отличается российский клиент банка от немецкого? Или такое сравнение трудно сделать?
В Германии мы работаем по первой теме – предсказыванию и вычислению цен сложных финансовых продуктов. А с оперативной работой с клиентами там намного проще, поскольку рынки намного стабильнее. Это здесь за клиентами бегают «с сачками», потому что высокий процент по выплатам.
Беспокоит ли вас то, что российские банки порой работают с плохими клиентами, что они дают кредиты людям, которые не в состоянии их вернуть?
Как раз наш проект и направлен на решение этой проблемы. Есть разные кредиты – ипотечные и потребительские. С ипотекой проблем меньше, а вот с потребительскими сложнее. Задача такова: пришел клиент, как понять за 20 минут, отведенных клиенту, давать кредит или нет.
Вы работаете только со статистическими данными? Или вы привлекаете психологов и социологов?
Нет. Моя наука основано только на анализе данных. Если есть достаточно данных, то ни о какой психологии можно не думать.
Под статистикой имеется в виду год рождения, пол, место работы и прочее?
Есть анкета, клиент вносит данные о себе. То, что мы пытаемся делать, это использовать данные из социальных сетей, тех же Facebook и Twitter.
Ого! То есть когда вы пишете в Twitter’e сообщение…
Вы показываете и себя, и свое окружение. Эта информация может быть использована, в том числе для оценки кредитоспособности (credit scoring). Наша задача улучшить систему credit scoring для уменьшения риска кредитного дефолта.
Кроме того, очень интересен класс задач, связанных с медициной, которыми мы начали заниматься в Берлине. Даже не с медициной, а с неврологией, исследованием деятельности и болезней головного мозга. Обычно используются неразрушающие технологии, когда мы в голову не лезем, а измерения делаются обычным томографом, который регистрирует магнитное поле в головном мозге.
И здесь есть задачи разного типа. Первый тип задач, которые мы раньше решали, это определение расположения функциональных центров головного мозга. Примерно известно, где они находятся, но у каждого конкретного человека немного в разных местах. Пример типичная задача: можно ли у человека удалить опухоль, не задев главных функциональных центров. Для этого эти центры нужно идентифицировать. Мы этим занимались, сделали программный пакет, который на данный момент считается самым продвинутым в этой области. Это задача более-менее решена.
То есть здесь тоже помогает только математика? Вам не нужно сотрудничать с нейрофизиологами?
Естественно мы сотрудничаем с медиками, причем и в Германии, и в Америке, у нас есть партнёры в университетах Берлина, Магдебурга, Мюнстера, Нью-Йорка.
Следующий, более интересный класс задач связан с исследование активности головного мозга. Оказывается, что важную роль играют не только функциональные центры, а но и нейронные связи, структура нейронных пучков и волокон в головном мозге. Основная проблема в том, что разрешающая способность томографов ограничена на физическом уровне, это примерно 1 кубический миллиметр, лучше сделать невозможно. То есть головном мозге можно увидеть точку (воксель) миллиметр на миллиметр на миллиметр. А толщина одного нейронного волокна – 1 микрон. И нам нужно эти волокна идентифицировать.
Представьте, картинка состоит из кубиков, а этот нейрон в кубике как иголка в стогу сена, как его можно найти? Самое парадоксальное не в том, что это невозможно, а в том, что мы это делаем. Для этого используются так называемые структурные предположения, которые состоят в том, что это волокно не само по себе, а находится в пучке. Мы считаем, что волокна идут вместе, параллельно. Эти пучки имеют неприятную особенность пересекаться, делиться на части, или наоборот сливаться. Это сложные вещи. Эта область исследований называется fiber tracking – отслеживание нейронных пучков в головном мозге.
Сейчас мы начинаем еще один проект совместно с центром по нейробиологии в Магдебурге по исследованию процессов обучения, нас интересует, что происходит в головном мозге в процессе обучения. Проводятся исследования на мышах, обезьянах и на людях. Человек, например, наблюдает сигналы, в которых есть какие-то закономерности, но он не знает какие, ему надо понять. Два раза пикает, пауза, еще раз пикает на фоне какого-то шума. В зависимости от способностей человека с какого-то момента, после третьего-четвертого теста, он начинает распознавать закономерность. Что при этом происходит в головном мозге? Как этот механизм можно отследить и потом может быть на него повлиять? Вот краткая суть нашего проекта.
Там задействовано абсолютно всё, что есть в нашей науке. В этот проект вовлечено много разных групп, есть много разных исследовательских задач. Нужно понять, как устроена деятельность головного мозга, как описывать деятельность в этом процессе. Что происходит? Как эти структуры меняются, когда это обучение произошло?
Понятно, что человек – сложный организм, там происходит многое, что не связано с процессом обучения. Нужно отделить одну компоненту от другой, и все смоделировать. И это нужно делать сравнительно быстро на основании разных видов данных. Данные могут поступать и от магнитно-резонансной томографии, и электроэнцефалограммы, и еще от каких-то методов измерения, результаты которых нужно собрать вместе.
С одной стороны, у каждого индивидуума обучение идет по-разному, а с другой стороны, есть какие-то закономерности. Нам нужно понять, как это устроено у разных людей, надо понять, как их поделить на группы, ведь одни люди быстро обучаются, другие медленно. Такова задача, которую я очень надеюсь, можно будет и исследовать не только в Магдебурге (Германия), где находится институт. Я надеюсь подключить к этому большому проекту один из московских институтов.
Мне рассказали, что вы работаете еще над проектом driver assistance, можете о нем сказать несколько слов?
Задача состоит в том, чтобы ускорить и повысить эффективность методов тестирования и валидации разных компьютерных систем автонавигации. В данном случае идет речь о системе компьютерной помощи водителю. Водителя предупреждают о том, что на дороге появились препятствия, что дорога поворачивает, что пешеход на дороге, что меняются погодные условия. В определенные моменты эта система включается в активные действия самостоятельно. Когда по каким-то причинам нужно резко затормозить, когда система видит, что машина не туда едет, дается сигнал автоматического торможения.
Такие вещи делает фирма Bosch в Германии. Она озабочена повышением эффективности проверки, то есть – как эти системы работают – не к нам вопрос. Речь идет о том, что сделана система, ее надо проверить, как она работает. Вот сделана новая версия системы и ее надо в течение 15 тысяч часов на разных входных данных протестировать. Это очень долго, более 600 дней. Как это время тестирования сократить, не жертвуя качеством тестирования? Точно также, когда разрабатывается крыло самолета или его система охлаждения, никто не будет проводить многочасовые полетные испытания по каждому изменению. Всё это делается на программных данных, на моделях.
Слушаю ваш рассказ и вспоминаю знаменитую фразу, что в основе мира был великий математик. Получается, что математика – основа познания мира?
Абсолютно верно. В принципе трудно найти задачу, где бы ни требовалось математического моделирования и предсказания. Здесь мы на месте. Как-то раз я давал интервью на эту тему «Большому городу». Меня спросили, как коротко сказать, чем вы занимаетесь, зачем вы нужны? Я ответил, что помните, была такая песня про гадалку: «Ну что сказать? Ну что сказать? Устроены так люди, желают знать, желают знать, желают знать, что будет». Мы – не гадалки, но мы можем сделать научный прогноз. На математическом уровне мы пытаемся объяснить, что будет, исходя из имеющихся данных. Это наша специализация. И за этим стоит хорошая и довольно крутая математика.
Спасибо большое за интервью.
Ничего нового — см. «Новый наряд короля», Андерсен
P.S. А уезжают не из-за денег, а за социальной защищённостью!