Эволюционные вычисления и кенгуру: как съездить на конференцию в Австралию
В июле прошлого года Егор Баженов, выпускник магистратуры «Глубокое обучение и генеративный искусственный интеллект», выступил на конференции GECCO 2024. Да не где-нибудь, а в Австралии! О своем научном исследовании, тонкостях подачи на австралийскую визу и красоте страны он рассказал в нашем материале.
Егор Баженов
выпускник программы «Глубокое обучение и генеративный искусственный интеллект» 2024 года, разработчик VK Видео
Об исследовании
Аббревиатура GECCO расшифровывается как «The Genetic and Evolutionary Computation Conference» — конференция по генетическим и эволюционным вычислениям. Для меня это первое подобное выступление, поэтому весь процесс подготовки — от написания и вычитки статьи до ожидания результатов жюри — был вновинку.

Мое исследование посвящено эволюционной векторизации изображений. Тему предложила моя научная руководительница Валерия Ефимова, с которой я работаю, начиная с бакалавриата [Егор окончил программу «Прикладная математика и информатика» (кафедра КТ) в 2022 году. — Прим. ред.].

Что вообще такое векторизация изображений? Это преобразование растровой картинки (состоящей из пикселей) в векторную (состоящей из геометрических фигур, которые заданы математически). Векторные изображения повсеместно используются в архитектуре, дизайне и проектировании, потому что их можно масштабировать без потери качества.
Раньше для векторизации использовались два основных подхода. Первый — это машинное обучение, алгоритмы типа DiffVG и LIVE. Также сейчас некоторые нейронные сети умеют векторизовать изображения просто с помощью TML. Второй подход — это детерминированные алгоритмы, например, SVG Tracer. Есть готовые библиотеки, которые на основании трассировки получают векторные изображения. У обоих этих подходов есть свои плюсы и минусы. Эволюционная векторизация, которую я исследовал, сочетает достоинства обоих методов. Это привело к абсолютно новому, третьему подходу, и в результате экспериментов он оказался в определенных аспектах лучше.

Мой метод называется EvoVec. Он работает так: сначала с помощью детерминированного алгоритма генерируется изображение. Затем эта исходная популяция шаг за шагом улучшается с помощью разработанных мутаций и кроссоверов. Мутации есть трех видов. Первые — удаление лишних путей или сегментов. Вторые — градиентное слияние, когда мы несколько путей объединяем в один. И третий вид мутаций — это мутация изменения, когда мы просто меняем координату и смотрим, стало изображение лучше или нет.

После определенного количества итераций получается финальное векторное изображение. EvoVec работает быстрее, чем алгоритмы на основе машинного обучения, и генерирует меньше путей, чем детерминированные алгоритмы. Также из-за работы с цветовым градиентом (чего не умеют другие подходы) визуальное сходство с исходным изображением выше. В прошлом году мы с коллегами по лаборатории компьютерных технологий выпустили библиотеку на GitHub, где в том числе есть и мой алгоритм. Еще больше подробностей о подходе можно найти в нашей статье.
О получении австралийской визы

Австралийская виза оказалась не самой сложной для подачи. Она почти полностью оформляется онлайн — нужно было только один раз съездить в визовый центр, чтобы сдать отпечатки пальцев. Из необычного: мне пришлось делать перевод военного билета. На визу мы подавались вместе с подругой, которая также выступала на конференции. И я думаю, что из-за всех моментов с военником, ей ответ пришел за десять дней до поездки, а мне всего за три. Билеты и жилье я бронировал уже в спешке.

Оформление визы заняло у меня около месяца, затраты на переводы и сборы составили примерно 20 тысяч рублей. Виза действительна год, так что до лета я могу еще съездить в Австралию.
О финансировании поездки
Лаборатория компьютерных технологий помогла мне частично покрыть расходы на поездку. Выделенного гранта хватило на оплату авиабилетов до Мельбурна и обратно, за что я очень благодарен коллегам.

Об Австралии
Австралия — невероятно классное место. Ее основной минус — это расположение: очень долго добираться. Дорога в одну сторону из России занимает от 30 часов, то есть в пути ты больше суток.

В ту сторону мы летели через Сидней, посмотрели на знаменитую оперу. Сама конференция проходила в Мельбурне, это второй по величине город страны. Мельбурн мне очень понравился: там суперсовременный технологичный центр с высокими небоскребами, окруженный приятными таунхаусами. И, конечно, океан!

Нам удалось посетить несколько интересных мест. Во-первых, мы сходили в зоопарк, посмотрели на австралийских эндемиков — животных, которых нигде больше не увидеть: утконосов, эму, тасманского дьявола. А коал и кенгуру встретили просто в дикой природе, они реально повсюду! Во-вторых, мы побывали на нескольких смотровых площадках и полюбовались видами Мельбурна. Также ездили на океанскую дорогу. Даже видели серферов, хотя июль в Австралии — это зима. Было прохладно, градусов десять, но люди все равно катались на досках. Еще мы с коллегой пытались найти в магазинах перевернутую карту мира, где Австралия была бы наверху. Но нет, это все шутки.

В Австралии, конечно, дороговато. Нам показалось, что все стоит раз в пять больше, чем в России. Тем не менее, у меня остались потрясающие впечатления. Если у вас есть возможность, советую хоть раз в жизни там побывать.
О работе и научной карьере
Я мобильный разработчик под Android и уже больше 4,5 лет работаю в VK. Я делаю плеер, который используется во всех сервисах холдинга, где есть видео: непосредственно VK Видео, VK Клипы, Дзен.

Помимо этого я продолжаю развиваться и в научной сфере: учусь в аспирантуре ИТМО и работаю в лаборатории компьютерных технологий в должности инженера. Сейчас моя задача связана с генерацией векторных планов жилых помещений и коттеджей.

Пока у меня получается совмещать работу в корпорации и научный трек. Надеюсь, так будет и дальше.
О магистратуре
Магистратура дала мне углубленные знания разных аспектов машинного обучения. У нас было много интересных тем, которые в бакалавриате мы проходили вскользь, а тут все подробно, поэтапно, по кусочкам.

Я могу посоветовать «Глубокое обучение и генеративный искусственный интеллект» тем, кто видит свое будущее в машинном обучении. Я уже давно занимаюсь мобильной разработкой, и для меня магистратура — это больше про расширение кругозора. Но я считаю, что чем больше мы знаем, чем больше нагружен наш мозг, тем лучшей версией себя мы можем стать.