Как мы изучаем искусственный интеллект в Т-Банке и ездим на конференции по всему миру
Специалисты по компьютерным наукам могут заниматься исследованиями не только в вузах, но и в компаниях.
Корпорации активно развивают свои научные и R&D-подразделения , в их число входит T-Bank AI Research. Лаборатория специализируется на изучении искусственного интеллекта. Ее сотрудники рассказали, как пришли в исследования, и объяснили, зачем крупным компаниям заниматься научной деятельностью.
Это истории читателей из Сообщества. Собраны в один материал, бережно отредактированы и оформлены по стандартам редакции
«Мы обмениваемся опытом с коллегами из „Нетфликса“, „Гугла“, „Амазона“»
Старт в индустрии. Мне нравилось программировать еще в школе. Я учился в физико-математическом лицее и с 10 класса стал ходить на дополнительные занятия, чтобы освоить кодинг на олимпиадном уровне. Несмотря на это, я завалил ЕГЭ по информатике, но хорошо написал физику и математику.
Когда в 2019 году настало время поступать, я выбирал между МАИ, МИФИ, мехматом и факультетом космических исследований МГУ. Остановился на последнем варианте ради фундаментального образования, а также из-за его прикладной направленности. И наверное, не прогадал.
На первом курсе нам дали задание распознавать дороги на спутниковых снимках. Разрешили попробовать сделать это при помощи технологий машинного обучения. Мне так понравилось, что следующие полтора года я посвятил изучению нейросетей и ML . Когда в середине 2021 года я овладел основами этой сферы, решил податься на стажировку. Так я прошел отбор и попал в Т-Банк.
Карьера в Т-Банке. До работы в компании мне нравилось строить модели на табличных данных, проводить анализ информации и рисовать графики. Мои интересы удачно совпали с деятельностью в Т-Банке: в сфере рекомендаций как раз нужно много работать с табличными данными. Но этим область не ограничивается: кроме классических подходов здесь также действуют методы на основе глубокого обучения. После стажировки мне предложили продолжить заниматься этим направлением в штате продуктовой команды Т-Банка, и я согласился.
Рекомендательные системы, или RecSys, — это сервисы и программы, которые анализируют предпочтения пользователей и пытаются предсказать, какой контент может их заинтересовать. Они помогают более продуктивно проводить время в приложении или на сайте, давая персональные рекомендации.
Например, пользователь закончил смотреть фильм, и система сразу предлагает ему следующий, который похож на предыдущий. Или же алгоритмы выдают ему другие работы этого режиссера. Таким образом, зритель не тратит время на поиск и сразу включает то, что ему нравится.
В Т-Банке система рекомендаций необходима почти везде. Например, в Т—Ж есть много потоков, внутри которых можно отбирать потенциально интересные читателю статьи. Также алгоритмы нужны в банковском приложении. Допустим, клиенту надо перечислить деньги, а система предложений предугадывает, кому с большей долей вероятности он захочет сделать перевод. Наша задача — персонально формировать поисковую выдачу, подсказки, кэшбэки и собирать индивидуальные рекомендации для каждого клиента банка.
Исследования в T-Bank AI Research. В 2023 году коллеги предложили мне попробовать написать научную статью. Так я начал работать с лабораторией T-Bank AI Research.
Главный исследовательский вызов команды RecSys — сделать систему рекомендаций максимально точной, составить алгоритм, который будет одинаково эффективно работать для всех пользователей вне зависимости от того, как часто они заходят в приложение и сколько проводят в нем времени. Все эти задачи помогает решить машинное обучение, в том числе нейросети.
У отдела нет четкого технического задания от Т-Банка относительно вектора исследований. Мы проводим эксперименты, которые полезны для научного сообщества, а потом уже можем применить их результаты в рабочих процессах.
При этом сфера рекомендательных систем тесно связана с бизнесом. Рекомендации влияют на прибыль, и компании заинтересованы в том, чтобы ее максимизировать. Мы не пишем методы под бизнес-задачу, но, если удалось докрутить идею и она сработала на открытых данных, ее пробуют перенести на продукт. Все наши исследования находятся в свободном доступе, и каждый может протестировать наши решения для своих целей.
Написание статей. Наша команда написала восемь материалов о рекомендательных системах. По формату научная статья представляет собой текст с картинками объемом от четырех до 10 страниц — зависит от регламента конференции и конкретного направления. Различают лонг- и шорт-статьи. Первая категория — это примерно восемь страниц, вторая — четыре. Можно, конечно, написать и больше, но комиссия, которая будет оценивать работу, оставляет за собой право не читать текст, который выходит за заданные рамки.
В среднем на создание статьи закладывается от четырех до шести месяцев. В этот цикл входит получение данных, проведение экспериментов, проверка гипотез, обучение моделей и само написание. На последний пункт требуется примерно три недели при условии, что у нас есть вся необходимая информация. В статье раскрывается та или иная гипотеза, а в процессе работы их могут быть сотни.
Очень часто бывает, что исследователь тестирует одну идею и она не выстреливает, пробует вторую, третью, четвертую, пятую — и тоже без результата. И только шестая оказывается удачной. Это абсолютно нормально.
Статьей обычно активно занимаются два-три человека. Как правило, первым автором идет тот, кто сделал больше всего инженерной работы, в конце — тот, кто принес идею и взял на себя организацию. Параллельно в обсуждениях гипотезы могут участвовать еще несколько коллег. Чтобы статью приняли, нужно соблюсти правила научного оформления по требованиям конференции. Но в этом нет ничего сложного: нам высылают инструкции, необходимо просто следовать им.
Участие в конференциях. С готовыми статьями можно публиковаться и выступать. По рекомендательным системам есть четыре ключевых мероприятия международного уровня. Профильная конференция RecSys, ECIR — European Conference on Information Retrieval, SIGIR — Special Interest Group in Information Retrieval, а также WSDM — Web Search and Data Mining.
На все эти мероприятия принимают российских ученых. При подаче статьи есть два варианта заявки: от анонимных и от открытых авторов. Мы с коллегами пробовали оба формата. Когда подавались открыто, сразу говорили, что из Т-Банка, и вопросов не было.
ИТ-специалист может попасть на конференцию, даже если еще не написал статью. Послушать других спикеров и узнать о новшествах в индустрии тоже очень полезно. Для этого нужно только зарегистрироваться и купить билет.
Особенности конференций по рекомендательным системам в том, что их спонсоры — крупные компании вроде «Нетфликса», «Гугла», «Амазона», «Майкрософта». Другие области, например NLP или Computer Vision , по большей части продвигаются университетами вроде Стэнфорда или некоммерческими организациями типа OpenAI. В рекомендательных системах больше заинтересован бизнес, чем академическое сообщество.
Еще один плюс: на конференциях мы обмениваемся опытом с коллегами из «Нетфликса», «Гугла», «Амазона». Например, в 2023 году мы были на ECIR в Дублине и RecSys в Сингапуре. Мне хорошо запомнилось, как я пообщался с человеком, который отвечает за все рекомендательные системы «Ютуба». К тому же эйчары мировых корпораций могут предложить оффер перспективному специалисту.
Когда я ехал на первую крупную конференцию RecSys, ожидал, что участники в основном будут слушать доклады выдающихся сотрудников «Гугла» и «Амазона» про их модели. Оказалось, что 95% таких научных мероприятий составляет общение, и только 5% — доклады. Последние в основном были скучными, потому что ту же самую информацию можно прочитать в статье с подробностями, делая пометки и глубже вникая в материал.
Для меня самой интересной частью стало общение с экспертами и другими авторами, которые стояли у своих стендов со статьей и отвечали на вопросы людям, изучившим ее заранее. Они не пересказывали содержание, а объясняли какие-то конкретные аспекты и детали. В результате развивалось много диалогов, которые помогали понять недостатки алгоритма и способы, как его можно улучшить.
Однажды такое обсуждение развернулось вокруг статьи сотрудников «Гугла» — про то, как учитывать в рекомендациях не только лайки, но и дизлайки пользователя. И мы коллективно искали решение, как можно доработать алгоритм.
Благодаря международным конференциям мы можем улучшать и использовать наработки других ученых в своих продуктах, а зарубежные коллеги могут делать то же самое с нашими результатами. Хорошие статьи цитируют в научном сообществе. А глобальный обмен знаниями помогает индустрии двигаться вперед.
Есть и трудности, с которыми сталкиваются участники и слушатели международных конференций. Например, автору статьи не всегда удается оформить визу, и выступать приходится другому исследователю, которому тяжело отвечать на вопросы из зала. Кроме того, не все спикеры владеют английским на высоком уровне, поэтому воспринимать выступления бывает непросто.
Работа со студентами. Отмечу, что большинство статей мы пишем со студентами T-Bank Lab в МФТИ и ФКН НИУ ВШЭ. Мы не ожидаем, что к нам будут приходить только отличники из топовых вузов. От кандидата в первую очередь требуется понимание области. Эти знания проверяет тестовое задание и собеседование при отборе в T-Bank Lab.
Таким образом, у нас появляется несколько студентов, каждый из которых пишет свою статью, а мы помогаем и подсказываем. В прошлом году их было трое. Студенты приходят к нам на полгода, и наша задача за это время — подать статью хотя бы на воркшоп. Это такая конференция внутри конференции, где эксперты советуют исследователям, как улучшить статью. После этого можно переделать материал с учетом комментариев и отправить его уже на значимое мероприятие. Некоторым студентам удается написать хорошую научную статью за полгода.
И все же главное для меня — уметь балансировать между бизнес-задачами и исследованиями. Я работаю в продуктовой команде, а значит, в первую очередь отвечаю за продукт. А наука позволяет мне глубже погрузиться в бизнес-задачи.
«Мы занимаемся технологиями, которые будут актуальны в будущем»
Старт в индустрии. Я окончил факультет прикладной математики СПбГУ в 2019 году. В 2018 стал исследователем-разработчиком во «Вконтакте». Там я провел три года: в основном занимался машинным и глубоким обучением, но по большей части выполнял инженерные задачи. Мы должны были создавать технологии для разработки и поддержки наших продуктов. Тогда меня посетила мысль, что я бы хотел заниматься исследованиями.
Мы с коллегами пытались писать свои первые статьи, но получалось не очень хорошо, ведь мы толком не знали, как это делать. В сентябре 2019 года мы открыли первую лабораторию искусственного интеллекта «Вконтакте» на базе МФТИ. Там и начали сотрудничать со студентами и учить их писать научные работы.
Занимаясь с подопечными, я сам начал больше разбираться в том, как делать исследования, и возглавил лабораторию. Мне нравилось развиваться в этой сфере, но со временем я пришел к решению уйти из проекта в МФТИ, чтобы попробовать что-то новое и одновременно с этим больше заниматься инженерными задачами.
Тогда я перешел в стартап Replika, где у меня появилась возможность углубиться в инженерное направление. Спустя семь месяцев я устал и наконец понял, что проводить исследования мне гораздо интереснее. Тогда настало время искать новое место, где я мог бы заниматься наукой на высоком уровне.
Карьера в T-Bank AI Research. В середине 2021 года в Т-Банке появилась своя лаборатория научных исследований искусственного интеллекта T-Bank AI Research. Однажды я сам написал ребятам в социальной сети и вскоре присоединился к команде, которая должна была заниматься научными публикациями. Я пришел туда примерно спустя 4—6 месяцев после запуска проекта. Сейчас, в 2024 году, я дорос до руководителя лаборатории T-Bank Al Research.
Есть несколько векторов, которые может выбрать для себя исследователь в T-Bank AI Research. Исторически так сложилось, что наш отдел по большей части занимается темами NLP, RecSys и CV. Но исследования нужны во всех областях.
Развитие научных подразделений, таких как T-Bank AI Research, — это тренд для бизнеса, который занимается наукоемкими задачами.
Корпорации, делающие технологические продукты, создают отдельные исследовательские отделы и лаборатории. Они помогают выполнять сложные долгоиграющие задачи, которые тяжело реализовать в продуктовом формате.
Когда сотрудник занимается исключительно прикладными вещами, он решает только злободневные проблемы. Грубо говоря, нужно «починить» какую-то модель или продукт, которые не работают. При этом подумать о том, что можно построить с прицелом на долгосрочную перспективу, руки зачастую не доходят. Поэтому в исследованиях есть какая-то романтика: мы занимаемся фундаментальными технологиями, которые будут актуальны в будущем.
Сам процесс научной работы мне тоже очень нравится, потому что мы с командой берем на себя задачи, которые никто не может решить. Для исследователя это действительно очень весело: мы садимся, думаем, тестируем гипотезы, ошибаемся, пробуем снова, пока не добьемся результата. У нашей команды есть свое внутреннее представление о том, какой должна быть статья: полезной не столько бизнесу, сколько научному сообществу, которое исследует искусственный интеллект.
Но все же мы создаем и прикладные разработки. В октябре 2024 года Т-Банк открыл доступ к open-source-библиотеке Turbo Alignment для обучения больших языковых моделей. Стараемся делать так, чтобы они соответствовали ожиданиям людей в широком смысле, не были токсичными и оставались безопасными.
С помощью библиотеки компании могут создавать инновационные продукты на базе больших языковых моделей, например ассистентов поддержки. Над ней работала команда исследований и продукта. Это не метод, который пошел в бизнес в буквальном смысле слова, а скорее дивиденды от исследований. Мы работали над способами оценки и валидации моделей Alignment, все это перешло и в продуктовые инструменты и помогает ускорять разработку.
Работа со студентами. Несколько раз в год мы открываем сезонные заявки для желающих присоединиться к T-Bank Lab в МФТИ. Публикуем их в телеграм-канале «Желтый AI». Зачастую анонсируем набор летом, потому что в этот период у студентов много свободного времени. Иногда спонтанно ищем кандидатов, если у нас накапливается слишком много научных идей, а заниматься ими некогда. Так что набор, по сути, не привязан к анонсам: заинтересованные исследователи могут писать нам на протяжении всего года и предлагать свои идеи.
Студенческая лаборатория в МФТИ — это возможность попасть в науку для тех, у кого не было опыта в исследованиях. В основном это студенты бакалавриата, магистратуры или специалитета, но бывает по-разному.
У нас совершенно точно не нужна степень PhD, которую требуют в академических структурах.
Чтобы попасть в T-Bank AI Research, достаточно публикаций высокого уровня. Но попробоваться можно и без них, если вы сильный инженер в своей области и обладаете видением, как реализовать ту или иную исследовательскую идею.
У нас демократично устроен не только набор, но и рост. Мы смотрим исключительно на результат и уровень ответственности, который берет на себя стажер или сотрудник. Мы не ограничиваем ребят в действиях из-за грейда. Например, джун может не останавливаться на одной статье, а написать целую серию или взять себе студента-помощника и стать для него ментором. При таком раскладе ребята очень быстро развиваются и постепенно вырастают из джунов в сеньоров.