22% пройдено
СТАРТ
12 марта
ОКОНЧАНИЕ
10 апреля

Дней до конца: 22

ОНЛАЙН ЭТАП СОРЕВНОВАНИЯ

примените все новые знания к реальной задаче машинного обучения

Разберись в Dota Science

Мы подготовили реальную задачу про популярную игру Dota 2. В игре две команды по 5 игроков сражаются, стремясь разрушить трон команды соперника. Эксперты по игре утверждают, что легко могут отличить матч новичка от игры опытного игрока. Но сможет ли опытного игрока отличить машинное обучение? Для анализа данных и решения этой задачи, опыт игры в Dota 2 не требуется.

Предскажи сильнейших

Ваша задача - построить алгоритм, который сможет определить опытность игрока по статистике из одного матча. Даны обучающие (train) данные для построения моделей и тестовые (test) данные для проверки алгоритмов. Решением задачи являются предсказания ваших алгоритмов на тестовых данных. Чем меньше ошибок совершит ваш алгоритм, тем выше вы поднимитесь в рейтинге!

Попади в финал

Ваше решение вошло в топ-100 лучших по рейтингу? Тогда вас ждет финал! Финалистам будет организована поездка в Москву, где сильнейшие из сильнейших примут участие в Хакатоне 20 апреля 2019 года. За один день нужно будет решить сложную задачу, что вы решаете сейчас в онлайн этапе. Победители финала Академии 2019 смогут выиграть сертификаты на мечту. Ждем тебя в Хорошколе в Москве!

Данные

Для решения задачи участникам предоставляется набор из почти 50000 примеров матчей, уровень игрока в которых известен.
Для каждого из ≈21000 тестовых примеров, участникам необходимо проанализировать данные о матче при помощи своих алгоритмов и дать ответ — опытный ли был игрок.

Каждый предоставленный пример данных описывает характеристики матча и статистику одного из игроков на момент окончания матча.
Все примеры имеют уникальный идентификатор "id".

Мы подготовили два набора данных:

  1. Обучающий Train, в котором для каждого примера известен тип медали опыта игрока.
  2. Тестовый Test, где участникам неизвестна опытность игрока — ее необходимо вычислить.

Наборы данных предоставляются в двух форматах:

  • CSV-таблицы: skill_train.csv, skill_test.csv.
  • JSON-документы: skill_train.jsonlines, skill_test.jsonlines (расширенный, содержит дополнительную информацию, которой нет в CSV-таблицах).

Описание полей с данными можно найти в руководстве по решению задачи. Про данные достаточно знать, что это некоторый набор чисел, идентификаторов и временных рядов, который потенциально несет в себе полезную информацию.

Дополнительно предоставляются файлы с расширенной информацией по героям, предметам и умениям.

Допускается использование любых языков программирования, библиотек, методов машинного обучения, разрешено использование внешних данных из сети интернет.

 данные  Руководство   Дополнительно 

Формат решений

Для каждого примера из тестового набора необходимо предсказать опытность игрока. В систему необходимо предоставить для проверки CSV-таблицу с предсказаниями, она должна содержать две колонки: id — идентификатор примера, skilled — тип медали (0 — новичок, 1 — опытный).

Пример выходных данных (см. файл sample_submission.csv):

  id,skilled
0,0
7,1
9,0
10,0
11,1
15,0
...

Качество решения считается как доля верно угаданных меток «опытный»/«новичок» по всем тестовым примерам. Детальное описание метрики доступно по ссылке ниже.

Для решения удобнее всего использовать язык программирования Python, так как для него есть большое число библиотек для анализа данных: NumPy, Pandas, SciKit-Learn и другие. В качестве инструмента разработки — интерактивную среду Jupyter.

Базовый пример решения от организаторов доступен в виде Jupyter-тетради

 Описание метрики  Пример решения  Github описание  Полезные ссылки

Часто задаваемые вопросы

Как поучаствовать в соревновании?

Сперва необходимо пройти регистрацию, заполнив форму, затем разработать и загрузить свое решение. Вы можете посмотреть, как ваше решение выглядит на фоне других. Решения можно улучшать и загружать снова.

Когда будут определены финалисты?

10 апреля в 23:59 будет закрыт прием решений. На основании результатов онлайн-этапа будет сформирован список финалистов, с которыми лично свяжутся организаторы для организации поездки на Хакатон.

Как будут оцениваться решения?

Решения оцениваются автоматически, сопоставлением предсказаний на тестовых данных с их истинными метками, доступными только организаторам. Рейтинг по задачам вычисляется онлайн и обновляется в реальном времени.

Можно присоединиться к участию позже?

Да. Загрузка решений будет доступна до 23:59:59 10 апреля по московскому времени включительно.

Участие бесплатно?

Да, регистрация и участие бесплатны.

Можно ли участвовать жителям других городов?

Можно.