100% пройдено
СТАРТ
20 апреля 12:05
ОКОНЧАНИЕ
20 апреля 18:30

Соревнование окончено

ФИНАЛ СОРЕВНОВАНИЯ

Поздравляем, теперь вы финалисты и можете гордиться, что вы лучшие в анализе данных среди школьников! На этом этапе продолжится битва искусственных интеллектов, созданных вами.

Что происходит?

Теперь оценить квалификацию игрока можно по его телеметрии - новому слою данных, который был подготовлен специально для очного финала.
Это информация о поведении игрока во время матча - детальные перемещения мышки, клики, взаимодействие с другими игроками, временные ряды.
Для анализа таких сложных данных можно использовать продвинутые техники feature engineering, нейронные сети и deep learning.

Как оцениваем качество?

В этой задаче необходимо будет оценивать вероятность классов (0 - новичок, 1 - опытный), а не “угадывать” правильный ответ - метрика качества ROC AUC.
В этот раз тестовая выборка разбита на приватную и публичную части в соотношении 30/70. Итоговый рейтинг будет рассчитан по результату вашей модели на закрытой тестовой части. Перед завершением соревнования вам необходимо выбрать 2 своих лучших финальных решения.

Призы финала

Лучших из лучших ждет достойный призовой фонд:
- ТОП-3 получат ноутбук, смартфон и планшет от известной яблочной компании;
- ТОП-10 получат 100 000 руб. на исполнение мечты, а также, минуя отборочный этап, смогут попасть в Летнюю школу Физтех-лицея имени П.Л. Капицы, которая, в свою очередь, является итоговым вступительным экзаменом;
- И, конечно, каждый финалист уедет с подарками от Академии ИИ и партнеров.

Данные

Новый набор данных содержит больше информации из игры. Добавлена информация о действиях мышкой и некоторые другие сведения о ходе матча.

Каждый предоставленный пример данных описывает характеристики матча и статистику одного из игроков на момент окончания матча. Все примеры имеют уникальный идентификатор id.

Мы подготовили два набора данных:

  1. Обучающий Train, в котором для каждого примера известен тип медали опыта игрока.
  2. Тестовый Test, где участникам неизвестна опытность игрока — ее необходимо вычислить.

Наборы данных предоставляются в двух форматах:

  • CSV-таблицы: final_train.csv, final_test.csv.
  • JSON-документы: final_train.jsonlines, final_test.jsonlines (расширенный, содержит дополнительную информацию, которой нет в CSV-таблицах).

Дополнительно предоставляются файлы с расширенной информацией по героям, предметам и умениям. На финале можно и нужно использовать данные с предыдущего (онлайн) этапа.

Формат решений

Ваша задача - построить алгоритм, оценивающий вероятность класса skilled. В предыдущей задаче вы предсказывали опытность игрока, указывая в ответе 0 или 1, а качество предсказаний измеряли с помощью метрики Accuracy (Точность).

Теперь задача заключается в том, чтобы оценить шанс (вероятность в диапазоне от [0, 1]) того, что игрок опытный. На практике это означает, что в ответе теперь указывается не просто 1, если ваш алгоритм предсказал, что игрок опытный, а некоторое число близкое к 1, например: 0.8742.

Построенный алгоритм нужно запустить на тестовых данных, сохранить результат в .csv-файл и отправить его как свое решение.

Для каждого примера из тестового набора необходимо предсказать вероятность класса skilled. В систему необходимо отправить CSV-таблицу с предсказаниями вероятности класса 1 она должна содержать две колонки: id - идентификатор игрока, skilled_prob - вероятность того, что он опытный

Пример выходных данных (см. файл sample_submission.csv):

  id,skilled_prob
0,0.74
7,0.68
9,0.12
10,0.94
11,0.35
15,0.62
...