Обязанности:
Каждый день наши автономные машины собирают терабайты данных, которые мы собираем и анализируем для улучшения и тестирования нашего ПО. Мы ищем человека, который поможет нам в этой задаче и будет строить MVP-алгоритмы расчета различных метрик автономных машин. Вакансия подразумевает работу с большими объемами технических данных с использованием SQL, Spark и polars/pandas. Наш стек: Python (pandas, polars, pyspark), Spark, Dagster, S3, Clickhouse, Metabase. Примеры задач на первое время: Выстраивать коммуникацию с owners функций беспилотного вождения; Разработать на SQL/pyspark алгоритм расчета метрики функции автономного вождения (качество удержания в полосе, качество локализации, дальность распознавания); Задокументировать разработанные алгоритмы; Проверить качество расчета метрики после установки на регламентный расчет Data инженерами; Визуализировать метрики в BI системе. Чем предстоит заниматься: Формирование выборок данных по ТЗ; Разработка MVP витрин данных; Визуализация данных; Проектирование и документирование алгоритмов расчета метрик беспилотной технологии; Сбор требований к метрикам. Что мы ждем от кандидата: Хорошее знание SQL (на уровне джойнов и оконных функций); Был опыт анализа данных с использованием Python (Pandas/Polars); Опыт работы хотя бы с одной из BI систем (Metabase/Superset/Tableau/DataLens). Будет плюсом: Опыт работы со Spark и с Clickhouse; Опыт работы с Airflow/Luidgi/Dagster.Договорная
Москва. Станции метро: Автозаводская, ЗИЛ, Технопарк
АКБ Национальный Резервный Банк