machine learning на примере алгоритма ценообразования, Овсеп...
TRANSCRIPT
Data science meetup #14 марта 2017
Авакян Овсеп
Опыт использования ML на примере алгоритма ценообразования
Зачем ?
1. Заказчик хочет просто узнать стоимость (виджет)2. Средние величины не работают3. Разная природа ценообразования4. Существующая модель устарела
Виджет ?
https://www.vezetvsem.ru/perevozka-avtomobilej
Use ML, dude !
Константин Воронцов
Brian Caffo Andrew Ng
Инструменты
● Python, Anaconda, Numpy, Pandas, SciKit Learn, Jupyter● RapidMiner● R, Plot3D, R-Studio
Ошибки в начале
● Попытка получить общую модель для всех направлений
● Грубое отсеивание выбросов● Работа с данными разной природы
Разделяй и обучай
Выделили 14 основных маршрутов. Описали их в виде мультиполигонов
Иногда данных достаточно
Иногда нет...
Ценообразование такое ценообразование
R2
adjusted R2
p-value
Что в итоге ?
+ 8 моделей ценообразования с точностью от 57% до 87%
+ Прирост выручки 500-600 тыс.руб в месяц+ Простая открытая архитектура- Модели желательно периодически дообучать- Модели учитывают не все факторы
Выводы
● ML - не так страшно как звучит● Нужно больше данных !● 99% задач решаются простыми линейными методами
Авакян Овсеп[email protected]
Спасибо !