Skip to content
Zukhra Khubieva edited this page Sep 14, 2022 · 3 revisions

В чём вообще суть?

Одна из популярных задач классического машинного обучения - задача линейной регрессии.

Подробнее о разных видах задач машинного обучения можно прочитать здесь.

график линейной регрессии (картинка взята из Интернета)

Линейная регрессия - один из алгоритмов обучения с учителем. То есть существует обучающая выборка, состоящая из пар объект - ответ, связь между которой нам известна.

| $объект_{1}$ | $ответ_{1}$ |
| $объект_{2}$ | $ответ_{2}$ |
| $объект_{3}$ | $ответ_{3}$ |

Для наглядности загляните в data.csv, где каждому пробегу соответствует цена.

Таким образом мы должны решить задачу линейной комбинации признаков:
$y = w_{0} + w_{1}x_{1} + w_{2}x_{2} + w_{3}x_{3}...$
$y$ - зависимая переменная, ответ, который нужно предсказать
$i$ - количество признаков
$x_{i}$ - независимая переменная, признак
$w_{i}$ - вес признака

В нашем случае, мы работаем только с одним признаком (пробег). Но цена на автомобиль может зависеть от вида автомобиля (легковушка/грузовой автомобиль), от страны производства (отечественное производство/иномарка).

пробег вид автомобиля страна производства
$x_{1}$ $x_{2}$ $x_{3}$

Допустим, что минимальная цена автомобиля 500 тыс руб., грузовые автомобили добавляют 500 тыс. руб. к стоимости, а иномарки 300 тыс. руб. А пробег отнимает от цены 1 рубль за каждый километр. Признак "вид автомобиля" представим, как 0 (легковушка) и 1 (грузовик). Также поступим со страной производства: 0 (отечественное авто), 1 (иномарка). Тогда получим уравнение $y = 500000 - x_{1} + 500000x_{2} + 300000x_{3}$

Так мы получим модель, с помощью которой можно предсказать цену автомобиля.

Clone this wiki locally