Классификация новых данных при помощи дерева принятия решений
Обобщая описанные выше шаги алгоритма, можно кратко описать работу самого классификатора: двигаясь от корня к листьям, классификатор проверяет условие, хранящееся в узле; при удовлетворении условию переходит по ветви «Да», в другом случае — по другой ветви. Движение происходит, пока мы не достигнем листового узла, удовлетворяющего спрогнозированной категории. В листе дерева хранится класс… Читать ещё >
Классификация новых данных при помощи дерева принятия решений (реферат, курсовая, диплом, контрольная)
Обобщая описанные выше шаги алгоритма, можно кратко описать работу самого классификатора: двигаясь от корня к листьям, классификатор проверяет условие, хранящееся в узле; при удовлетворении условию переходит по ветви «Да», в другом случае — по другой ветви. Движение происходит, пока мы не достигнем листового узла, удовлетворяющего спрогнозированной категории. В листе дерева хранится класс и счетчик количества строк, относящихся к данному классу, которых оказалось больше при последнем разбиении.
Приведем псевдокод алгоритма классификации.[1]
На практике наибольшей популярностью пользуются именно деревья принятия решений или леса деревьев (алгоритм Random Forest), так как результаты обучения такого алгоритма дают наглядное представление процесса «рассуждений» алгоритма машинного обучения. Это позволяет не только лучше понять структуру данных, которые подвергаются анализу алгоритмом, но и в случае необходимости внести правки в полученную структуру исходя из понимания природы анализируемых данных и тем самым увеличить качество классификации.
Однако деревья принятия решений, относясь к логическим методам классификации, позволяют строить разделяющие пространстводанных гиперплоскости относительно простой ступенчатой формы. Это не всегда хорошо при наличии сильной нелинейности в данных. Одним из интереснейших алгоритмов машинного обучения, который способен бороться с данной проблемой, является нейронная сеть, рассматриваемая в следующем параграфе.
- [1] Result — результат классификации. Алгоритм: 1. Проверить, достигнут ли конец дерева (есть ли в узле дереваtree. Results). 1.1. Если нет, то проверить условие в текущем узле. 1.1.1. В случае выполнения условия рекурсивно вызвать алгоритмдля ветви «Да», иначе — для ветви «Нет». 1.2. Если да, вернуть Result.