Вопросы и задания
Норвиг, П. Искусственный интеллект. Современный подход / П. Норвиг, С. Рассел. — М.: Вильямс, 2009. Hastie, Т. The Elements of Statistical Learning, Data Mining, Inference, and Prediction / T. Hastie, R. Tibshirani, J. Friedman. — California: Springer, 2008. Ian, II. Data Mining. Practical Machine Learning Tools and Techniques / H. Ian, E. F. Witten. — Burlington: Elsevier, 2011. Какие задачи… Читать ещё >
Вопросы и задания (реферат, курсовая, диплом, контрольная)
1. Перечислите и охарактеризуйте основные этапы разработки системы интеллектуального анализа данных.
2. Какие можно предложить дополнительные методы оценки качества алгоритма машинного обучения кроме предложенных в подпараграфе 4.4.1?
3. Приведите пример задачи чистки данных.
4. Какие задачи необходимо решать средствами машинного обучения?
Практикум
1. Ознакомьтесь с ЙОС-анализом для оценки качества алгоритма машинного обучения. Что с помощью него можно оценить?
2. Изучите документацию, но пакету Weka на официальном сайте (http:// www.cs.waikato.ac.nz/ml/weka). Какие в нем представлены средства анализа данных? В каком формате поддерживается загрузка данных? Как обучить модель в Weka, сохранить ее и использовать в выбранном вами языке программирования?
3. Напишите на выбранном вами языке программирования модуль предобработки естественно-языковых текстов, позволяющий: загрузить текст из популярных форматов (.doc, .html, .txt), выделить из него слова и нормализовать их. Что бы вы использовали в качестве вектора признаков на выходе данного модуля при решении задачи классификации документов по некоторой предметной области? А для решения задачи кластеризации документов (см. гл. 6)?
Рекомендуемая литература
1. Грант, С. Обработка неструктурированных текстов. Поиск, организация и манипулирование / С. Грант, Т. Мартон. — М.: ДМК-Пресс, 2015.
2. Норвиг, П. Искусственный интеллект. Современный подход / П. Норвиг, С. Рассел. — М.: Вильямс, 2009.
3. Флах, П. Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных / II. Флах. — М.: ДМК-Иресс, 2015.
4. Hastie, Т. The Elements of Statistical Learning, Data Mining, Inference, and Prediction / T. Hastie, R. Tibshirani, J. Friedman. — California: Springer, 2008.
5. Ian, II. Data Mining. Practical Machine Learning Tools and Techniques / H. Ian, E. F. Witten. — Burlington: Elsevier, 2011.