Апробация на практических задачах
Распознавание типов земель по спутниковым изображениям (36 признаков, 6 классов, обучающая выборка — 4435 единиц, контрольная — 2000) — UCI; Предсказание лесных пожаров (12 входных переменных и 1 выходная, обучающая выборка — 477 единиц, контрольная — 40) — UCI; Были использованы следующие практические задачи, часть которых была взята из репозитория машинного обучения UCI: Классификация ирисов (4… Читать ещё >
Апробация на практических задачах (реферат, курсовая, диплом, контрольная)
Для апробации предложенных схем генерирования алгоритмического ядра интеллектуальных информационных технологий была разработана программная система решения прикладных задач — моделирования, классификации, кластеризации, прогнозирования, управления.
При реализации генетического алгоритма вместо стандартного за основу был принят ГА с модифицированным оператором множественной равномерной рекомбинации [Шабалов, 2008a], [Шабалов, 2008b].
Были использованы следующие практические задачи, часть которых была взята из репозитория машинного обучения UCI:
Классификация ирисов (4 признака, 3 класса, обучающая выборка — 135 единиц, контрольная — 15) — UCI;
Классификация вин (13 признаков, 3 класса, обучающая выборка — 163 единиц, контрольная — 15) — UCI;
Предсказание лесных пожаров (12 входных переменных и 1 выходная, обучающая выборка — 477 единиц, контрольная — 40) — UCI;
Распознавание типов земель по спутниковым изображениям (36 признаков, 6 классов, обучающая выборка — 4435 единиц, контрольная — 2000) — UCI;
Прогнозирование состояния турбины по вибрационным характеристикам (11 входных и 12 выходных переменных, обучающая выборка — 1000 единиц, контрольная — 400) — реальные данные;
Моделирование процесса рудно-термической плавки (12 входных переменных и 1 выходная, обучающая выборка — 37 единиц, контрольная — 10) — реальные данные.
Прогнозирование деградации электрических характеристик солнечных батарей космического аппарата (7 входных и 4 выходных переменных, обучающая выборка — 177 единиц, контрольная — 20) — реальные данные.
Для каждого типа ИИТ было выполнено 20 запусков программы. При каждом запуске были получены работоспособные системы. В таблице 1 приведены лучшие результаты.
Табл. 1.
№. | Нейронная сеть. | Система на нечеткой логике. | Нейро-нечеткая система. | ||||
Ошибка. | |||||||
О. | Э. | О. | Э. | О. | Э. | ||
16,87%. | 19,61%. | 15,67%. | 17,5%. | ||||
1,78%. | 1,79%. | 1,11%. | 1,11%. | 1,45%. | 1,46%. | ||
9,11%. | 9,14%. | 8,07%. | 8,09%. | 7,99%. | 7,97%. | ||
4,86%. | 4,97%. | 2,99%. | 3,01%. | 2,81%. | 2,92%. | ||
5,66%. | 7,66%. | 5,05%. | 5,87%. | ||||
В таблице 1 приняты обозначения: О — обучение, Э — экзамен. В задачах классификации в качестве ошибки приводится количество неправильно классифицируемых признаков, в остальных задачах — средняя относительная ошибка.
Как видно из таблицы 1, во многих случаях наилучшее качество моделирования имеет нейро-нечеткая система. При этом все типы ИИТ демонстрируют эффективность, сопоставимую с известными результатами.
Ниже приведены примеры построения коллектива на основе математического выражения из частных решений отдельных технологий. Изначально заранее были сгенерированы и обучены по 10 ИИТ каждого типа.
В задаче классификации вин была получена следующая формула:
.
где C — номер класса. При этом ошибка распознавания составила 0% как на обучающей выборке, так и на контрольной, что лучше, чем у нейросетевых и нечетких моделей по отдельности и сравнимо с нейро-нечеткими. При этом отдельные ИИТ, превосходящие остальные по качеству моделирования, в коллектив не вошли.
В задаче моделирования процесса рудно-термической плавки получено выражение:
.
определяющее процентное содержание никеля в отработанном шлаке. Относительная ошибка составила: 2,21% на обучающей выборке и 2,33% на тестовой, что лучше, чем у каждой индивидуальной ИИТ в отдельности.
В ходе многочисленных экспериментов было выявлено, что отдельные технологии, превосходящие по качеству моделирования остальные, не всегда присутствуют в конечной формуле. В композиции могут принимать участие технологии с разным качеством моделирования, коллектив которых позволяет тем самым увеличить эффективность и надежность системы в целом.