Найти

Экологическое моделирование с помощью имитаторов для нейронных сетей

Жуков Л.А.
Сибирский Государственный Технологический Университет
660049, Красноярск, ул.Мира 82, СибГТУ, кафедра ИТ
E-mail: it@far.sibstu.kts.ru


В настоящее время для решения различных задач распознавания образов, классификации и нелинейной регрессии используются нейронные сети, в том числе с помощью программ для имитации нейрокомпьютеров на персональных компьютерах. Нейронные сети обучаются для дальнейшего предсказания результата по некоторому набору тестовых данных. В существующих нейроимитаторах и архитектурах нейронных сетей хорошо представлены модели и методы безусловной оптимизации [1-2]. Эти модели и методы позволяют решать различные прикладные задачи, связанные с прогнозом (предсказанием) выходного значения. Но, существует ряд задач, для которых кроме прогноза выходного значения необходимо определение значимости входных данных. Например, это требуется при решении различных экологических задач. Для решения подобных задач с использованием имитаторов сигмоидных нейронных сетей приходится использовать дополнительные методы или дополнительное время обучения. В работах [1-2] предложена структура специальных монотонных нейронных сетей, позволяющих определять значимость входного сигнала или связи и контрастировать сеть в ходе первоначального обучения.
        По предложенным моделям в системе программирования Delphi на языке программирования ObjectPascal разработана программа Monoton для генерации и обучения монотонных нейронных сетей.
        Существуют такие задачи, в которых классификационная модель изначально не точна или не известна. Для таких задач лучше использовать нейронные сети без учителя, позволяющие получать некоторую классификационную модель исходя из данных. Разработан имитатор MDN для нейросетей без учителя. Кроме того, для выполнения вспомогательных и подготовительных операций создана утилита предобработки баз данных - Predmake.
        Возможности нейроимитаторов и обученных нейросетей: простой пользовательский интерфейс, не требующий большого количества специальных знаний для решения простой задачи; возможность создавать нейросети с количеством нейронов от 2 до 100; возможности контрастировать, тестировать нейросети, определять параметры значимости; использование обучающей выборки - файла базы данных (таблицы) в формате dBase либо Paradox. Задачи, поставленные перед программой-нейроимитатором:
    -классификация,
    -тестирование,
    -определение ядер и радиусов классов,
    -определение значимости параметров,
    -рисование проекций данных на плоскость любых двух координат,
    -создание отчета,
    -служебные.
        Для решения этих задач разработаны модули:
           1)Настройки;
           2)Работы с исходными данными - для чтения и подготовки исходных данных, настройки обучающей и тестовой выборок;
           3)Просмотра результатов;
           5) Главный модуль - для обучения и тестирования нейросетей.
        Используемые для оптимизации основные типы расстояний - сумма квадратов и сумма модулей отклонений по координатам. Используется нормирование данных на диапазон [0..1], диапазон [-1..1], или на сферу. Программа не только классифицирует объекты по заданному числу классов, но также, в отличие от классического алгоритма метода динамических ядер, в некоторых случаях позволяет определить оптимальное число классов для классификации, и всегда - диапазон оптимального числа классов.
        Входными данными для работы служат файлы данных структуры dBase или Paradox. Допустимо использование до 300 полей (признаков) и до 10000 записей (примеров). Предварительная обработка данных может быть выполнена с помощью предобработчика PredMake [2, с.70]. Входная таблица данных также может быть модифицирована в самой программе MDN, по желанию пользователя, заполнены пробелы в данных, удалены нечисловые или ненужные поля, удалены лишние примеры, введены новые поля - комбинации от уже существующих.
        Тестовая выборка может быть создана из части записей файла данных. Для тестирования программы использовались данные (Вапник 1984, с.218). Результаты соответствуют приведенным в первоисточнике.
        Программа позволяет нарисовать данные, ядра классов и радиусы классов в проекции на любую пару координат.
        С помощью программы обрабатывались данные по экологии (содержание тяжелых металлов в почве и подстилке), биологии (разделение отрядов, семейств и т.д.), социологии (социология семьи), медицине (моделирование изменений состояния крови при проведении плазмоферезов), истории, педагогике и некоторых других.
        Некоторые из результатов, полученных с помощью MDN:
    - получено разделение почв на группы для разных территорий Красноярского края по анализам на содержание тяжелых металлов и агрохимическим анализам;
    - при решении задачи классификации видов получено безошибочное разделение некоторых видов грибов, злаковых и птиц на группы, полностью соответствующее разделению этих видов биологами и решению этих же задач нейронными сетями с учителем;
    - получено хорошее разделение фотосинтетических тканей листа на несколько групп, по функциональным типам и другим признакам;
    - получено разделение всех поступающих на обучение в вуз на несколько групп, в целом соответствующих результатам поступления.
        Программа использовалась в ходе проведения занятий со студентами СибГТУ и для работы Третьей Зимней Политехнической Школы по Нейроинформатике в СибГТУ.
        Работа поддержана грантом ФЦП “Интеграция”, проект №68, направление 2.1.

Литература:

  1. Горбань А.Н. Обучение нейронных сетей. М.1990
  2. Горбань А.Н. Россиев Д.А. Нейронные сети на персональных компьютерах., Н.: Наука, 1996
Вернуться к основному списку
Рейтинг SIMPLETOP.NET
Rambler's Top100 Powered byCeleron©
Бесплатный хостинг от EOMY.NET