Найти

NEU-2001

ОБУЧЕНИЕ НЕЙРОСЕТЕЙ С ПОИСКОВЫМ ПОВЕДЕНИЕМ

Т.Ф. Басканова, Ю.П. Ланкин
Красноярский государственный университет; 660041, Красноярск,
пр.Свободный, 79; agat@online.ru
Институт биофизики СО РАН; 660036, Красноярск, Академгородок,
Институт биофизики СО РАН; lan7@mailru.com


Как известно, современные алгоритмы обучения нейронных сетей принято делить на два основных класса: алгоритмы "обучения с учителем" и "обучения без учителя". Алгоритмы первого типа, одним из характерных примеров которых является алгоритм back-propagation [1], обладают более широкими возможностями, чем алгоритмы "обучения без учителя". Так, помимо задач классификации они способны решать задачи прогнозирования, аппроксимации функций и др. Однако и алгоритмы "обучения с учителем" имеют определенные ограничения [2]. В частности, алгоритм [1] способен вести обучение только на очень коротких временных интервалах (до 5-10 тактов функционирования нейросети). Вместе с тем, существенное расширение возможностей нейронных сетей может произойти лишь после преодоления нейрокомпьютерами временного барьера [3] и ряда других ограничений [2]. Для преодоления этих ограничений разработана концепция сетей и систем с самостоятельной адаптаций, предлагающая принципы создания алгоритмов обучения нейронных сетей с поисковым поведением [4].

Рассмотрим один из простых алгоритмов самостоятельной адаптации, который позволяет расширить возможности нейросетевых методов управления и обработки информации.

Пусть функционирование нейрона нейросети описывается уравнением

(1)

где Ai - внешние входные сигналы; αj - входные сигналы от других нейронов; xij - веса межнейронных связей.

Целевая функция с помощью которой оценивается успешность обучения (адаптации) может быть задана, следующим образом:

(2)

где γq* - требуемые значения γq = f (αi).

В процессе адаптации (обучения) нейросети происходит подстройка весовых коэффициентов xij до тех пор, пока не будет получен набор xij, удовлетворяющих условию Hμ, где μ максимально допустимая величина ошибки.

В работе алгоритма можно выделить три повторяющихся этапа:

  1. Сохранение текущих значений ρi0 для каждого нейрона и H0 для сети в целом.

  2. Подбор методом случайного поиска величин ρi таким образом, чтобы выполнялось условие H<H0. При этом ошибка в уровне активности каждого нейрона сети может быть получена как Δρii - ρi0.

  3. Подстройка весовых коэффициентов осуществляется с помощью преобразования xij=xij + Δρiαjy, где коэффициент y – шаг модификации xij.

Изменение xij ведет к уменьшению Δρi, приближающему величины ρi и, следовательно, αi = f(ρi) к желаемым. При этом H стремится к минимально возможным значениям.

Для выполнения поисковой обучающей процедуры может быть использовано множество алгоритмов. Одним из простейших является алгоритм с возвратом на неудачном шаге. Он сводится к построению последовательности ik} по правилу:

где γk - некоторая положительная величина; - какая-либо реализация n - мерной случайной величины с известным законом распределения. Например, координаты xh случайного вектора могут представлять независимые случайные величины, равномерно распределенные на отрезке [-1,1].

Пусть k-е приближение уже известно. Функция H(α(ρi)) в уравнении (2) достигает минимума на некотором множестве Q Î En, ρik Î Q (k ≥ 0).

Алгоритм действует следующим образом. С помощью датчика случайных чисел получают некоторую реализацию случайного вектора и в пространстве En определяют точку rik= ρik + γξ, γ=const>0. Если rikÎ Q и H(α(rik))< H(α(ρik)), тогда ρik+1=rik. Если rikΠQ но H(α(rik))≥ H(α(ρik)), или rikÏ  Q, то сделанный шаг считается неудачным и полагается ρik+1 = ρik.

В ситуации, когда требуемая точность достигнута - H≤μ, или ρik = ρik+1 = ρik+2... = ρik+N, если N достаточно велико, точка ρik принимается в качестве искомой точки минимума.

Ускорение адаптивной процедуры

Для ускорения работы адаптивной процедуры можно использовать прогнозирование направления поиска с использованием предыдущего опыта адаптации. Набор численных методов, пригодных для прогноза наилучшего изменения величин ρi достаточно широк.

Приведем один из подходов, позволяющих осуществить подобную процедуру. Он представляет собой простую самонастраиваемую модель, основанную на вычислении так называемой экспоненциальной средней [5].

Поиск с вычислением экспоненциальной средней. В процессе случайного поиска возникает последовательность значений i}, которые удовлетворяют условию улучшения функции оценки. Это временной ряд ρt, поведение которого прогнозируется (ρt - значение ρi в некоторый момент времени). Пусть временной ряд, генерируемый некоторой моделью ρt = δt + εt, где величина εt генерируется случайным неавтокореллированным процессом с нулевым математическим ожиданием и конечной дисперсией, а величина δt может быть сгенерирована либо детерминированной функцией, либо случайным процессом, либо какой-нибудь их комбинацией.

Вычисление и анализ тенденции динамического ряда можно осуществить с помощью его экспоненциального сглаживания. В его основе лежит расчет экспоненциальных средних. Экспоненциальное сглаживание описывается рекуррентной формулой , где St - значение экспоненциальной средней в момент t; ν - параметр сглаживания, ν = const, 0<ν<1; β=1-ν. Или через значения временного ряда ρt: , где N - количество членов ряда; S0 - величина, характеризующая начальные условия для первого применения формулы при t=1. Так как β<1, то при N → ∞ βN → 0, а .

Тогда .

Таким образом, величина St является взвешенной суммой всех членов ряда.

Пусть ряд генерируется моделью , где a1=const; εt - случайное неавтокоррелированное отклонение, или шум, со средним значением 0 и дисперсией s2.

Применим к нему процедуру экспоненциального сглаживания. Тогда

.

Найдем математическое ожидание и дисперсию

.

Так как 0<ν<1, D(St)< D(ρt)=s2. Таким образом, экспоненциальная средняя St имеет то же математическое ожидание, что и ряд ρ, но меньшую дисперсию. При высоком значении ν дисперсия экспоненциальной средней незначительно отличается от дисперсии ряда ρ.

Чтобы применить экспоненциальную среднюю для краткосрочного прогнозирования используем ряд, который генерируется моделью , где a1,t - варьируемый во времени средний уровень ряда; εt - случайное неавтокоррелированное отклонение с нулевым мат. ожиданием и дисперсией s2. Прогнозная модель имеет вид , где - прогноз, сделанный в момент t на t единиц времени (шагов) вперед; - оценка a1,t. Экспоненциальная средняя St служит оценкой для параметра модели a1,t, . Все свойства экспоненциальной средней являются одновременно свойствами прогнозной модели. Если St-1 - прогноз на 1 шаг вперед, то величина (ρt - St-1) является погрешностью этого прогноза, а новый прогноз St получается в результате корректировки предыдущего прогноза с учетом ошибки.

Литература

  1. Rumelhart D.E., Hinton G.E. & Williams R.J. Learning representations by back-propogating errors.// Nature.- 1986.- 323.-P.533-536.
  2. Ланкин Ю.П. Адаптивные сети с самостоятельной адаптацией./ Препринт ТО №4 Института биофизики СО РАН, Теоротдел.- Красноярск, 1998.- 17 с.
  3. Барцев С.И., Гилев С.Е., Охонин В.А. Принцип двойственности в организации адаптивных сетей обработки информации/ Динамика химических и биологических систем.- Новосибирск: Наука. Сиб. отд-ние, 1989.- С.6-55.
  4. Ланкин Ю.П. Самостоятельно адаптирующиеся нейронные сети в моделировании сложных объектов // Материалы IX-го Международного симпозиума “Реконструкция гомеостаза”; В 4-х т., Т.1.- Красноярск: КНЦ СО РАН, 1998.- С. 281-287.
  5. Басканова Т.Ф., Ланкин Ю.П. Алгоритм самостоятельной адаптации для нейронных сетей с поисковым поведением // Известия вузов. Физика, 2000.- Вып. 6, с.47-51.
Рейтинг SIMPLETOP.NET
Rambler's Top100 Powered byCeleron©
Бесплатный хостинг от EOMY.NET