Ограниченная машина Больцмана

РефератПомощь в написанииУзнать стоимостьмоей работы

Ограниченная машина Больцмана (реферат, курсовая, диплом, контрольная)

Свое название данная модель получила, так как для определения вероятности используют энергию. Если быть точнее, то коэффициентом Больцмана называют (в термодинамике для расчета данного коэффициента используется постоянная Больцмана, которая необходима для связи энергии и температуры).

Архитектура машины Больцмана была предложена еще Полем Смоленски в 1986 году. Однако ввиду сложности обучения такой сети ввиду отсутствия адекватного алгоритма обучения и полносвязности сети (модель является частным случаем стохастической рекуррентной нейронной сети, а точнее стохастическим вариантом сети Хопфилда). Интерес к данной модели вырос в начале 2000;х годов, когда Джеффри Хинтоном был придуман алгоритм обучения ограниченной машины Больцмана (сети без связей между нейронами одного слоя).

Алгоритм называется CD-k и в его основе лежат следующие понятия: принцип минимума свободной энергии, распределение Гиббса, цепь Маркова. Объяснение алгоритма необходимо начать с определения принципа минимума свободной энергии:

«Минимум свободной энергии в стохастической системе по переменным системы достигается в точке термального равновесия, определяемой распределением Гиббса».

В архитектуре машины Больцмана отходят от использования температуры, однако не перестают использовать указанный принцип и правило, написанное выше, согласно которому вероятность повышается, при понижении энергии системы. Энергия системы рассчитывается по следующим формулам:

для нейронов, имеющих бинарное и нормальное распределение, соответственно.

Для максимизации вероятности состояния системы используется метод максимального правдоподобия, который будет показан на примере с использованием логарифмической функции:

Таким образом, принцип минимизации свободной энергии выполняется при движении, противоположном градиенту функции максимального правдоподобия:

= .

Разложение градиента на составляющие позволяет использовать подход, который называется квантованием Гиббса. Суть метода заключается в том, что левая и правая части представляются как отдельные части системы. Таким образом, распределение вероятности состояния системы является распределением Гиббса, причем обе фазы (положительная, характеризуемая энергией системы в исходном состоянии и отрицательная, характеризуемая состоянием системы с измененными параметрами), в соответствии с правилами термодинамики, описанными в работах Гиббса, имеют одинаковую природу. Соответственно, так как обе фазы имеют одинаковую природу, но представляют состояние системы при разных параметрах (забегая вперед, скажу, что негативная фаза является следующим шагом преобразования, представляя цепь Маркова), разница фаз называется шагом Гиббса.

Что представляют из себя фазы и как происходит переход от положительной фазы к отрицательной? Как было сказано выше, фазы — состояния системы с разными параметрами, причем процесс перехода от состояния со старыми параметрами к состоянию с новыми параметрами является Марковским процессом. Таким образом, положительная фаза является исходным состоянием системы, а переход к каждому следующему состоянию происходит по принципу вероятностного перехода. При переходе новое значение нейрона определяется в зависимости от типа нейрона. Так, при семплировании, нейрон бинарного типа будет принимать значение 1, если вероятность его активации выше случайного значения в интервале [0;1]. В отличие от бинарного, нейрон, имеющий нормально распределенное значение, в случае активации, не изменит свое значение, в случае неактивности, значение будет определено, как произведение текущего значения нейрона и вероятности активации. В виде формул нейроны в марковской цепи определяются следующим образом (для бинарного типа нейронов):

Важно отметить, что значение нейрон получает не от сигмоидальной функции, а после семплирования. Однако это не обязательно для нейронов видимого слоя: сам Хинтон советует их не семплировать, так как это не дает качественного улучшения прогноза, но увеличивает его дисперсию.

Показать весь текст

Заполнить форму текущей работой

Другие работы

Заключение. Блез Паскаль и его удивительный треугольник

Мы познакомились с треугольником Паскаля и его вариациями. Эти числовые таблицы были созданы давно и хорошо изучены, нашли свое применение, а последний рассматриваемый треугольник, так называемый, «знаковый треугольник», появился сравнительно недавно, и поэтому его свойства еще не исследованы до конца (например, нерешенным остался вопрос, когда количество минусов и плюсов одинаково…

Реферат