Дипломы, курсовые, рефераты, контрольные...
Срочная помощь в учёбе

Тестовая задача — распознавание символов

РефератПомощь в написанииУзнать стоимостьмоей работы

Символы в антигенах центрировались путём совмещения центра масс с геометрическим центром области (это не является особым упрощением в пользу ИИС, так как эквивалентно модифицированному правилу вычисления расстояния Антиген-Антитело, при котором центрируется массив антитела). Задача осложнялась тем, что каждый символ подвергался случайному масштабированию от 90 до 110 процентов по линейным… Читать ещё >

Тестовая задача — распознавание символов (реферат, курсовая, диплом, контрольная)

В качестве тестовой задачи было использовано распознавание цифр от 0 до 9.

Символы в антигенах центрировались путём совмещения центра масс с геометрическим центром области (это не является особым упрощением в пользу ИИС, так как эквивалентно модифицированному правилу вычисления расстояния Антиген-Антитело, при котором центрируется массив антитела). Задача осложнялась тем, что каждый символ подвергался случайному масштабированию от 90 до 110 процентов по линейным размерам, и случайному повороту в пределах ±15 градусов. В отличии от «игрушечной» задачи по распознаванию [De Castro et al., 2000], в которой каждому классу соответствует один образец данных, для успешного распознавания системе необходимо выполнить обобщение основываясь на различных образцах символов с разными масштабами и поворотами. Ниже приводится график точности классификации, полученный в результате пробного запуска системы. иммунный символ текст обучение Табл. 2.

Антигены.

Цифры от 0 до 9 в виде двоичных массивов размером 15*15.

Антитела.

Двоичные массивы размером 15*15.

Инициализация.

Пустые массивы, пороги связывания — расстояния до случайных антигенов.

Мутация.

Инверсия 8ми случайных точек, домножение порога связывания на случайное число из диапазона [0.8.1.2].

Скрещивание.

равномерное скрещивание (uniform crossover).

Мутация/ Скрещивание.

50%/50%.

Селекция.

Пропорционально приспособленности.

Связывание.

Расстояние по Хэммингу, локальные пороги связывания.

Размер популяции.

Скорость обучения.

20%, 5% после 1000 поколений.

Предъявляемых антигенов за поколение.

300, 1000 после 1000 поколений (новый случайный набор каждое поколение).

Поколений.

Время работы.

20 минут / Celeron 1200 Mhz.

Через 1000 поколений обучение было продолжено с уменьшенной скоростью обучения и увеличенным количеством предъявляемых антигенов в течение ещё 1000 поколений. Такое изменение параметров было произведено с целью экономии времени в начале и уменьшения случайных флуктуаций состояния системы в конце — замена большого количества антител за поколение и маленькая статистика отрицательно влияют на стабильность. Финальная точность классификации составила 99%.

Обучение системы - распознавание символов (серый - мгновенные, чёрный - средние значения).

Рис. 2. Обучение системы — распознавание символов (серый — мгновенные, чёрный — средние значения).

По результатам запуска можно сделать следующие замечания:

Рост точности классификации обеспечивается лишь в среднем, из-за случайного характера системы мгновенные значения точности могут сильно флуктуировать.

Системе удалось произвести обобщение различных образцов одного класса с разными масштабами и поворотами. Аналогично может быть выработана инвариантность распознавания к искажениям, шуму, изменению шрифта.

Не смотря на то, что двоичные массивы антител были инициализированы цветом фона (что означает, что в пространстве параметров они находились далеко от областей, занимаемых классами), обучение привело к созданию эффективных антител, хотя системе потребовалось определённое время (первые 100 поколений) для создания полезных битовых массивов.

Не смотря на то, что в системе нигде напрямую не используются данные об антигенах (например, в отличие от CLONALG [De Castro et al., 2000], при репликации не отдаётся предпочтение антителам, близким к каким-либо антигенам), система смогла произвести эффективные антитела, что говорит о более тонком поведении, чем стохастический направленный поиск.

Был выработан оригинальный способ распознавания: антитела визуально не похожи на распознаваемые символы и имеют хаотический вид (Рис. 3). Даже после усреднения массивов антител одного класса, узнать символы можно лишь с трудом (Рис. 4).

Результат не является тривиальным: если создать случайную выборку из 300 образцов распознаваемых символов и осуществлять распознавание по классу ближайшего соседа, точность классификации оказывается меньше (98%).

Распределённая память: классификация имеет коллективный характер, поэтому удаление отдельных антител не влияет на функционирование системы в целом. Неплохая точность обеспечивалась даже после удаления 80% случайных антител (Рис. 5).

Пример распознавания символа. Справа от антигена приведено несколько связанных антител.

Рис. 3. Пример распознавания символа. Справа от антигена приведено несколько связанных антител.

Всего связано 17 антител с правильным классом, 3 с неправильным. Большинством голосов антиген классифицируется как цифра 6.

Усреднённые массивы антител одного класса.

Рис. 4. Усреднённые массивы антител одного класса.

Устойчивость к удалению антител.

Рис. 5. Устойчивость к удалению антител.

Показать весь текст
Заполнить форму текущей работой