Тестовая задача — распознавание символов

РефератПомощь в написанииУзнать стоимостьмоей работы

Тестовая задача — распознавание символов (реферат, курсовая, диплом, контрольная)

В качестве тестовой задачи было использовано распознавание цифр от 0 до 9.

Символы в антигенах центрировались путём совмещения центра масс с геометрическим центром области (это не является особым упрощением в пользу ИИС, так как эквивалентно модифицированному правилу вычисления расстояния Антиген-Антитело, при котором центрируется массив антитела). Задача осложнялась тем, что каждый символ подвергался случайному масштабированию от 90 до 110 процентов по линейным размерам, и случайному повороту в пределах ±15 градусов. В отличии от «игрушечной» задачи по распознаванию [De Castro et al., 2000], в которой каждому классу соответствует один образец данных, для успешного распознавания системе необходимо выполнить обобщение основываясь на различных образцах символов с разными масштабами и поворотами. Ниже приводится график точности классификации, полученный в результате пробного запуска системы. иммунный символ текст обучение Табл. 2.


Антигены.	Цифры от 0 до 9 в виде двоичных массивов размером 15*15.
Антитела.	Двоичные массивы размером 15*15.
Инициализация.	Пустые массивы, пороги связывания — расстояния до случайных антигенов.
Мутация.	Инверсия 8ми случайных точек, домножение порога связывания на случайное число из диапазона [0.8.1.2].
Скрещивание.	равномерное скрещивание (uniform crossover).
Мутация/ Скрещивание.	50%/50%.
Селекция.	Пропорционально приспособленности.
Связывание.	Расстояние по Хэммингу, локальные пороги связывания.
Размер популяции.
Скорость обучения.	20%, 5% после 1000 поколений.
Предъявляемых антигенов за поколение.	300, 1000 после 1000 поколений (новый случайный набор каждое поколение).
Поколений.
Время работы.	20 минут / Celeron 1200 Mhz.

Через 1000 поколений обучение было продолжено с уменьшенной скоростью обучения и увеличенным количеством предъявляемых антигенов в течение ещё 1000 поколений. Такое изменение параметров было произведено с целью экономии времени в начале и уменьшения случайных флуктуаций состояния системы в конце — замена большого количества антител за поколение и маленькая статистика отрицательно влияют на стабильность. Финальная точность классификации составила 99%.

Рис. 2. Обучение системы — распознавание символов (серый — мгновенные, чёрный — средние значения).

По результатам запуска можно сделать следующие замечания:

Рост точности классификации обеспечивается лишь в среднем, из-за случайного характера системы мгновенные значения точности могут сильно флуктуировать.

Системе удалось произвести обобщение различных образцов одного класса с разными масштабами и поворотами. Аналогично может быть выработана инвариантность распознавания к искажениям, шуму, изменению шрифта.

Не смотря на то, что двоичные массивы антител были инициализированы цветом фона (что означает, что в пространстве параметров они находились далеко от областей, занимаемых классами), обучение привело к созданию эффективных антител, хотя системе потребовалось определённое время (первые 100 поколений) для создания полезных битовых массивов.

Не смотря на то, что в системе нигде напрямую не используются данные об антигенах (например, в отличие от CLONALG [De Castro et al., 2000], при репликации не отдаётся предпочтение антителам, близким к каким-либо антигенам), система смогла произвести эффективные антитела, что говорит о более тонком поведении, чем стохастический направленный поиск.

Был выработан оригинальный способ распознавания: антитела визуально не похожи на распознаваемые символы и имеют хаотический вид (Рис. 3). Даже после усреднения массивов антител одного класса, узнать символы можно лишь с трудом (Рис. 4).

Результат не является тривиальным: если создать случайную выборку из 300 образцов распознаваемых символов и осуществлять распознавание по классу ближайшего соседа, точность классификации оказывается меньше (98%).

Распределённая память: классификация имеет коллективный характер, поэтому удаление отдельных антител не влияет на функционирование системы в целом. Неплохая точность обеспечивалась даже после удаления 80% случайных антител (Рис. 5).

Рис. 3. Пример распознавания символа. Справа от антигена приведено несколько связанных антител.

Всего связано 17 антител с правильным классом, 3 с неправильным. Большинством голосов антиген классифицируется как цифра 6.

Рис. 4. Усреднённые массивы антител одного класса.

Рис. 5. Устойчивость к удалению антител.

Показать весь текст

Заполнить форму текущей работой

Другие работы

Личностно-профессиональный рост будущего учителя в процессе подготовки к инновационной педагогической деятельности

При организации системы подготовки будущих учителей к инновационной педагогической деятельности с ориентацией на их личностно-профессиональный рост, необходимо использовать активные, развивающие методы и формы организации педагогического процесса, такие как нетрадиционные формы уроков, моделирующая деятельность студентов, научно-исследовательская работа проблемных групп и творческих мастерских…

Диссертация