Дипломы, курсовые, рефераты, контрольные...
Срочная помощь в учёбе

Экспериментальная оценка метода обучения и выводы

РефератПомощь в написанииУзнать стоимостьмоей работы

Рассмотренная модель документа и основанная на ней система распознавания позволяют с достаточной точностью извлекать информацию из жестких и полужестких форм. Также система может использоваться для распознавания форм с гибкой структурой, однако в этом случае требуется больший размер обучающей выборки, а процент ошибок достаточно высок. Поэтому наиболее целесообразным является использование… Читать ещё >

Экспериментальная оценка метода обучения и выводы (реферат, курсовая, диплом, контрольная)

Оценка обобщающей способности предложенного метода распознавания документов проводилась методом скользящего контроля. Тестовая выборка, содержащая документы одного типа, сортировалась в случайном порядке. На каждой итерации, после обучения системы распознавания на n изображениях проводилась проверка точности распознавания полей на (n+1)-м изображении. При этом определялось число ошибок, т. е. число полей, локализация которых была определена неверно. Проверка проводилась на нескольких различных сортировках тестовой выборки, после чего вычислялось среднее число ошибок при распознавании n-го документа. На рис. 1 показана зависимость среднего процента ошибок от числа документов, на которых проводилось обучение.

Черный график - полужесткая форма, серый график - гибкая форма.

Рис. 1. Черный график — полужесткая форма, серый график — гибкая форма.

Рассмотренная модель документа и основанная на ней система распознавания позволяют с достаточной точностью извлекать информацию из жестких и полужестких форм. Также система может использоваться для распознавания форм с гибкой структурой, однако в этом случае требуется больший размер обучающей выборки, а процент ошибок достаточно высок. Поэтому наиболее целесообразным является использование обучения для автоматического построения чернового варианта описания документа с последующей доработкой вручную с целью повышения качества распознавания. Для документов произвольной структуры, в которых нельзя выделить статическую часть, например писем, данная система имеет ограниченное применение. Однако она может применяться для некоторых документов, не относящихся к формам, например контрактов, где некоторые ключевые слова (заказчик, адрес, телефон, поставщик и т. п.) могут быть использованы в качестве опорных элементов для локализации необходимых полей.

граф печатный документ.

Показать весь текст
Заполнить форму текущей работой