Дипломы, курсовые, рефераты, контрольные...
Срочная помощь в учёбе

Введение. 
Автоматическое порождение правил транскрипции фамильно именных групп

РефератПомощь в написанииУзнать стоимостьмоей работы

Данная работа основана на программе «Трансскриба». В отличие от рассмотренных работ, здесь используется не стохастический, а детерминированный подход, при котором правила пишет эксперт. Метод позволяет повысить эффективность передачи, но требует создания системы правил — правила для одного языка создаются от нескольких недель до нескольких месяцев, в зависимости от сложности задачи. Еще одной… Читать ещё >

Введение. Автоматическое порождение правил транскрипции фамильно именных групп (реферат, курсовая, диплом, контрольная)

Проблема передачи фамильно_именных групп и имен собственных в целом средствами другого языка постоянно возникает в самых разных областях. В разное время наибольшей популярностью пользовались разные подходы, но с середины XX века господствующей тенденцией стала передача звучания имени при его переводе на иностранный язык. К ранним работам в области создания систем автоматической транслитерации и транскрипции имен собственных относятся работы группы Найта. Изначально проводилась транслитерация с японского языка на английский [Knightetal., 1998]. Вскоре этот метод был адаптирован для работы с арабским языком [Al-Onaizanetal., 2002]. Основной задачей метода являлось обнаружение и восстановление имен собственных, уже переданных с использованием другого алфавита. В качестве основы использовался модифицированный алгоритм Витерби.

Однако базовый принцип использования лишь отдельных символов алфавита не позволял получить высокие показатель качества передачи. В связи с этим стали применяться методы, использующие подстроки [Sherif, 2007]. Применение подстрок взамен отдельных символов позволило повысить качество транслитерации примерно с 30 до 90%.

Еще одной важной задачей здесь является автоматическое обучение системы переходов конечного автомата (КА), используемого в перечисленных методах. На данный момент развиваются методы как обучения с учителем [Knightetal., 1998], так и без него [Taoetal., 2006]. Последние работы позволили перейти к обучению по одноязычному корпусу [Ravietal., 2009], что привело, правда, к существенному падению качества передачи.

Данная работа основана на программе «Трансскриба» [Klyshinskyetal., 2008]. В отличие от рассмотренных работ, здесь используется не стохастический, а детерминированный подход, при котором правила пишет эксперт. Метод позволяет повысить эффективность передачи, но требует создания системы правил — правила для одного языка создаются от нескольких недель до нескольких месяцев, в зависимости от сложности задачи.

Показать весь текст
Заполнить форму текущей работой