Дипломы, курсовые, рефераты, контрольные...
Срочная помощь в учёбе

Эксперименты. 
Исследование параметров сегментации при статистическом машинном переводе с арабского на русский язык

РефератПомощь в написанииУзнать стоимостьмоей работы

Базовый эксперимент, в котором арабская часть параллельных корпусов, используемых для обучения, тюнинга и тестирования не сегментировалась,. Эксперимент с обратным присоединением приставки будущего времени к следующему за ней глаголу в сегментированном тексте. Эксперимент с удалением определеннго артикля, где в качестве основы также использовался сегментированный текст,. Эксперимент… Читать ещё >

Эксперименты. Исследование параметров сегментации при статистическом машинном переводе с арабского на русский язык (реферат, курсовая, диплом, контрольная)

В данной работе было решено рассмотреть четыре эксперимента:

  • — базовый эксперимент, в котором арабская часть параллельных корпусов, используемых для обучения, тюнинга и тестирования не сегментировалась,
  • -эксперимент с сегментацией, в котором корпусы были сегментированы инструментом Stanford Word Segmenter,
  • — эксперимент с удалением определеннго артикля, где в качестве основы также использовался сегментированный текст,
  • — эксперимент с обратным присоединением приставки будущего времени к следующему за ней глаголу в сегментированном тексте.

Результаты

В ходе экспериментов, были получены следующие результаты:

Таблица 7. Результаты экспериментов.

Эксперимент

BLEUScore.

Базовый.

13.85.

Сегментированный.

14.81.

Удаление артикля.

14.66.

Присоедннение приставки будущего времени.

13.6.

Таким образом, как мы видим, наилучший результат был достигнут при сегментации арабской части параллельного корпуса с помощью инструмента Stanford Word Segmenter. Он почти на 1 балл превосходит базовый эксперимент. Удаление определенного артикля ведет к небольшому — 0,15 баллов — ухудшению результата. Правда, при интрепретации данного результата стоит учитывать несовершенство методологии, которая была использована при постановке опыта. Несколько удивительным может оказаться тот факт, что наихудший результат был получен при отделении всех морфем согласно выдаче Stanford Word Segmenter, кроме приставки, обозначающей будущее временя.

Показать весь текст
Заполнить форму текущей работой