Дипломы, курсовые, рефераты, контрольные...
Срочная помощь в учёбе

Семантико-синтаксическая актуализация глагольных омографов в условиях типового контекста: На материале политических статей французской прессы

ДиссертацияПомощь в написанииУзнать стоимостьмоей работы

Для выявления процессов актуализации глагольных омографов в тексте был проведен тщательный анализ большого объема текстов, на основе которого была составлена типология глагольной омографии. Исследование большого фрагмента французской омографии позволило получить словарь глагольных омографов, функционирующих в публицистических текстах и сигнальных сообщениях французской прессы. Исчерпывающее… Читать ещё >

Содержание

  • I. том
  • Список сокращений
  • Глава I. Принципы семиотического моделирования
    • 1. 0. Вводные замечания
    • 1. 1. Общая характеристика омографичного знака
    • 1. 2. Семиотическая модель омографичного знака
      • 1. 2. 1. Компонентный состав омографичного знака
      • 1. 2. 2. Отношение «знак — референт»
      • 1. 2. 3. Отношение «знак — участники коммуникации»
      • 1. 2. 4. Отношение знака к другим знакам в парадигматике
      • 1. 2. 5. Отношение знака к другим знакам в синтагматике
    • 1. 3. Определение понятия «типовой контекст»
      • 1. 3. 1. Схемы построения типового контекста
      • 1. 3. 2. Актуализация глагольных омографов в типовых контекстах
  • Выводы
  • Глава II. Семантико-синтаксическая актуализация глагольных омографов в рамках типовых контекстов
    • 2. 0. Вводные замечания
    • 2. 1. Отбор глагольных омографов в подъязыке публицистики
    • 2. 2. Типология глагольной омографии
    • 2. 3. Выделение границ типового контекста
    • 2. 4. Характеристика типовых контекстов
    • 2. 5. Организация алгоритмов МП в системе MULTIS
    • 2. 6. Актуализация глагольных омографов на уровне перевода лексических единиц
      • 2. 6. 1. Семантический фильтр словаря оборотов
      • 2. 6. 2. Именные машинные обороты
      • 2. 6. 3. Машинные обороты предложений
      • 2. 6. 4. Аналитический предлог
      • 2. 6. 5. Аналитическое наречие
      • 2. 6. 6. Аналитический союз
      • 2. 6. 7. Аналитическое прилагательное
      • 2. 6. 8. Аналитический глагол
      • 2. 6. 9. Омография аналитических единиц
    • 2. 7. Актуализация глагольных омографов на уровне перевода функциональных сегментов
      • 2. 7. 1. Функциональный сегмент сказуемого
      • 2. 7. 2. Функциональный сегмент подлежащего
      • 2. 7. 3. Функциональный сегмент прямого дополнения
    • 2. 8. Актуализация глагольных омографов на уровне перевода предложения
      • 2. 8. 1. Функциональный сегмент сказуемого
      • 2. 8. 2. Функциональный сегмент подлежащего
      • 2. 8. 3. Функциональный сегмент косвенного дополнения
      • 2. 8. 4. Актуализация прилагательного и причастия прошедшего времени
      • 2. 8. 5. Актуализация прилагательного
      • 2. 8. 6. Актуализация причастия прошедшего времени
      • 2. 8. 7. Актуализация предлога
      • 2. 8. 8. Актуализация наречия
      • 2. 8. 9. Актуализация союза
  • Выводы
  • Глава III. Машинная реализация воспроизводящей инженерно-лингвистической модели устранения глагольной омографии
    • 3. 0. Вводные замечания
    • 3. 1. Принципы построения СлСт в двуязычном словаре
    • 3. 2. Выбор единицы входного описания
    • 3. 3. Лингвистическая информация в структуре СлСт
    • 3. 4. Структура СлСт глагольного омографа
    • 3. 5. Процедура актуализации глагольных омографов на разных уровнях перевода
    • 3. 6. Классификация и анализ ошибок машинной актуализации глагольных омографов
    • 3. 7. Заключительные замечания

Семантико-синтаксическая актуализация глагольных омографов в условиях типового контекста: На материале политических статей французской прессы (реферат, курсовая, диплом, контрольная)

Актуальность проблемы. Современный этап научно-технической революции сопровождается колоссальным ростом объема политической, технологической и других видов информации. На первый план выдвигается задача оперативной переработки текстов, написанных на естественном языке, с помощью современных средств вычислительной техники.

Однако успешное выполнение этой задачи немыслимо без решения одной из главных проблем автоматической переработки текстов (АПТ) вообще и машинного перевода (МП) в частности — проблемы омографии /Апресян и др. 1989, 53−60- Малаховский 1990; Cotrell 1989; New directions in machine translation 1989/.

Необходимость устранения этой проблемы определяет актуальность исследования возможностей разрешения глагольной омографии в условиях типовых контекстов через построение воспроизводящей инженерно-лингвистической модели (ВИЛМ) переработки омографов.

При этом, с одной стороны, проблема омографии глагола приобретает особую важность, поскольку автоматический синтаксический анализ (АСА) текстов опирается на вербоцентрический синтаксис Л. Теньера, согласно которому ядром высказывания в единице речевой коммуникациипредложении — является предикат. С другой стороны, с психолингвистической точки зрения аппарат понимания предложения человеком либо процессором включает в себя лексическую и морфологическую информацию, построение синтаксической структуры предложения и, наконец, его семантическую интерпретацию/Секерина 1996, 100/. Известно, что только с момента получения глагола-сказуемого слушающий владеет синтаксической структурой высказывания/Норман 1978, 132/.

Кроме того, использование функционального подхода к анализу языковых явлений стимулирует изучение процессов варьирования языковых средств при их актуализации.

Вместе с тем неуточненными являются теоретические аспекты проблемы омографии в части определения омографов, их типологии, актуализации омографов в их речевые корреляты в конкретном речевом акте. Эти проблемы до сих пор не рассматривались в плане знаковой концепции языка.

Следовательно, актуальность исследования омографии как одного из наиболее ярких проявлений нечеткости лингвистических объектов и асимметрии знака обусловлена не только прикладными целями, но и необходимостью дальнейшего теоретического изучения омографов.

В соответствии с этой проблематикой определяется цель диссертационной работы, которая заключается в исследовании механизма семантико-синтаксической актуализации глагольных омографов в условиях типовых контекстов, а также в развитии теории омографии с учетом знаковой концепции языка.

Поставленная в работе цель реализована в ходе решения следующих задач:

— Исследование семиотической природы омографичных знаков с целью обнаружения лингвистических признаков, диагностирующих однозначность омографов в речи.

— Анализ типов омографии и разработка типологии глагольной омографии.

— Установление набора типичных дистрибуций для каждого вида глагольного омографа и на этой основе составление классификации типовых контекстов.

— Построение ВИЛМ разрешения глагольной омографии.

— Разработка словарной статьи (СлСт) омографа в автоматическом словаре (АС).

— Проверка адекватности модели, включающая анализ типичных ошибок и коррекцию действующей ВИЛМ с целью ее дальнейшего совершенствования.

Объект и материал исследования. Объектом исследования являются глагольные омографы, функционирующие во французском тексте. Базой практической реализации теоретических положений является практическая система МП SILOD-MULTIS, разработанная в лаборатории машинного перевода РГПУ им. А. И. Герцена. Ориентация этой системы на перевод информационных сообщений определила специфику настоящего исследования, которая состоит в том, что в используемой в системе МП машинной орфографии снята диакритика. Этот факт создал наряду с присущей французскому языку омографией целый слой искусственной омографии (см. 2.2). Кроме того, проблема снятия омографии решается в рамках указанной выше системы, в которой переводные эквиваленты настроены на специфику публицистических текстов французской прессы (см. 2.1).

Материалом исследования послужили политические статьи и информационные сообщения французских газет «Le Monde», «Le Figaro», «L'Humanite» за период с 1987 по 1993 гг. Общая выборка составила приблизительно 800 000 словоупотреблений (с/у).

В работе используется методика семиотического моделирования, элементы дистрибутивного, валентно-дефиниционного и компонентного анализа, инженерно-лингвистическое моделирование на ЭВМ.

Научная новизна работы определяется комплексностью исследования глагольных омографов, впервые проведенного с использованием инженерно-лингвистического моделирования, методов дистрибутивного, валентно-дефиниционного и компонентного анализа. Существенно новыми являются следующие аспекты работы:

— построение семиотической модели омографичного знака;

— составление словаря глагольных омографов, характерных для газетного стиля;

— установление набора типовых контекстов, актуализирующих омографы;

— разработка процедур анализа глагольных омографов в системах АПТ;

— компьютерная реализация разработанных алгоритмов распознавания омографов.

В этом плане лично автором получены следующие результаты:

1. Разработана семиотическая модель омографа.

2. Составлен словарь французских омографов, функционирующих в публицистических текстах.

3. На основе словаря описана типология глагольной омографии.

4. Проведена систематизация типовых контекстов, актуализирующих омографы.

5. Составлен словарь машинных оборотов, включающих в свой состав омографы.

6. Построена ВИЛМ семантико-синтаксической актуализации омографов в речевом построении.

7. Проведена систематизация ошибок в машинной реализации ВИЛМ.

Основные теоретические положения, выносимые на защиту.

1. Омограф рассматривается как сложный знак, имеющий идентичное означающее (в графической форме) и два или более означаемых, каждое из которых обладает собственным десигнатом, денотатом и коннотатом и характеризуется собственными значимостями и валентностями.

2. Актуализация глагольных омографов происходит в типовых контекстах, представляющих совокупность типовых формально фиксированных условий, разрешающих омографию. Типовые формально фиксированные условия представляют собой потенциальные валентностные характеристики омографа.

3. Эффективность работы построенной воспроизводящей инженерно-лингвистической модели актуализации глагольных омографов предопределена лингвистической информацией, заложенной в словарную статью омографа.

Практическая ценность исследования состоит в разработке методики устранения омографии в системе 81ЬОО-М1Л/П8. Реализация программ и алгоритмов на ПЭВМ осуществлена программистами П. В. Клочковым и Т. А. Каничевой. Результаты работы могут быть использованы в курсе теоретической и практической грамматики французского языка, в разделе «малого» синтаксиса и в соответствующих разделах лексикологии и семантики в дидактических целях.

Апробация результатов исследования. Основные положения работы обсуждались на IV симпозиуме по лингвистическим проблемам искусственного интеллекта в г. Санкт-Петербурге (апрель 1990), на Всесоюзной научно-методической конференции «Использование ЭВМ в научной и учебной работе гуманитарных вузов» в г. Минске (июнь 1990), на республиканских научно-технических конференциях Кишиневского технического университета (апрель 1989, июнь 1994), на научно-дидактических конференциях Международного Свободного университета Молдовы (март 1997, май 1998).

Объем и структура работы. Диссертация состоит из введения, трех глав, заключения, списка литературы, включающего 107 названий на русском и 39 названий на иностранных языках, содержит 184 страницы машинописного текста, 3 рисунка и 57 таблиц. Приложения включают:

Выводы.

Во второй главе был осуществлен отбор омографов, релевантных для подъязыка публицистики. На основе полученного словаря, содержащего 1168 с/ф, была составлена типология глагольных омографов. С одной стороны, типология основана на вхождении омографов в определенный лексико-грамматический разряд слов. С другой стороны, лексико-грамматические омографы, конверсионные омографы и случаи осложненной омографии отражают различия омографов в плане содержания по их денотативным и де-сигнативным характеристикам.

Актуализация омографов происходит в типовых контекстах, при этом достаточный объем последних равен 2−4 единицам. Процесс снятия омографии требует обращения к разным уровням языковой структуры. Поэтому актуализация может осуществляться либо на грамматическом уровне, включающем морфологические, синтаксические и морфолого-синтаксические контексты, либо на семантическом уровне, представленном семантико-референциальными и семантико-синтаксическими контекстами.

В описанных алгоритмах актуализация омографов происходит с учетом организации алгоритмов МП в системе МЦЬТК.

Для построения компьютерной модели актуализации омографов во всех выделенных контекстах потребовалось разработать СлСт омографа.

Проблеме машинной реализации ВИЛМ устранения глагольной омографии посвящена третья глава диссертации.

ГЛАВА III. МАШИННАЯ РЕАЛИЗАЦИЯ ВОСПРОИЗВОДЯЩЕЙ ИНЖЕНЕРНО-ЛИНГВИСТИЧЕСКОЙ МОДЕЛИ СНЯТИЯ ГЛАГОЛЬНОЙ ОМОГРАФИИ.

3.0 Вводные замечания.

Задачей настоящей главы является разработка СлСт омографов, реализуемой в рамках интегрального лингвистического описания омографов, а также проверка пригодности построенной ВИЛМ актуализации глагольных омографов с целью ее дальнейшего усовершенствования.

3.1.Принципы построения СлСт в двуязычном словаре.

Наиболее эффективным инструментом при решении задач интеллектуальной переработки текстов является лингвистический автомат (ЛА). ЛА представляет собой сбалансированный комплекс аппаратных (hardware), программных (software), лингвистических (lingueware) средств.

ЛА должен представлять собой аналог интеллектуальной деятельности человека. Создание реального ЛА требует предварительной разработки следующих моделей коммуникативно-поведенческой и когнитивно-отражательной деятельности человека:

1. Семиотической модели коммуникативной деятельности, базирующейся на исследовании знаковой природы продукта этой деятельности. Эта модель является основой для установления всей суммы и структуры знаний, необходимых для осуществления, а также выявления способов их взаимодействия в памяти человека и процедур их использования;

2. Структурной модели организации памяти. Определяя способы как денотативного, так и десигнативного представления семантики лингвистических единиц в автомате, эта модель устанавливает оптимальную структуру как самой лингвистической базы данных, так и хранящихся в ней сведений.

3. Модели речевой коммуникации, отражающей работу речемысли-тельной деятельности человека при порождении и восприятии текста. С помощью этой модели фиксируются уровни анализа и синтеза текста, набора единиц, соответствующих каждому уровню, и отношения между уровнями /Беляева, Пиотровский 1990, 3−4/.

С одной стороны, при семиотическом моделировании процессов актуализации омографов необходимо учитывать денотативные, десигнативные и коннотативные характеристики омографов.

С другой стороны, аналогом хранения информации в СлСт выступает структура человеческой памяти, функционально состоящая как бы из двух частей. Первая из них — статическая база — является хранилищем всех языковых обозначений понятий и способов их связи. Вторая часть содержит механизм динамической интерпретации данных, хранящихся в информационной базе /Линдсей и др. 1974, 54/.

С учетом вышесказанного строится иерархически организованная СлСт, обеспечивающая нужды традиционной и машинной лексикографии.

Организация самой СлСт, а также объем лингвистической информации, закладываемой в нее, во многом определяет эффективность и качество работы систем МП.

Одним из условий эффективности работ системы МП является принцип интегрального описания лингвистического материала, предусматривающий согласованность грамматики и словаря. Грамматика и словарь должны быть согласованы друг с другом по типам помещаемой в них информации и по формальным языкам ее записи. СлСт каждой ЛЕ должна содержать всю лингвистическую информацию, обращения к которой могут требовать правила грамматики /Апресян 1986, 57- Апресян 1988, 64/. Иными словами, например, лексико-синтаксические, а в терминах знака де-сигнативные характеристики каждой ЛЕ обеспечивают возможность проведения синтаксического анализа входного предложения.

Первой проблемой разработки словарного обеспечения является выбор заглавной единицы СлСт.

3.2. Выбор единицы входного описания.

Выбор единиц лингвистической информационной базы (ЛИБ) определяется спецификой словои формообразования в конкретных языках, а также особенностями представления в тексте смысловых единиц. Кроме того, выбор базовой словарной единицы определяется задачами системы МП и степенью универсальности ЛИБ.

Ядром ЛИБ является автоматический словарь, так как он содержит базовую информацию для реализации всех процедур анализа текста и порождения перевода. Структура СлСт и ее наполнения определяет возможности системы и ее эффективность. Заглавная единица выбирается таким образом, чтобы минимизировать объем словаря при оптимизации процедуры лексико-морфологического анализа текстов и время этого анализа.

В качестве основной единицы французского словника, а также единицы анализа приняты с/ф и машинная основа (МО) / Аполлонская и др. 1987, 119/.

Выбор с/ф в качестве основной единицы анализа французского текста объясняется тем, что она характеризуется следующими признаками: единством, цельнооформленностью, неразделимостью. Каждая с/ф обладает двумя типами валентных свойств: центростремительными силами, направленными к самой с/ф, что приводит к конденсированию в ней свойств окружающего контекста, и центробежными силами, направленными от с/ф, что ведет к осуществлению процедуры выбора одного из значений окружающих ее ЛЕ / Шведова 1984, 8−12/.

Таким образом, с/ф имеет признаки двойственной природы: статические денотативно-десигнативные признаки различного типа (лексические, морфологические, синтаксические) и динамические коннотативные признаки, приобретенные словом в ходе его функционирования в речевой ситуации.

Наряду с традиционной с/ф для аналитических языков в качестве единиц текста выделяются аналитические слова и конструкции, связанные единым смыслом — сложные времена (а ete forme), аналитические предлоги (а la demande de), союзы (au fur et a mesure que), наречия (/?е7 a petit), глагольные конструкции (/?геиб/ге fin) (см. 2.6). Автоматический анализ и синтез таких единиц возможен лишь на основе их непосредственного отождествления через автоматический словарь или через алгоритм.

Однако, с другой стороны, использование с/ф оказалось неприемлемым для описания глаголов французского языка. Это связано с большим объемом французских глагольных парадигм, насчитывающих до 50 разных форм. Поэтому АС глаголов организован по принципу машинной агглютинативной морфологии / Чижаковский, Беляева 1983, 36/.

В соответствии с этим у каждой глагольной с/ф выделяют машинную основу (МО) и машинную флексию (МФ). Операция выделения МО осуществляется чисто формальным способом — путем отсечения последовательности букв, общей для всех с/ф данной парадигмы. При этом МО и МФ не всегда соответствуют традиционной основе и окончанию. Например, для глагола mettre 'класть' с его формами il met, il mit вместо традиционной основы mettприходится задавать машинную основу т-. Для инфинитива устанавливается МФettre.

Для создания такой французской машинной глагольной морфологии было проведено специальное исследование, в процессе которого были осуществлены:

— классификация глаголов по способу формообразования и выделения типов МО;

— выделения возможных последовательностей окончаний, организованных в словарь типовых парадигм (ТП).

В результате анализа было выделено тридцать шесть типовых парадигм, описывающих морфологию французских глаголов, образующих регулярные формы.

Глаголы с нерегулярным и супплетивным способом образования представлены в АС в виде словоформ.

Итак, автоматический французский словарь организован в виде набора словарных статей, заглавными элементами которых являются с/ф, машинные обороты и машинные глагольные основы.

Рассмотрим теперь особенности лингвистического описания СлСт глагольных омографов.

3.3 Лингвистическая информация в структуре СлСт.

Семиотическое моделирование процессов генерации и восприятия текста делает необходимым различение денотативных, десигнативных и конно-тативных характеристик текстовых единиц при создании их компьютерных аналогов. Соответственно, каждый омограф должен иметь в ЛА описание Бп, ДиСп.

Таким образом, для алгоритмизации процессов порождения и восприятия должны использоваться десигнативные (лексико-грамматические), денотативные (энциклопедические) и коннотативные (дополнительные) характеристики омографов. Объем и характер этой информации определили выбор структуры СлСт. В структуру СлСл включается:

— сама заглавная ЛЕ, то есть с/ф, МО или словосочетание (машинный оборот);

— денотативно-десигнативные и коннотативные характеристики в виде лексико-грамматического кода (ЛТК), структура и наполнение которого определяются типологическими особенностями входного французского и выходного русского языков и реализованными в системе алгоритмами морфологического и семантико-синтаксического анализа •.

— информация о переводе.

В качестве заглавной единицы в нашем случае выступает означающее глагольного омографа в материальной оболочке — сигнальный референт.

Означаемое или план содержания может рассматриваться и задаваться в ЛИБ либо в денотативном плане, т. е. как целостное нерасчлененное единство, либо как десигнат, т. е. как сложная система, состоящая из нескольких смысловых единиц. При описании означаемого глагольного омографа используются денотативные характеристики на уровне признаков принадлежности к определенному семантическому классу, десигнативные характеристики, подробно описывающие значимости и валентности омографов, и коннотативные характеристики, описывающие дополнительные значения знака. Поэтому означаемое омографов представляет собой комбинацию десигна-тивного, денотативного и коннотативного представления значений.

Информация о переводе вводится в словарную статью непосредственно в виде набора переводных эквивалентов, задаваемых основой и морфологической характеристикой / Беляева и др. 1990, 56−57/.

Учитывая вышесказанное, перейдем к подробному описанию СлСт глагольного омографа с точки зрения ее семиотического описания.

3.4. Структура СлСт глагольного омографа.

СлСт глагольного омографа представляет собой формальную модель омографичного знака (см. 1.2). Она должна исчерпывающе описывать D", Ds и Сп омографа. Таким образом, она должна содержать морфологическую, синтаксическую, семантическую и функциональную информацию, свойственную как глаголу, так и другим омографичными с ним классами слов.

Поэтому в данной системе было принято следующее решение — в СлСт глагольного омографа в его ЛГК вначале помещается информация, характерная для глагола, а затем описываются остальные части речи, омографич-ные с глаголом.

Все глагольные омографы обозначаются по первой позиции ЛГК буквенным кодом X независимо от их типов. Уточнение типа омографии реализуется по второй позиции. Кодирование типов омографии представлено в таблице 5.

Рассмотрим процесс формирования СлСт на примере омографа place.

Общая структура описания французского глагола включает семнадцать позиций / Аполлонская и др. 1987, 137/.

Первые две позиции, как было уже сказано, уточняют класс слов или тип омографии. Для place они заполняются соответственно ХР. Третья, шестнадцатая и семнадцатая позиции являются резервными и заполняются 0.

Проанализируем следующие позиции, выделяемые в СлСт глагола в системе SILOD-MULTIS:

4 — морфологические характеристики;

5 — номер типовой парадигмы;

6 — функциональные характеристики;

7 — семантические классы;

8 — наличие и способ перевода прямого дополнения;

9 — наличие и способ перевода косвенного дополнения;

10 — управление пассива;

11 — способы перевода пассивной конструкции;

12 — способы перевода возвратной конструкции;

13 — управление возвратного глагола;

14 — связочные и полу связочные глаголы;

15 — образование безличной конструкции.

Четвертая позиция описывает морфологические характеристики личных форм глагола, отражающих Ds8 (см. 1.2.4). Здесь описываются личные формы шести простых глагольных времен — Present de l’indicatif, Imparfait,.

Passe simple, Futur simple, Present du conditionnel, Present du subjonctif. Для каждого из времен учитываются только четыре формы: третье лицо ед.ч. и все три лица мн.ч. Формы первого и второго лица ед.ч. не рассматриваются как не характерные для исследуемых текстов. Таким образом, эта позиция имеет следующее наполнение:

H — 3 лицо, ед.ч.,.

Q — 1 лицо, мн.ч.,.

S — 2 лицо, мн.ч.,.

V — 3 лицо, мн.ч.

Рассматриваемый омограф place получает символ H по четвертой позиции.

По пятой позиции, характеризующей номер типовой парадигмы для МО, проставляется 0, так как глагольный омограф, исследуемый нами, является словоформой.

По шестой позиции (см. табл.46) описываются формальные и смысловые валентности признаковых знаков, заключающиеся в способности формировать сложное глагольное сказуемое.

В процессе исследования был составлен список глагольных омографов, у которых в данной конструкции появляется Сп, и они модифицируют значение (см. Приложение III). В такой синтаксической конструкции актуализация глагола осуществляется в синтаксическом контексте (см. 2.7.1). Как видно из таблицы 46, шестая позиция содержит список контекстов и трансформационные рекомендации относительно выбора того или иного варианта перевода.

ЗАКЛЮЧЕНИЕ

.

Ускорение научно-технического прогресса опирается на широкое использование новых средств переработки информации с помощью ЭВМ. Эффективность использования ЭВМ в первую очередь зависит от решения одной из главных проблем АПТ и МП в частности — проблемы решения омо-графии.

В настоящем исследовании была сделана попытка рассмотреть глагольный омограф с семиотической точки зрения, показывающей специфику и место омографов по отношению к другим знакам в системе языка и в системе речи.

Для выявления процессов актуализации глагольных омографов в тексте был проведен тщательный анализ большого объема текстов, на основе которого была составлена типология глагольной омографии. Исследование большого фрагмента французской омографии позволило получить словарь глагольных омографов, функционирующих в публицистических текстах и сигнальных сообщениях французской прессы. Исчерпывающее описание всех возможных вариантов контекста, снимающих омографию, было дано в соответствии с различными уровнями анализа входного текста, выделяемого в алгоритмах систем машинного перевода 81ЬСЮ-МЦЪТ18.

На основе выделения контекстов была построена ВИЛМ снятия омографии. Эффективность построенной ВИЛМ прежде всего предопределена лингвистической информацией, заложенной в автоматический словарь. Поэтому словарная статья глагольных омографов представляет собой компьютерный аналог омографичных знаков, в котором означаемое омографов описано как сложная комбинация денотативных, десигнативных и коннота-тивных характеристик.

В результате построения ВИЛМ был проведен машинный эксперимент и получен результат, приближающийся по связности, осмысленности и информативности к естественному тексту входного языка. Анализ ошибок распознавания омографов при машинном переводе публицистических текстов с французского языка на русский позволил определить изменения, вносимые в словарную и процедурную информацию.

Показать весь текст

Список литературы

  1. В.И. О подаче омонимов в словаре // Вопросы языкознания. 1957. -№ 3. — С.31−43.
  2. H.H. О синтаксическом контексте // Лексикографический сб. вып V. М. гос. изд-во иностр. и национ. словарей 1962. С.36−45
  3. H.H. Основы английской фразеологии .- Л: Ленингр. ун-т, 1963. -208 с.
  4. Т.А. Организация словарной статьи в межуровневой системе МП //Инженерная лингвистика и преподавание иностранных языков с помощью ТСО. Л.: Ленингр. пед. ин-т, — 1981. — С. 66−83.
  5. Т.А., Глейбман Е. В., Маноли И. З. Порождающие и распознающие механизмы функциональной грамматики/ Отв. ред. Р. Г. Пиотровский. Кишинев: Штиинца, 1987. — 168 с.
  6. Т.А., Клочков П. В., Харькова Ю. А. Функциональный подход к организации словарной информации в системах АПТ //Международный семинар по МП. Тбилиси 1989. Тезисы докладов.1. М. 1989 .-С П
  7. Т.А., Клочков П. В., Харькова Ю. А. Интеграция грамматики и словаря в условиях машинного перевода // Статистика речи и формализованный анализ текстовых единиц. Л. ЛГПИ 1990. С.9−26.
  8. Т.А., Беляева Л. Н. Инженерная лингвистика и машинный перевод // Лингвистические проблемы искусственного интеллекта. Матер. YII симп., 27 окт. 1992 г./ С-Пб.: Российский гос.пед. ин-т, — 1992. — С.18−32.
  9. Ю.Д. Интегральное описание языка и толковый словарь // Вопросы языкознания. 1986. -№ 2. — С.57−71.
  10. Ю.Д. Синтаксическая информация для толкового словаря // Советская лексикография. Сб.статей. М.: «Русский язык» 1988. С.64−87.
  11. Ю.Д., Богуславский И. М., Иомдин Л. Л. и др. Лингвистическое обеспечение системы ЭТАП-2./ Отв. Ред. Р. Л. Добрушин. М.: Наука, 1989.-269 с.
  12. В.Д. Омонимы в английском языке // Иностранные языки в школе. 1958.-№ 4.-С. 3−11.
  13. И.В. Лексикология современного английского языка. М.: Изд-во лит. на иностр. языках, 1959. — 351 с.
  14. М.Г., Строева Т. В., Хазанович А. П. Многозначность и омонимия. Л.: ЛГУ, 1966. — 130 с.
  15. О.С. Очерки по общей и русской лексикологии. -М.: Гос. уч.-пед. изд. мин-ва Просвещения РСФСР, 1957. 295 с.
  16. О.С. Словарь лингвистических терминов. М.: Изд-во «Советская энциклопедия», 1966. — 608 с.
  17. О.С. Словарь омонимов русского языка. Изд-е Зе. М.: «Русский язык», 1986. — 448 с.
  18. Ш. Общая лингвистика и вопросы французского языка. М.: Изд-во лит. на иностр. языках, 1955. — 416 с.
  19. А.Г., Тарасова А. Н. Синтаксис предложения французского языка: Учебн. пособие на франц. яз. М.: Высшая школа, 1986. — 208 с.
  20. Л.Н. Применение ЭВМ в лингвистических исследованиях и лингводидактике. Учебн. пособие. Л.: Ленингр. пед. ин-т, 1986. — 83 с.
  21. Л.Н., Мигай Т. И. Автоматический словарь и процедура лексико-морфологического анализа в системе М11ЬТ18 // Статистика речи и формализованный анализ текстовых единиц. Межвуз.сб. научных тру-дов.Л.ЛГПИ 1990 С. 54−64.
  22. Л.Г., Пиотровский Р.Г На пути к лингвистическому автомату // Статистика речи и формализованный анализ текстовых единиц. Л.: ЛГПИ, 1990 — С. 3−8.
  23. Э. Общая лингвистика . М.: «Прогресс», 1974. 446 с.
  24. О.В. Заметки об омонимах и их подаче в словаре // Вопросы языкознания. 1973. № 6. — С. 120−126.
  25. В.В., Соболева З. И. Феномен понимания // Лингвистические проблемы искусственного интеллекта. Матер. YII симп., 27 окт. 1992. / -С-Пб.: Российский гос.пед.ин-т, 1992. — С. 32−44.
  26. P.A. Введение в науку о языке. Изд. II. М.: Просвещение, 1965. — 492 с.
  27. Л.А. Введение в языкознание. Часть II М.: Учпедгиз, 1953.- 177с.
  28. В.В. Об омонимии и смежных явлениях // Вопросы языкознания. 1960. — № 5. — С. 3−17.
  29. Гак В. Г. Десемантизация языкового знака в аналитических структурах синтаксиса // Аналитические конструкции в языках различных типов. -М.Л.: Наука, 1965. С. 129−142.
  30. Гак В. Г. Теоретическая грамматика французского языка: Морфология. Изд. П М.: Высшая школа, 1986. — 311 с.
  31. Гак В. Г. Теоретическая грамматика французского языка. Синтаксис. Изд-е II. М.: Высшая школа, 1986. — 220 с.
  32. Гак В. Г. Сравнительная типология французского и русского языков. Зе изд-е. М.: Просвещение, 1989. — 228 с.
  33. Галкина-федорук Е.М. К вопросу об омонимах в русском языке // Русский язык в школе. -М.: 1954. № 3. — С. 14−19.
  34. Ф. Опыт теоретической интерпретации синтаксической омонимии // Вопросы языкознания. 1964. № 6. — С.3−5.
  35. Дискуссия по вопросам омонимии. // Лексикографический сборник. М., 1960.-Вып. 4.-С. 35−92.
  36. К.А. Стилистика французского языка. 2е изд-е. М.: Просвещение, 1987. — 302 с.
  37. X. Чего не могут вычислительные машины. / Пер. с англ. Н. М. Розмана. М.: Прогресс, 1978. — 334 с.
  38. Л. Пролегомены к теории языка // Новое в лингвистике. -М.:Изд-во иностр. лит-ры, 1960. Вып. 1. — С. 264−389.
  39. Естественный язык. Искусственные языки и информационные процессы в современном обществе. / Отв.ред. Р. Г. Котов. -М.: Наука, 1988. 174 с.
  40. М.И. О границах полисемии и омонимии. М.: Изд-во МГУ, 1971.-71 с.
  41. Г. А. Коммуникативные аспекты русского синтаксиса. М.: Наука, 1982. — 367 с.
  42. И.П. О морфологической характеристике слова в современном английском языке // Проблемы морфологического строя германских языков. М.: Изд-во АН СССР, 1963. С. 204−211.
  43. К обсуждению вопроса об омонимах. // Вопросы языкознания. М.: 1959. — № 2. — С.45−50.
  44. С. Об асимметричном дуализме лингвистического знака // В. А. Звегинцев. История языкознания Х1Х-ХХ веков в очерках и извлечениях. Ч. II М.: «Просвещение», 1965. — С. $ 9−36
  45. С.Д. Содержание слова, значение и обозначение. М.-Л.: Наука, 1965.- 109 с.
  46. С.Д. Типология языка и речевое мышление. Л.:Наука, 1972.-216 с.
  47. С.Д. Общее и типологическое языкознание. Л.: Наука, 1986.-297 с.
  48. В.И. Общее языкознание. М.: Высшая школа, 1974. — 308 с.
  49. Г. В. О природе контекста // Вопросы языкознания. М.: 1959.-№ 4.-С. 47−49.
  50. Г. В. О формализации контекста // МП и прикладная лингвистика. М.: 1961.-Вып. 5.- С. 45−50.
  51. Ю.Н., Соколова C.B. Принципы организации алгоритмов машинного перевода // Статистика речи и автоматическая переработка текстов. Л.: ЛГПИ, 1988. — С. 42−50.
  52. Е.Е. Безличные конструкции в современном французском языке (Синтактико-деривационный и типологический подход) // Вопросы языкознания.-М.: 1994.-№ 3.-С. 115−128.
  53. З.Н. К проблеме аналитического слова в современном французском языке. Минск: Вышейшая школа, 1968.- 448 с.
  54. З.Н. Лексикология французского языка. М.: Высшая школа, 1979.- 159 с.
  55. Лингвистический энциклопедический словарь. / Гл. ред. В. Н. Ярцева. -М.: Советская энциклопедия, 1990. 682 с.
  56. П., Норман Д. Переработка информации у человека. / Введение в психологию. М.:Мир, 1974. — .
  57. А.Р. Язык и сознание. / Под ред. Е. Д. Хомской. М.: Изд-во МГУ, 1979.-320 с.
  58. Л.В. Омонимы: Терминология, классификация, определение и принципы выделения // Лингвистические исследования 1972 ч.П. -М.: Академия наук СССР. Ин-т языкознания, 1973. С. 47−67.
  59. Л.В. Теория лексической и грамматической омонимии. / Отв. ред. Р. Г. Пиотровский. Л.: Наука, 1990. — 239 с.
  60. . Словарь лингвистических терминов. М.: Изд-во иностр. лит., 1960.-436 с.
  61. Ю.Н. Проблемы машинного перевода. М.: Наука, 1983. — 232 с.
  62. Ю.С. Омонимы в словарях и омонимия в языке (К постановке вопроса) // Вопросы теории и истории языка. Сб. в честь проф. Б. А. Ларина.-Л.: 1963/.
  63. МедниковаМ. Значение слова и методы его описания. -М.: Высшая школа, 1974.-202 с.
  64. Г. П. Системология и языковые аспекты кибернетики. М.: Сов. радио, 1978.-368 с.
  65. О.Д. Заметки о композитной омонимии // Вопросы языкознания. 1976.-№ 3.-С. 101−106.
  66. М. Фреймы для представления знаний. / Пер. с англ. М.: Энергия, 1979.- 151 с.
  67. С.А., Пиотровский Р. Г. Инженерная лингвистика и опыт системно-статистического исследования узбекских текстов. Ташкент: ФАН, 1986.- 160 с.
  68. .Ю. Синтакасис речевой деятельности. Минск: Вышейшая школа, 1978.- 150 с.
  69. Общее языкознание. Внутренняя структура языка. / Под ред Б. А. Серебренникова. М.: Наука, 1972. — 564 с.
  70. С.И. Словарь русского языка. М.: Русский язык, 1986. — 796 с.
  71. В.М. Понятие лексемы и проблема отношений синтаксиса и словообразования. / Отв. ред. В. Г. Адмони. Л.: Наука, 1985. — 299 с.
  72. М.Ф. Омонимия как следствие лексикализации отдельных грамматических форм и перехода слов из одной части речи в другую //Русский язык в школе. М.: 1960. — № 3. — С. 15−19.
  73. Р.Г., Билан В. Н., Боркун М. Н. и др. Методы автоматического анализа и синтеза текста. Минск: Вышейшая школа, 1985. — 222с.
  74. Р.Г. Компьютеризация преподавания языков. Учебн.пособие. Л.: ЛГПИ, 1988. — 74 с.
  75. Е.А., Васильева А. К. Теоретическая грамматика современного французского языка. 4.1. Морфология и синтаксис частей речи. Зе изд. -М.: Просвещение, 1982. 399 с.
  76. Г. И. Вопросы классификации омонимов в русском языке // Филологические науки. М.: 1961. — № 1. — С. 24−30.
  77. И.А. Американские теории синтаксического анализа предложения в процессе понимания // Вопросы языкознания. М.: 1996. — № 3. -С. 100−138.
  78. .А. Роль человеческого фактора в языке. Язык и мышление. / Отв. ред. В. Н. Солнцев. М.: Наука, 1988. — 244 с.
  79. Л.М. Двадцатый век: открытия и признание // Лингвистические проблемы искусственного интеллекта. Матер. YII симп., 27 окт. 1992 / СПб.: Российский гос.пед.ин-т, — 1992. — С.75−92.
  80. А.И. Лексикология английского языка. М.: изд-во лит-ры на иностр.яз., 1956. — 260 с.
  81. C.B. Организация процедур семантико-синтаксического перевода в системе MULTIS // Использование ЭВМ в научной и учебной работе гуманитарных вузов./ Тезисы докладов. Минск: Минский пед. ин-тут иностр. языков, 1990. — С. 132.
  82. Ф. де-. Труды по языкознанию. / Пер. с франц. яз. под ред. А. А. Холодович. М.: Прогресс, 1977. — 695 с.
  83. . Замечания об омонимии // Пражский лингвистический кружок. Сб. ст. Составление, ред. и предисловие Н. А. Кондрашова. М.: Прогресс, 1967.-С. 272−276.
  84. Прогресс, 1970. Вып У. — С. 250−299.
  85. А.А. Лексическое значение. Принцип семиологического описания лексики. М.: Наука, 1986. — 239 с.
  86. Ф.П. Материалы дискуссии по вопросам омонимии // Лексикографический сборник. М.: 1960. — Вып. У1. — С.59−60.
  87. М.И. Современный русский язык. Лексикология. М.: Высшая школа, 1990.-414 с.
  88. Французско-русский фразеологический словарь / Под ред. ЯМ. Рецкера. М.: Гос. изд-во иностраннных и национальных словарей, 1963. — 1111с.
  89. Г. М. Полисемия: взгляд историка // Вопросы языкознания. -М.: 1996.-№ 5 .-С. 3−6.
  90. З.И., Дмитриева Л. Л. Стилистика французского языка. М.: Высшая школа, 1991. — 398 с.
  91. В.А., Беляева Л. Н. Тезаурус в системах автоматической переработки текста. Кишинев: Штиинца, 1983. — 163 с.
  92. А.Я. О принципах классификации омонимов // Принципы развития в языке. Сб. под ред. Т. А. Дегтяревой. М.: Изд-во ВПШ и АОН при ЦК КПСС, 1959.-.
  93. Н.М., Иванов В. В. Современный русский язык. Изд. 2е, ч.1. -М.: Просвещение, 1987.- 191 с.
  94. А.Н. Выделение типовых контекстов и автоматический перевод // Статистика текста. / Сб. статей, Т. П. Автоматическая переработка текста. Минск: Изд-во БГУ. — 1970. — С. 33−153.
  95. Н.Ю. Об активных потенциях, заключенных в слове // Слово в грамматике и словаре. М.: Наука, 1984. — С.7−15.
  96. Е.И. О грамматической омонимии (на материале немецкого языка) // Иностранные языки в школе. М.: 1955. — № 6. — С.15−25.
  97. Н.В. Межуровневые структуры глагольного класса. Минск: Вышейшая школа, 1988. — 152 с.
  98. H.A. О границах контекста // Интерпретация художественного текста в языковом вузе. / Сб. научн. Тр. Л.: 1981. — С. 123−130.
  99. H.A. Очерки по синтаксису современной французско^раз-говорной речи. Л.: Изд-е Ленинградского ун-та, 1970. 215 с.
  100. H.A. Основы французской пунктуации. М.: Просвещение, 1975.- 110 с.
  101. Е.А. Семиотические основы лингвистической информации. Учебн.пособие. Л.: ЛГПИ, 1987. — 82 с.
  102. Д.Н. Современный русский язык. Лексика. М.: Просвещение, 1977.-335 с.
  103. Ю.А. Логика знаковых систем. Элементы семиотики. М.: Знание, 1974.-63 с.
  104. Н.Ф. К вопросу о разграничении полисемантизма и омонимии // Русский язык в школе. М.: 1956. — № 3. — С. 32−35.
  105. Языковая номинация. Общие вопросы. М.: Наука, 1977. 358 с
  106. Baylon С., Fabre P. Grammaire systematique de la langue francaise. 3e ed. -P.: Nathan, 1995. -337 p.
  107. Blinkenberg A. L’ordre des mots en francais moderne. II partie.-K0benhaven: Levin & Munks, 1933. 241 p.
  108. Colignon J.P. et Berthier P.V. Pieges du langage. Homonymes Paronymes. Faux amis — Singularites. — P.: Gembloux, 1979. — 96 p.
  109. Cosaceanu A., Slavescu M. Gramatica limbii francese. Bucuresti: Ed. 100 + 1 Gram., 1996.-476 p.
  110. Cotrell G.W. A connectionist approach to word sense disambiguation. L.: Pitman, San Mateo (Cal.): Kaufmann, 1989. -IX. — 220 p.
  111. Decoo W., Ardeleneau S. Principes de grammaire: Lettres et signes. Systeme nominal, systeme verbal. Ia§ i: Institutul European, 1996. — 255p.
  112. Dubois J. Grammaire structurale du francais: le verbe. P.: Librairie Larousse, 1967.-218p.
  113. Denis D., Sancier-Chateau A. Grammaire du francais. P.: Librairie generale francaise, 1994. — 541 p.
  114. Dubois J., Lagane R. La nouvelle grammaire du francais. P.: Librairie Larousse, 1973. — 266 p.
  115. Frei H. La grammaire des fautes. P.: Librairie Paul Geuthner, 1929.-317 p.
  116. Frei H. Desaccords // Cahiers Ferdinand de Sausssure. Geneve. — 1961. -№ 18.-P.
  117. Gadet F. Le francais populaire. 2e ed. P.: Presses universitaires de France, 1992.-135 p.
  118. Galichet G. Physiologie de la langue francaise. P.: Presses universitaires de France, 1967. — 135 p.
  119. Godel R. Homonymie et identite // Cahiers Ferdinand de Saussure. 1948. -№ 7.-P. 6−14.
  120. Gougenheim G. Etudes de grammaire et de vocabulaire francais. P.: Editions A. Et J. Picard, 1970. — 432 p.
  121. . P. : Editions Nathan, 1995. — 3 83 p.
  122. Grammaire Larousse du XX-e siecle. P.: Librairie Larousse, 1936 — 468 p.
  123. Grevisse M. Le bon usage. Grammaire francaise. / 9e ed. P.: Editions J. Duculot, 1970. — 1228 p.
  124. Juilland A. Frequency dictionary of French words. The Hague — Paris, Mouton, 1970.-503 p.
  125. Larousse. Dictionnaire de la langue francaise. Lexis. P.: Larousse, 1994. -2105 p.
  126. Le Bidois G. et R. Syntaxe du francais moderne. V.2. P.: Librairie Larousse, 1968. — 617 p.
  127. Le nouveau petit Robert. Dictionnaire alphabetique et analogique de la langue francaise. Sous la direction de J. Rey-Debove et A.Rey. P.: Dictionnaires le Robert, 1995. — 2467 p.
  128. Marouseau J. Notre langue. P.: Librairie Delagrave, 1955. — 279 p.
  129. Martinet A. Grammaire fonctionnelle du francais. P.: Credif, 1979- 276 p.
  130. McCarthy. Vocabulary. Language Teaching: a Scheme for teacher education. Oxford: Oxford University Press, 1995. — 173 p.
  131. Mitterand M. Les mots francais. P.: Presses universitaires de France, 1965. — 127 p.
  132. Monnerie A. Le francais au present. Grammaire. P.: Les editions Didier, 1987.-311p.
  133. Mounin J. Dictionnaire de la linguistique. P.: Presses universitaires, 1974. -340 p.
  134. New directions in machine translation // Conf. Proc., Budapest, Aug. 18−19,1988. / Ed. By Maxwell D. Et al. Dordrecht, Providence: Toris Publ. — 1989. -288 p.
  135. Picoche J. Precis de lexicologie francaise. P.: Fernand Nathan, 1977. — 181 P
  136. Picoche J. Precis de lexicologie francaise. Etude et l’enseignement du vocabulaire. P.: Nathan, 1992. — 191 p.
  137. Rat M. Grammaire francaise pour tous. P.: Librairie Larousse, 1960. — 309 P
  138. Rey A., Chantreau S. Dictionnaire des expressions et locutions. 2e ed. P.: Dictionnaires Le Robert, 1993. — 888 p.
  139. Rey A. Preface // Rey A., Chantreau S. Dictionnaire des expressions et locutions. 2e ed. P.: Dictionnaires Le Robert, 1993. — P. Y-XY
  140. Riegel M., Pellat J.-C., Rioul R. Grammaire methodique du francais. P.: Presses universitaires, 1994.-646 p.
  141. Soutet O. Precis de semantique francaise. 2e ed. P.: Presses universitaires de France, 1993.- 125p.
  142. Tesniere L. Elements de syntaxe structurale. P.: Klincksieck, 1959. — P607
  143. Tresor de la langue francaise: Dictionnaire de la langue du XIXe et du XX-e siecle (1789−1960). / Publie sous la redaction de P. Imbs en 6 vol. 818 p.
  144. Ullmann St. Precis de semantique francaise. 2e ed. Bern: Franke, 1952. -352 p.
  145. САНКТ-ПЕТЕРБУРГСКИИ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ1. На правах рукописи
  146. Диссертационный совет К 063.&-?.Ь2 Защита состоялась 26 марта. 1999 г.
  147. ШУ ЛЬГ, А Александра Федоровна
  148. СЕМАНТИКО-СИНТАКСИЧЕСКАЯ АКТУАЛИЗАЦИЯ ГЛАГОЛЬНЫХ ОМОГРАФОВ В УСЛОВИЯХ ТИПОВОГО
  149. КОНТЕКСТА (на материале политических статей французской прессы)
Заполнить форму текущей работой