Формирование контента реферата при автоматическом реформировании научного текста

ДиссертацияПомощь в написанииУзнать стоимостьмоей работы

Содержание

1. Обзор существующих решений автоматического реферирования
- 1. 1. Обзор методологий решения задачи автоматического реферирования текста
  - 1. 1. 1. Классификация методологий по структурированности реферата
    - 1. 1. 1. 1. Методологии, направленные на получение конечного результата с четкой структурой
    - 1. 1. 1. 2. Методологии, направленные на получение конечного результата в виде резюме
  - 1. 1. 2. Классификация методологий по методам составления резюме
    - 1. 1. 2. 1. Метод составления выдержек
    - 1. 1. 2. 2. Метод формирования краткого изложения
  - 1. 1. 3. Классификация методологий по наличию прототипного программного обеспечения
  - 1. 1. 4. Анализ методологий решения задачи автоматического реферирования текста
- 1. 2. Обзор коммерческих систем по автоматическому реферированию текста
  - 1. 2. 1. Системы обработки текста
  - 1. 2. 2. Системы автоматического реферирования
  - 1. 2. 3. Анализ существующих систем автоматического реферирования
- 1. 3. Классификация рефератов
- 1. 4. Описание проблемы и постановка задачи
- 1. 5. Выводы по разделу
2. Методы лингвистического анализа научного текста
- 2. 1. Обобщенная схема решения задачи автоматического реферирования текста
- 2. 2. Морфологический и синтаксический анализы
- 2. 3. Выделение устойчивых словосочетаний
  - 2. 3. 1. Модели словосочетаний
  - 2. 3. 2. Способ выделения словосочетаний
    - 2. 3. 2. 1. Основные аспекты поиска словосочетаний
    - 2. 3. 2. 2. Автоматная модель поиска именных словосочетаний
    - 2. 3. 2. 3. Разбиение множества словосочетаний на классы эквивалентностей
    - 2. 3. 2. 4. Анализ выделенных словосочетаний
- 2. 4. Модифицированный граф зависимостей
- 2. 5. Семантический анализ
  - 2. 5. 1. Построение графов семантической окрестности
  - 2. 5. 2. Соединение графов семантической окрестности
- 2. 6. Выводы по разделу
3. Формирование контента реферата научного текста
- 3. 1. Формирование контента резюме
  - 3. 1. 1. Выбор предложений-кандидатов в текст резюме
  - 3. 1. 2. Анализ выбранных предложений на предмет удаления лишних
  - 3. 1. 3. Построение логической последовательности предложений текста резюме
- 3. 2. Оценка реферата
- 3. 3. Выводы по разделу
4. Программное обеспечение и вычислительные эксперименты
- 4. 1. Описание программного обеспечения
  - 4. 1. 1. Функциональность системы
  - 4. 1. 2. Основные классы и пакеты системы
- 4. 2. Вычислительные эксперименты
- 4. 3. Выводы по разделу

Формирование контента реферата при автоматическом реформировании научного текста (реферат, курсовая, диплом, контрольная)

Актуальность исследования. Применение компьютеров в человеческой деятельности, в том числе и научной, не только ускоряет процессы создания и обработки документов, но и чрезвычайно увеличивает их количество и объем. Сегодня многие пользователи регулярно сталкиваются с необходимостью быстрого просмотра большого объема документов и выбора из них наиболее релевантных и действительно нужных документов. Такая проблема возникает при работе с текстовыми документами, базами данных, разборе электронной почты, а также при поиске информации в сети Интернет. Кроме того, очень часто в крупных организациях и компаниях правила делопроизводства предписывают необходимость сопровождать каждый документ кратким рефератом. Во всех указанных случаях выходом из ситуации является просмотр не всего документа, а его сжатого описания — аннотации или реферата. Это обусловило необходимость проведения исследований в решении проблемы автоматического реферирования полнотекстовых документов.

Исследованиями по автоматическому реферированию начали заниматься более 50 лет назад. К настоящему времени разработано достаточно много методов автореферирования, которые можно разделить на методы квазиреферирования и методы генерирования рефератов. Первые основаны на экстрагировании, т. е. выделении из текста наиболее информативных фрагментов, передающих основной смысл текста, вторыена выделении наиболее существенной информации из текстов документов.

Теория и методика реферирования-экстрагирования были разработаны в конце 70−80гг. группой исследователей Ленинградского института культуры: Д. И. Блюменау, Н. И. Гендиной, И. С. Добронравовым, В. В. Леоновым, Д. Г. Лахути, Н. Э. Сергеевой и др. [23−24, 35, 56]. В рамках этой методики разработаны три вида методов: статистические, позиционные и индикаторные.

Статистические методы основаны на использовании статистических параметров для оценки информативности различных элементов текста (слов, предложений), прежде всего, по частоте встречаемости слов в тексте. Вес предложения определяется как сумма частот, входящих в него значимых слов. Существуют методы, в которых в качестве значимых элементов выбираются не слова, а словосочетания. Например, в методе симметричного реферирования вес предложения определяется количеством связей между данным предложением и предложениями, находящимися слева и справа от него.

Позиционные методы опираются на предположение о том, что информативность предложения находится в зависимости от его позиции в тексте документа.

Индикаторные методы основаны на функциональной идентификации фраз первичного документа с помощью индексации их специальными словами — маркерами, индикаторами и коннекторами, образующими лексический аппарат теории экстрагирования.

Для реализации метода генерирования рефератов требуются мощные вычислительные ресурсы, грамматики и словари для синтаксического разбора и генерации естественно-языковых конструкций, онтологические справочники, отражающие соображения здравого смысла, и понятия, ориентированные на предметную область.

Современные работы основываются на результатах, полученных на этапе становления автоматической обработки текстов, как особого направления компьютерной лингвистики, что отражено в работах Р. Г. Пиотровского, И. И. Севбо, А. А. Поликарпова, Ю. А. Шрейдера, М. В. Арапова, Б. В. Сухотина и других [89].

На сегодняшний день разработаны системы автореферирования текста, такие как промышленная система Newsblaster (Колумбийский Университет, США), система Prosum (British Telecommunication Laboratories), инструмент для автоматического аннотирования документов MJI Аннотатор

МедиаЛингва), система «Аналитический курьер», модуль Extractor, выделяющий из представленного ему на вход текста наиболее информативные именные группы, система TextAnalyst (Микросистемы) и целый ряд других. Кроме того, разработаны такие инструменты, как функция AutoSummarize в Microsoft Office, Inxight Summarizer (компонент поискового механизма AltaVista), системы IBM Intelligent Text Miner, Oracle Context. Большинство разработанных систем автоматического реферирования используют метод составления выдержек, т. е. выделяют и выбирают оригинальные фрагменты из исходного документа и соединяют их в короткий текст.

В основе многих систем автореферирования текста лежит статистический анализ текста, а для выявления смысла текста используется построение семантической сети исходного текста. Однако большинство разработок носят экспериментальный характер, не многие существующие системы поддерживают русский язык, генерируют сглаженные рефераты и предполагают опору на знания. Сервисы реферирования ориентированы либо на узкую предметную область, либо требуют участия человека, хотя можно выделить системы, в которых сделана попытка использования знаний на основе онтологического подхода, например, для разрешения проблем омонимии.

Таким образом, необходимо отметить, что в настоящее время переход от экспериментальных лабораторных исследований по созданию качественных рефератов к их использованию в решении прикладных задач реального мира до сих пор не произошел. Поэтому существует техническая проблема, заключающаяся в разработке интеллектуальной системы, позволяющей в автоматическом режиме строить качественные рефераты научного текста. Как правило, в автореферировании выделяются задачи формирования контента реферата и построения дискурса текста реферата. Для решения технической проблемы необходимо в первую очередь решить научную проблему, связанную с разработкой метода формирования контента реферата, адекватно отражающего смысл текста.

Объект исследований — научный текст и соответствующий ему реферат.

Предмет исследований — методы формирования контента реферата.

Целью работы является разработка и исследование алгоритмов автоматического формирования контента реферата научного текста, позволяющих улучшить смысловое качество реферата и повысить эффективность процессов обработки данных и знаний в компьютерных системах и сетях.

Для достижения поставленной цели в работе решаются следующие задачи:

1. Обзор и анализ существующих решений в области автоматического реферирования текста.

2. Выбор и усовершенствование методов лингвистического анализа научного текста.

3. Разработка алгоритмов выбора предложений в реферат и алгоритма составления логической последовательности предложений в реферате.

4. Апробация разработанных моделей и алгоритмов.

Основная идея диссертации. В основе автоматического формирования контента реферата лежит лингвистический анализатор научного текста, осуществляющий морфологический, синтаксический, статистический и семантический анализы текста, выделение устойчивых словосочетаний согласно диагностирующим конструкциям. Однако многие методы невозможно построить без использования онтологий. С помощью онтологий можно построить семантическую сеть исследуемого текста, на основе которой предлагается осуществлять выбор предложений в реферат. Такой подход позволяет сформировать совокупность предложений в реферате, отражающих семантический аспект содержания текста. Как правило, сформированная совокупность предложений реферата не отличается логической последовательностью, поэтому необходимо решить задачу адекватного расположения предложений в реферате на основе анализа семантики исследуемого текста.

Методы исследований. Методологической и теоретической основой выполненного исследования послужили положения теории искусственного интеллекта, логики предикатов первого порядка, нечеткой логики, ситуационного моделирования, теории автоматов и математической лингвистики.

Научная новизна. Научная новизна работы заключается в развитии методов автоматического построения реферата и состоит из следующих элементов.

1. Новизна разработанного алгоритма выбора предложений из анализируемого текста в реферат заключается в применении онтологической базы знаний, позволяющей сформировать совокупность предложений реферата, отражающих смысловой аспект анализируемого текста.

2. Новизна алгоритма формирования логической последовательности предложений в реферате заключается в том, что сформированный контент реферата является информативным и обладает достаточно точным изложением содержания документа.

Практическая ценность исследования состоит в том, что применение алгоритмов формирования контента реферата обеспечит повышение качества реферата в системе автоматического реферирования, применение которой в глобальной сети Интернет, библиотечных системах позволит усовершенствовать процессы обработки данных и знаний в компьютерных системах и сетях.

Достоверность полученных результатов. Достоверность выводов работы определяется сравнительным анализом теоретических положений работы и экспериментальных данных. Сравнение показало корректность разработанных методов и алгоритмов.

Личный вклад автора. Все основные результаты диссертации получены лично автором.

Рекомендации по использованию результатов диссертации.

Результаты работы могут быть использованы при разработке программных средств автоматического построения реферата.

Апробация результатов диссертации. Основные положения и результаты диссертационной работы докладывались и обсуждались на Всероссийской научно-технической конференции «Информационные системы и модели в научных исследованиях, промышленности и экологии» (г.Тула, 2007 г., 2009 г.) — Международной научно-технической мультиконференции «Актуальные проблемы информационно-компьютерных технологий, мехатроники и робототехники» (г. Таганрог, 2009 г.) — Всероссийской научно-практической конференции «Системы автоматизации в образовании, науке и производстве — AS'2009» (г. Новокузнецк, 2009) — Всероссийской научно-технической конференции «Теоретические и прикладные вопросы современных информационных технологий» (г.Улан-Удэ, 2008;2009 гг.) и на ежегодных конференциях преподавателей, сотрудников и аспирантов ВСГТУ. Материалы диссертационных исследований используются в научных исследованиях Центра дистанционного образования Воронежского государственного технического университета при разработке интеллектуальных систем поддержки принятия решений в части построения семантической сети предметной области решаемой задачив учебной деятельности Восточно-Сибирского государственного технологического университета при разработке учебного курса «Естественно-языковые системы» по специальности 230 105 «Программное обеспечение вычислительной техники и автоматизированных систем» в виде курса лекций и методических указаний к лабораторным работам.

Публикации. Основные результаты диссертационной работы опубликованы в 8 печатных работах, из которых 7 статей и одно свидетельство об официальной регистрации программы для ЭВМ.

Общая характеристика диссертации. Диссертация состоит из введения, 4 разделов, заключения, списка использованных источников, содержащего 131 наименование, 6 приложений. Основная часть работы содержит 125 страниц, включая 24 рисунка и 24 таблицы.

4.3 Выводы по разделу.

В данном разделе описано программное обеспечение, необходимое для апробации разработанных методов, имеющее модульную структуру, что позволяет модифицировать некоторые классы проекта и использовать их для решения разных задач. Классы разработаны таким образом, чтобы можно легко менять логику работы системы. К примеру, можно изменить формулы взвешивания сети, менять шаблоны выделения словосочетаний, изменять визуальное представление сети, алгоритм расположения узлов сети, изменять алгоритм выбора предложений в реферат на основе семантической сети, расширять словарь абстрактных прилагательных, добавлять файлы онтологий и т. д. Данное программное обеспечение можно позиционировать не только как систему, формирующую реферат текста, но и как набор пакетов и классов для разработки ЕЯ-систем.

Результаты экспериментальной проверки работы системы показали, что построенные рефераты адекватно отражают смысл текста.

На основе проведенных вычислительных экспериментов можно сделать вывод, что для улучшения логической связности и информативности автореферата необходимо использовать онтологию анализируемой предметной области. Онтология влияет на качество реферата, но в тоже время увеличивает время анализа.

Заключение

Основным результатом проведенных исследований является совершенствование методов автоматического формирования контента реферата научного текста, которое позволило улучшить смысловое качество реферата, что, в свою очередь, позволит повысить эффективность процессов обработки данных и знаний в компьютерных системах и сетях.

Научные и практические результаты работы состоят в следующем:

1. Усовершенствован способ построения семантической сети текста путем соединения графов семантической окрестности посредством анализа модифицированных графов зависимостей и онтологии предметной области.

2. Разработана автоматная модель поиска словосочетаний различных моделей.

3. Разработаны и исследованы алгоритмы выбора предложений из анализируемого текста в реферат на основе семантического анализа.

4. Разработан алгоритм формирования логической последовательности предложений в реферате с использованием онтологии и графов семантической окрестности понятий.

5. Разработано программное обеспечение для апробации предложенных алгоритмов.

Показать весь текст

Список литературы

Автоматизированная система поиска и обработки информации Galaktika-Zoom Электронный ресурс. Режим доступа: http://www.galaktika-zoom.ru. Акулов, О. А. Информатика: базовый курс [Текст] / О. А. Акулов, Н. В. Медведев. — Москва: Омега-Л, 2007. — 560 с.
Алыгулиев, P.M. Автоматическое реферирование документов с извлечением информативных предложений Текст. / P.M. Алыгулиев // Вычислительные технологии. 2007. Т. 12, № 5. С.5−15.
Ахманова, О.С. Словарь лингвистических терминов Текст. / О. С. Ахманова. -М.: Советская энциклопедия, 1969. 490 с.
Ахутина, Т.В. Порождение речи. Нейро-лингвистический анализ синтаксиса Текст. / Т. В. Ахутина. -М.: МГУ, 1989. 41с.
Аюшеева, Н.Н. Исследование и разработка моделей и методов поиска информационных образовательных ресурсов в электронной библиотеке Текст.: автореф. дис.. канд. техн. наук: защищена 21.01.2005: утв. 10.06.2005 / Н. Н. Аюшеева. Улан-Удэ, 2005. — 16 с.
Башмаков, А.И. Интеллектуальные информационные технологии: учеб. пособие Текст. / А. И. Башмаков, И. А. Башмаков. М.: Изд-во МГТУ им. Н. Э. Баумана, 2005. — 304 с.
Беловольская, JI.A. Синтаксис словосочетания и простого предложения Электронный ресурс. / JI.A. Беловольская. Электрон, текстовые дан. -Режим доступа: http://wvvw.philology.ru/ linguistics2/belovolskaya-01 .htm.
Белоногов, Г. Г. Языковые средства автоматизированных информационных систем Текст. / Г. Г. Белоногов, Б. А. Кузнецов М.: Наука, 1953. — 288 с.
Белоногов, Г. Г. Автоматизированная обработка научно-технической информации. Лингвистические аспекты Текст. / Г. Г. Белоногов, Б. А. Кузнецов, А. П. Новоселов // Итоги науки и техники. ВИНИТИ. Сер. Информатика. 1984. — Т.8. — 316 с.
Белоногов, Г. Г. Компьютерная лингвистика и перспективные информационные технологии Текст. / Г. Г. Белоногов, Ю. П. Калинин, А. А. Хорошилов М.: Русский мир, 2004. — 246с.
Беляева, Л.Н. Автоматизация в лексикографии / Л. Н. Беляева, А. Л. Герд, И. И. Убин // Прикладное языкознание: учебник / С.-Петерб. гос. ун-т- отв. ред. А. С. Герд, СПб.: Изд-во С.-Петерб. Ун-та, 1996. — с.318−333.
Беляева, Л.Н. Лингвистические автоматы в современных информационных технологиях / Л. Н. Беляева. СПб.: Изд-во Рос. Гос. Пед. ун-та им. А. И. Герцена, 2001.-130 с.
Бледнов, A.M. Разработка и исследование моделей и информационной технологии семантико-синтаксического анализа русскоязычного текста: дис.канд. тех. наук: 05.13.18, 05.13.01 / A.M. Бледнов Ижевск, 2007.- 120 с. РГБ ОД, 61 07−5/3291
Блюменау, Д.И. Формализованное реферирование с использованием словесных клеше Текст. / Д. И. Блюменау, Н. И. Гендина, И. С. Добронравов и др. //Научно-техническая информация. Сер.2. № 2. Москва, 1981. — С. 16−20.
Блюменау, Д.И. Проблемы свертывания научной информации Текст. / Д. И. Блюменау Л.: Наука, 1982. — 166 с.
Богданов В.В. Классификация речевых актов Текст. / В. В. Богданов // Личностные аспекты языкового общения. Калинин: Калининский гос. ун-т, 1989. -С.25−37.
Бородина, О.А. Именные группы в заголовке и реферате как отражение концепта текста Текст.: дис. канд. филол. наук 10.02.21/ О. А. Бородина. -Санкт-Петербург, 2007.-236 с. РГБ ОД, 61:07−10/592.
ВААЛ: Экспертная компьютерная психолингвистическая программа Электронный ресурс. Режим доступа: http://www.vaal.ru/29. ван Дейк, Т. А. Стратегия понимания связного текста Текст. / Т.А. ван Дейк,
B. Кинч // Новое в зарубежной лингвистике. Вып. 23. М.: Прогресс, 1988.1. C.153−211.
Гарант-Парк-Интернет. Технологии анализа и поиска текстовой информации Электронный ресурс. Режим доступа: http://www.metric.ru.
Гарвин, П. Алгоритм синтаксического анализа «Фулькрум» (для русского языка) Текст. / П. Гарвин // Автоматический перевод. М.: Прогресс, 1971. -С.26−40.
Гладкий, А.В. Синтаксические структуры естественного языка в автоматизированных системах общения Текст. / А. В. Гладкий -Москва, 1985. -67 с.
Добров, Б.В. Построение структурной тематической аннотации текста Текст. / Б. В. Добров, Н. В. Лукашевич // Труды между народного семинара Диалог'98. Том 2 — Казань, 1998. — С.795−802.
Добронравов, И.С. Об эффективности рефератов-экстрактов как объектов информационного поиска Текст. / И. С. Добронравов, Д. Г. Лахути, В. П. Леонов // Научно-техническая информация. Сер.2. № 11. Москва, 1988. -С.35−38.
Дорот, В.Л. Толковый словарь современной компьютерной лексики Текст. / В. Л. Дорот, Ф. А. Новиков. СПб.: БХВ-Петербург, 2004. — 608 с.
Евдокимова, И.С. Методы и алгоритмы трансляции естественно-языковых запросов к базе данных в SQL-запросы Текст.: автореф. дис.. канд. техн. наук: защищена 25.11.2004: утв. 21.01.2005 / И. С. Евдокимова. Улан-Удэ, 2004.-20 с.
Ермаков, А.Е. Тематический анализ текста с выявлением сверхфразовой структуры Электронный ресурс. / А. Е. Ермаков // Информационные технологии. 2000. — № 11. — Режим доступа: http://www.i-co.ru/article.asp?obno=33.
Ершов, А.П. Терминологический словарь по основам информатики и вычислительной технике Текст. / А. П. Ершов [и др.]. М.: Просвещение, 1991.- 159 с.
Зализняк, А.А. Грамматический словарь русского языка: словоизменение Текст. / А. А. Зализняк. 3-е изд. Москва: Рус.яз., 1987.
Зеленков, Ю.Г. Теоретические и прикладные аспекты применения методааналогии в системах автоматической обработки текстовой информации Текст.: дис. докт. техн. наук: 05.13.17 / Ю. Г. Зеленков. Москва, 1999. -160. РГБ ОД 71:1−5/190.
Искусственный интеллект: справочник Текст. В 3 кн. Кн. 2. Модели и методы / под ред. Д. А. Поспелова. -М.: Радио и связь, 1990. 304 с.
Искусственный интеллект: В 3-х кн. Кн. 3. Программные и аппаратные средства: Справочник / Под ред. В. Н. Захарова, В. Ф. Хорошевского. М.: Радио и связь, 1990. — 363 с.
Карпова, Г. Д. Компьютерный синтаксический анализ: описание моделей и направлений разработок Текст. / Г. Д. Карпова, Ю. К. Пирогова [и др.] // Итоги науки и техники (серия «Вычислительные науки»). Т.6. М.: ВИНИТИ, 1991.
Каталог лингвистических программ и ресурсов в сети Электронный ресурс.- Режим доступа: http://davidsonyuliya.boom.ru/catalog.htm.
Кобрин, Р.Ю. О соотношении информационно-поискового тезауруса и классификатора технико-экономической информации Текст. / Р. Ю. Кобрин, Н. И. Пескова // Научно-техническая информация. Сер.2. № 7. Москва, 1982.- С.1−5.
Козачук, М.В. Концептуальный анализ текстов в системах автоматической обработки научно-технической информации Текст.: дис. канд. тех. наук: 05.25.05/ М. В. Козачук Москва, 2002. — 199 с. РГБ ОД, 61 03−5/3627−3
Корхова, О.В. Метод математической формализации русского языка в задаче автоматического реферирования текстов Текст.: дис. канд. физ.-мат. наук: 01.01.09 / О. В. Корхова Санкт-Петербург, 2001. — 118 с. РГБ ОД, 61 021/510−5
Кудряшова, И.М. О семантическом словаре в системе ФРАП Текст. / И. М. Кудряшова // Сборник научных трудов. Вып. 271. М.: МГПИИЯ им. М. Тореза, 1986.
Кузнецов, И.П. Семантические представления Текст. / И. П. Кузнецов. М.: Наука, 1986.
Кузнецов, И.П. Система выявления из документов значимой информации на основе лингвистических знаний в форме семантической сети Текст. / И.П.
Кузнецов, В.П. Кузнецов, А.Г. Мацкевич // Диалог-2000 по компьютерной лингвистике и ее приложениям: труды межд. семинара. Том 2. Протвино, 2000, — С.232−234.
Кузнецов, И. П. Интеллектуальный редактор знаний на основе расширенных семантических сетей Текст. / И. П. Кузнецов, М. М. Шарнин // Системы и средства информатики, Вып. 5. -Москва: Наука, 1993. С. 14−21.
Левин, Д.Я. Экспериментальный минипроцессор: семантически-ориентированный анализ Текст. / Д. Я. Левин, А. С. Нариньяни // сб. «Взаимодействие с ЭВМ на естественном языке», ВЦ СО АН СССР. -Новосибирск, 1978. С.223−233.
Литвинов, П.П. Классификация прилагательных Электронный ресурс. / П. П. Литвинов. Электрон. текстовые дан. — Режим доступа: http://ru.wiktionary.org/wiki/Пpилoжeниe:Kлaccификaцияпpилaгaтeльныx.
Ломакина, Л.С. Анализ некоторых моделей лингвистических явлений Текст. / Л. С. Ломакина, А. З. Панкратова // Математика. Компьютер. Образование. Вып.6. Часть I: сборник науч. трудов [под ред. Г. Ю. Руниченко]. М: Прогресс — Традиция, 1999. — С.102−105.
Лукашевич, Н.В. Автоматическое построение аннотаций на основе тематического представления текста Текст. / Н. В. Лукашевич, Б. В. Добров // Труды международного семинара Диалог'97. Москва, 1997. — С.188−191.
Лукашевич, Н.В. Представление знаний в системе автоматической обработки текстов Текст. / Н. В. Лукашевич, А. Д. Салий // Научно-техническая информация. Сер.2. № 3. Москва, 1997. -С.27−33.
Лурия, А.Р. Язык и сознание Текст. / А. Р. Лурия М.: Изд-во Моск. ун-та, 1979.-320с.
Максименко, О.И. Формальные методы оценки эффективности системавтоматической обработки текста Текст.: дис. докт. тех. наук: 10.02.21 / О.И.
Максименко Москва, 2003. — 447с. РГБ ОД, 71:04−10/82
Машанова, С.В. Соединение графов семантической окрестности Текст. /
С.В. Машанова // Искусственный интеллект. Интеллектуальные системы:
Мат. X Междунар. науч-тех. конф. Таганрог: Изд-во ТТИ ЮФУ, 2009. — С.282.285.
Найханова, J1.B. Технология создания методов автоматического построения онтологий с применением генетического и автоматного программирования: монография Текст. / JI.B. Найханова. Улан-Удэ: Изд-во БНЦ СО РАН, 2008.-244 с.
Нариньяни, А.С. Кентавр по имени ТЕОН: тезаурус+онтология Текст. / А. С. Нариньяни // Диалог'2001: Междунар. семинар по компьютерной лингвистике и ее приложениям. Аксаково, 2001. — Т. 1. — С. 184−188.
Нариньяни, А. С. ТЕОН-2: от тезауруса к онтологии и обратно Текст. / А. С. Нариньяни // Диалог'2002: Междунар. семинар по компьютерной лингвистике и интеллектуальным технологиям. -М.: Наука, 2002. Т. 1. — С. 307−313.
Нестеров, П.В. Интерактивная система автоматизированного реферирования документов на основе словаря стандартных фраз Текст. / П. В. Нестеров, Г. Г. Белоногов [и др.]. // Научно-техническая информация Сер.2. № 7. Москва, 1991. — С.13−15.
Никитина, С.Е. Семантический анализ языка науки Текст. / С. Е. Никитина. М.: Наука, 1987. — 143 с.
Николаева, И.В. Автоматизация анализа массивов текстовых документов в информационно-коммуникационных средах Текст.: дис. филол. наук: 10.02.21 / И. В. Николаева Москва, 2008. — 253 с.
Новицкий, Д.В. Системы интерактивной работы с текстом с применением искусственного интеллекта (на семантическом уровне) Текст. / Д. В. Новицкий // История и компьютер. 1998. № 23. — С.45−49.
Ножов, И.М. Морфологическая и синтаксическая обработка текста (модели и программы) Электронный ресурс. / И. М. Ножов. Электрон, текстовые дан. -Режим доступа: http://www.aot.ru/docs/Nozhov/chapter4.pdf.
Панкратова, А.З. Разработка модели и метода структурирования текста сцелью его идентификации Текст.: дис. канд. тех. наук / А. З. Панкратова -Нижний Новгород, 2002. 134 с.
Панкратова А.З. Сетевое моделирование как метод исследования некоторых лингвистических явлений Текст. / А. З. Панкратова // Исследования молодых ученых: сборник статей аспирантов. Часть III Мн.: Изд-во МГПУ, 1999. -с.59−61.
Петров, А.И. Компьютерный анализ текста. Историография метода Текст. / А. И. Петров // Круг идей: модели и технологии исторической информатики. -М., 1999. -С.255−277.
Пиотровский, Р.Г. Методы автоматического анализа и синтеза текста Текст. / Р. Г. Пиотровский, В. Н. Билан, М. Н. Боркун [и др.]. Минск: Вышейшая школа, 1985.
Попов, Э.В. Общение с ЭВМ на естественном языке Текст. / Э. В. Попов -М.: Наука, 1982, — С. 17.
Попов, Э.В. Естественно-языковые системы: прошлое, настоящее и будущее Текст. / Э. В. Попов // ИИ-2000: материалы VI нац. конф., Переславль-Залесский, 24−27 октября 2000. М.: ИФМЛ, 2000.- С. 17.
Сбойчаков, К.О. Автоматизированная система смысловой обработки текстов при создании электронных фондов библиотеки Текст.: дис. канд. техн. наук: 05.25.05 / К. О. Сбойчаков Москва, 2003. — 169 с. РГБ ОД, 61:04−5/2564
Селезнев, К. Обработка текстов на естественном языке Текст. / К. Селезнев // Открытые системы. Вып. 12. Москва, 2003.
Система автореферирования TextAnalyst Электронный ресурс. Режим доступа: http://www.analyst.ru.
Скороходько, Э.Ф. Лингвистические проблемы обработки текстов в автоматизированных ИПС Текст. / Э. Ф. Скороходько // Вопросы информационной теории и практики. № 25. М.:1974.
Скороходько, Э.Ф. Семантические сети и автоматическая обработка текста Текст. / Э. Ф. Скороходько Киев: Наукова думка, 1983. — 218 с.
Сокирко, А.В. Семантические словари в автоматической обработке текста Текст.: дис. канд. тех. наук: 0513.17 / А. В. Сокирко Москва, 2001. — 120 с.
Технологии анализа и поиска текстовой информации Электронный ресурс. -Режим доступа: http://www.rco.ru.
Технология Text Mining Электронный ресурс. Режим доступа: http ://www. smartedu.com/index.php?option=comcontcnt&view=article&id=105&Itemid=770
Технологии автоматического семантического анализа текстов Электронный ресурс. Режим доступа: http ://uisrussia.msu.ru/linguist/B 1 2avtosem antanaliz .j sp.
Тузов, B.A. Семантический анализ текста на русском языке: функциональная модель предложения Текст. / В. А. Тузов // Экономико-математические исследования: математические модели и информационные технологии. -СПб.: Наука, 2003. Вып. 3. С. 304−328.
Тузов В.А. Компьютерная семантика русского языка Текст. / В. А. Тузов -СПб.: Изд-во С.-Петерб. ун-та, 2004. 400 с.
Ю4. Тузов, В. А. Компьютерная семантика русского языка Текст. / В. А. Тузов // Диалог'2001: тр. Междунар. семинара по компьютерной лингвистике и ее приложениям.- М.: РосНИИ искусственного интеллекта, 2001.- Т. 2.- С. 356 363.
Филлмор. Ч. Основные проблемы лексической семантики Текст. / Ч. Филлмор // Новое в зарубежной лингвистике. М.: 1983. Вып. 12. — С. 74 122.
Филлмор, Ч. Фреймы и семантика понимания Текст. / Ч. Филлмор // Новое в зарубежной лингвистике. М.: 1988. Вып. 23. — С. 52−90.
Хан, У. Системы автоматического реферирования Текст. / У. Хан, И. Мани // Открытые системы. Вып. 12. Москва, 2000.
Харламов, А.А. Технология обработки текстовой информации с опорой на семантические представления на основе иерархических структур из динамических нейронных сетей, управляемых механизмом внимания Текст.
А.Л. Харламов, А. Е. Ермаков, Д. М. Кузнецов // Информационные технологии. № 2, 1998. с. 26−32.
Чижаковский, В.А. Тезаурус в системах автоматической переработки текста Текст. / В. А. Чижаковский, JI.H. Беляева Кишинев, 1983.
ПО. Шингарева, E.JI. О двух направлениях представления семантики текста (тезаурус и фрейм) Текст. / E.JT. Шингарева // Научно-техническая информация. Сер.2. № 3. Москва, 1986. — С.1−7.
Яцко, В.А. Логико-лингвистические проблемы анализа и реферирования научного текста Текст. /В .А. Яцко Абакан: Изд-во Хакасского гос. ун-та, 1996. — 128с.
Яцко, В.А. Симметричное реферирование: теоретические основы методика Текст. / В. А. Яцко // Научно-техническая информация. Сер.2. № 5. Москва, 2002.-С. 18−28.
ИЗ. Яцко, В. А. Проблемы информационно-лингвистического моделирования научного текста Текст.: дис. докт. филол. наук: 05.13.17 / В. А. Яцко. -Москва, 1998, С. 341.
A RU G 06 F 17/20. Способ автоматического реферирования при помощи ЭВМ несегментированного текста на языке с идеографической системой письменности / Замбалов Т. Е. № 2 004 114 542/09- Заявл. 27.10.2005. — № 30. — С.462.
П5. Copeck Т. Text Summarization as Controlled search / Т. Copeck, N. Japcowicz, S. Japcowicz // Advances in Artificial Intelligence. Volume 2338/2002. Springer Berlin / Heidelberg, 2002, — pp.268−280.
Fillmore Ch.J. The case for case / Ch.J. Fillmore // Universals in lingvistic theory: Ed. By E. Bach and B. Halns, N.Y., 1968.
Kupiec J. A Trainable Document Summarizer / J. Kupiec, J. Pedersen, F. Chen // Xerox Palo Alto Research Center. Palo Alto, CA, 1995.
Justeson, J. S. Technical terminology: some linguistic properties and an algorithm for identification in text /J. S. Justeson, S. M. Katz // Natural Language Engineering, 1(1), 1995.-pp. 9−27.
Lee C.B. Automatic summarization based on principal component analysis / C.B. Lee, M.S. Kim, H.R. Park // EPIA 2003: Portuguese conference on artificial intelligence № 11, Beja, 2003, vol. 2902. pp. 409−413.
Leite D.S. Combine multiple features for Automatic Text Summarization through Machine Learning / Computational Processing of the Portuguese Language. -2008. vol. 5190, Springer, Heidelberg. — pp. 122−132.
Leontyeva N. Semantic dictionary for Text Understanding and Summarization // International Journal of Translation. Vol. 15. No. 1. Ed. M. Blekhman. New Delhi, 2003.
Loukashevitch N.V. Construction of structural thematic summary of text / N.V. Loukashevitch, B.V. Dobrov // Proceedings of the 1st workshop on text, speech, dialogue.-Brno, 1998.-P.85−90.
Loukashevitch N.V. Thesaurus-Based Structural Thematic Summary in Multilingual Information Systems / N.V. Loukachevitch, B.V. Dobrov // Machine Translation Review. 2000, № 11. — P. 10−20.
Narin’yani A.S. Towards an Integral Model of Language Competence / A.S. Narin’yani // Computational Models of Natural Language Processing. Amsterdam: North-Holland. 1984. pp. 275−295.
Rigouste L. An Automatic Evaluation Framework for Improving a Configurable Text Summarizer / L. Rigouste, S. Szpakowicz, N. Japkowicz, T. Copeck // Advances in Artificial Intelligence. 2004. — Vol. 3060. — Springer Berlin, Heidelberg. — pp. 529−533.
Yanmin Ch. Automatic Text Summarization based on textual cohesion / Ch. Yanmin, L. Bingquan, W. Xiaolong // Journal of Electronics (China). 2007. -vol.24, № 3. — pp. 339−346.
Yatsko V.A. Some problems of the development of Systems of Automatic Text Summarization / V.A. Yatsko, T.N. Vishnyakov // Automatic Documentation and Mathematical Linguistics. 2007. — vol.41, № 5. — pp. 185−193.
Yatsko, V. A Semi-automatic Text Summarization System / V. Yatsko, S. Shilov, T. Vishniakov // Proceedings of the 10 International Conference on Speech and Computer. Patras, 2005. — pp. 283−288.

Заполнить форму текущей работой