Дипломы, курсовые, рефераты, контрольные...
Срочная помощь в учёбе

Методы и программные средства для анализа документов на основе модели предметной области

ДиссертацияПомощь в написанииУзнать стоимостьмоей работы

Онтологический подход стал активно развиваться с начала 90-х годов. Понятие онтологии можно считать логическим развитием понятия сетевых моделей представления знаний, таких как семантические сети или системы фреймов. Существует множество различных определений онтологии. Общим для всех существующих определений является понимание онтологии как модели представления знаний какой-либо предметной… Читать ещё >

Содержание

  • 1. ОБЗОР ПОДХОДОВ К АНАЛИЗУ ТЕКСТОВ
    • 1. 1. Развитие информационного сервиса
    • 1. 2. Классы задач
    • 1. 3. Подходы к анализу текстов
    • 1. 4. Системы анализа текстов
  • 2. ПРЕДСТАВЛЕНИЕ ЗНАНИЙ
    • 2. 1. Онтология
      • 2. 1. 1. Понятие онтологии
      • 2. 1. 2. Определение онтологии
      • 2. 1. 3. Назначение онтологии
    • 2. 2. Модель информационного пространства системы
      • 2. 2. 1. Информационный объект: структура, контекст, контент
      • 2. 2. 2. Определение информационною пространства системы
      • 2. 2. 3. Текстовый ресурс
    • 2. 3. Лингвистическая база знаний
      • 2. 3. 1. Формальное представление структуры текста
        • 2. 3. 1. 1. Сегмент
        • 2. 3. 1. 2. Модель документа
      • 2. 3. 2. Словарь
        • 2. 3. 2. 1. Представчение словарной статьи
        • 2. 3. 2. 2. Морфоюгические типы словаря лексем
        • 2. 3. 2. 3. Иерархия классов словаря
        • 2. 3. 2. 4. Тезаурус
      • 2. 3. 3. Описание фактов
        • 2. 3. 3. 1. Семантические ограничения
        • 2. 3. 3. 2. Структурные ограничения
        • 2. 3. 3. 3. Схема факта
        • 2. 3. 3. 4. Типизация схем фактов
    • 2. 4. Особенности представления знаний
  • 3. ТЕХНОЛОГИЯ ИЗВЛЕЧЕНИЯ ИНФОРМАЦИИ
    • 3. 1. Словарный компонент
      • 3. 1. 1. Архитектура модуля словаря
      • 3. 1. 2. Сборка словокомплексов
      • 3. 1. 3. Модули автоматизированной настройки словаря
        • 3. 1. 3. 1. Общая схема обучения
        • 3. 1. 3. 2. Модуль классификации
        • 3. 1. 3. 3. Тематизация
        • 3. 1. 3. 4. Выявчение стоп-терминов
    • 3. 2. Конструктор онтологии
    • 3. 3. Конструкюр схем фактов
      • 3. 3. 1. Методология создания схем фактов
      • 3. 3. 2. Формирование внутреннего представления схем фактов
        • 3. 3. 2. 1. Обеспечение корректности и сходимости
        • 3. 3. 2. 2. Планирование
    • 3. 4. Фактографический анализ текста
      • 3. 4. 1. Сегментация текста
      • 3. 4. 2. Сборка фактов
        • 3. 4. 2. 1. Удовчетворение структурным ограничениям
        • 3. 4. 2. 2. Удовлетворение семантическим ограничениям
      • 3. 4. 3. Формирование контента текстового ресурса
        • 3. 4. 3. 1. Идентификация объектов
        • 3. 4. 3. 2. Контроль корректности данных
    • 3. 5. Поддержка актуальности данных
  • 4. РЕАЛИЗАЦИЯ И ПРАКТИЧЕСКИЕ
  • ПРИЛОЖЕНИЯ
    • 4. 1. Особенности программной реализации
      • 4. 1. 1. Архитектура системы анализа документов
      • 4. 1. 2. Словарный компонент
        • 4. 1. 2. 1. Система классов
        • 4. 1. 2. 2. Пользовательский интерфейс
      • 4. 1. 3. Модуль анализа документов
      • 4. 1. 4. Качество работы системы анализа
    • 4. 2. Практические
  • приложения технологии
    • 4. 2. 1. InDoc
      • 4. 2. 1. 1. Модель делового письма
      • 4. 2. 1. 2. Система знаний InDoc
      • 4. 2. 1. 3. Общая схема анализа InDoc
      • 4. 2. 2. Портал знаний по археологии и этнографии
      • 4. 2. 2. 1. Система знаний портала
      • 4. 2. 2. 2. Text to чогия сбора онтологической информации о ресурсах
      • 4. 2. 2. 3. Индексирование новостных сообщений
      • 4. 2. 2. 4. Индексирование научных статей

Методы и программные средства для анализа документов на основе модели предметной области (реферат, курсовая, диплом, контрольная)

Во многих областях человеческой деятельности на гекуший момент накоплены большие объемы знаний и данных. Рост информационных потоков, связанных с деловой активностью человека, требует внедрения автоматизированных методов и систем хранения и обработки данных. В связи с этим, новые и накопленные ранее документы переводятся в электронный формат и хранятся в различных архивах и банках данных.

Однако доступ к этой информации значительно затруднен, так как большинство ее источников являются текстовыми документами, а большинство информационных систем (ИнС) не обеспечивают полноценной работы с такими документами. Хотя современные ИнС и обеспечивают поиск документов по ключевым словам и даже выполняют тематическую рубрикацию документов, но в любом случае, пользователь имеет доступ только к тексту документов, а не к основным смысловым фрагментам, содержащимся в них. Этого оказывается недостаточно для современных корпоративных информационных систем: во-первых, в постоянно разрастающемся архиве становится трудно (практически невозможно) найти нужную информациюво-вторых, данные часто дублируются и противоречат друг другу.

Большой объем накопленной информации и высокая скорость поступления новой предъявляют все более жесткие требования к современным информационным системам. Современная ИнС должна быть способна решать весь комплекс задач, связанных с хранением и управлением потоком входящих «сырых данных», таких как автоматическая классификация и автоматическое содержательное индексирование текстов, оперативное и адекватное распределение новой информации среди пользователей, передача и хранение данных в электронном архиве и последующий поиск в нем по содержанию, обеспечение минимальной избыточности информации.

Важным аспектом, который нужно учитывать при разработке информационных систем, является требование настраиваемости в процессе эксплуатации. Невыполнение этого требования может привести к тому, что система с течением времени перестанет выполнять свои функции из-за изменений в структуре предметной области или спектре требований к системе, которые неизбежно ведут к изменению системы понятий, тематики документов и соответствующих условий их классификации, индексации и адресации.

Для решения этих проблем необходим переход на новый качественный уровень при обработке информации — необходимо вести обработку на семантическом уровне, т. е. учитывать смысл или содержание документов. За последние несколько лет это направление в информационных технологиях получило широкое развитие. Созданные на основе семантических гехнолошй ИнС отличаются от традиционных тем, что используют явно выраженные (в виде онтологии) знания о предметной области. Часто онтология является не только основой для представления информации пользователям, ее хранения и поиска, но и для автоматической обработки поступающей текстовой информации.

Онтологический подход стал активно развиваться с начала 90-х годов [58]. Понятие онтологии можно считать логическим развитием понятия сетевых моделей представления знаний, таких как семантические сети или системы фреймов. Существует множество различных определений онтологии [92,97]. Общим для всех существующих определений является понимание онтологии как модели представления знаний какой-либо предметной области в виде набора понятий этой предметной области и существующих между ними отношений. Причем особое внимания уделяется отношениям «часть-целое», «класс-подкласс» и т. п., упорядочивающих понятия предметной области в иерархию. Именно концентрация на создании таксономий по заранее известным отношениям отличает онтологию от других сетевых моделей [34]. Это позволяет создавать программы, которые бы учитывали семантику этих отношений.

Применение онтологии является одним из наиболее перспективных направлений исследований, поскольку позволяет формализовать и унифицировать операции обработки информации для повышения качества различных информационных услуг и сервисов. В работе проводится исследование одной из наиболее востребованных услуг — информационного наполнения системы.

До сих пор задача анализа текста на естественном языке рассматривалась многими исследователями независимо от той обстановки, где ее результаты планировалось использовать. Применяемые подходы либо никак не учитывают способ и форму хранения полученных результатов анализа в ИнС (например, классические лингвистические исследования Леонтьевой Н. Н. [56,57] по анализу текстов и построению семантических словарей или Мельчука И. А. [60] по теории «Смысл-Текст»), либо, наоборот, строго привязаны к узким целям поставленной задачи и форме результата (например, при извлечении информации о персонах и организациях [38,42], что часто встречается в задачах компьютерной разведки). Классические подходы к семантическому анализу текста используют формальную модель языка и с «большим трудом» переходят к модели предметной области, что не позволяет им естественным образом внедряться в ИнС с заданной предметной областью и удовлетворять поставленным перед такими системами требованиям. В отличие от работ, связанных с задачей полного извлечения смысла или извлечения всей информации из текстов документа, для большинства ИнС нет необходимости делать полный семантический анализ всего связанного текста. ИнС, построенные на основе онтологии, естественным образом задают как формат содержания тою, что требуется извлечь из текста документа (или любого текстового ресурса), так и формат хранения результата в базе данных системы в виде семантической сети объектов, являющихся экземплярами понятий и отношений, заданных моделью предметной области.

В связи с этим особую актуальность приобретает разработка технологии анализа текста в контексте ее применения в различных информационных системах [70] (в частности, для корпоративных систем документооборота или специализированных порталов знаний). Ориентация технологии на деловую и научную лексику является вполне обоснованным решением, позволяющим эффективно применить семантически-ориентированные методы к решению задачи анализа текста на естественном языке.

Создание инструментальных средств — средств настройки онтологии, тезауруса и схем фактов, описывающих способы естественно-языкового выражения понятий и отношений в тексте, — дает возможность обеспечивать содержательную обработку текста документов без специальных навыков программирования непосредственным носителям знаний — экспертам и лингвистам.

Прсдмеюм исследования данной работы являются способы описания лингвистических знаний в информационных системах, а также методы автоматического извлечения данных из текстовых документов.

Цель исследования. Целью диссертационной работы является разработка способов описания лингвистических знаний и представления содержания документов в информационных системах, а также методов и инструментальных средств содержательного анализа текста на естественном языке.

Работа выполняется в рамках проекта по созданию технологии конструирования ИнС и направлена на автоматизацию наполнения различных ИнС данными, полученными в результате анализа содержания документов, поступающими в систему, либо в виде коллекции архивных документов, либо при регулярном оперативном поиске в сеги Интернет. Технология должна включать средства описания предметной области и настройки лингвистической базы знаний.

Для достижения поставленной цели в диссертации последовательно решены следующие задачи исследования:

1. определены требования, предъявляемые к технологиям автоматической обработки текста на естественном языке в современных информационных системах;

2. создана лингвистическая модель описания фактов как способа естественно-языкового выражения в тексте понятий и отношений, которые представляют контент документа в информационной системе;

3. разработана технология конструирования лишвистической базы знаний, реализующая предложенную модель;

4. разработаны методы содержательного анализа документов, использующие предложенную модель;

5. реализованы инструментальные средства, предназначенные для автоматического извлечения фактов из текста и формирования контента документа в информационной системе;

6. апробированы компоненты предложенной технологии в реально функционирующих информационных системах.

Методы исследования. В диссертационном исследовании были использованы модели и методы искусственного интеллекта, компьютерной лингвистики, теории множеств, онтологический анализ, метод экспертных оценок, методы объектно-ориентированного проектирования и программирования.

Основными теоретическими результатами работы, выносимыми на защиту и определяющими научную новизну работы, являются:

— модель представления лингвистических знаний, включая описание фактов, для задачи автоматического анализа документов в ограниченной предметной области;

— методы семантическою анализа документа по деловой или научной тематике;

— способ представления контента документа в информационном пространстве системы.

Разработанная технология может быть применена как при создании новых информационных систем, так и при модернизации уже существующих. Программные компоненты, созданные на базе предложенной модели и методов, были апробированы при разработке ряда информационных систем. Анализ опыта внедрения демонстрирует ею достаточную эффективность, что характеризует практическую значимость работы.

НА ЗАЩИТУ ВЫНОСЯТСЯ следующие положения:

1. Модель лингвистической базы знаний, включающая предметный словарь, модель документа и модель описания фактов.

2. Технология конструирования лингвистической базы знаний, реализующая предложенную модель.

3. Методы, реализующие поэтапный анализ текста документов на основе предложенной модели лингвистической базы знаний;

4. Проблемно-ориентированная программная оболочка, предназначенная для конструирования лингвистической базы знаний, и инструментальные средства, использующие построенную базу знаний для автоматическою извлечения фактов из 1екста и формирования контента документа в информационной системе.

Апробация. Основные выводы и научные результаты диссертационной работы докладывались на международных конференциях, но компьютерной лингвистике и интеллектуальным технологиям «Диалог» в 2002, 2003, 2005 и.

2006 гг., на международной конференции «Проблемы управления и моделирования в сложных системах» в 2003 г., на национальных конференциях по искусственному интеллекту в 2002 и 2004 i г., на международных конференциях по интеллектуальному анализу информации в 2005 и 2006 гг.- печатались в журналах и сборниках: «Искусственный интеллект», № 4, Киев, 2004; «Информационные технологии» № И, 2004; «Молодая информатика: Сборник научных трудов аспирантов и молодых ученых», ИСИ СО РАН, 2005; «Информационные технологии в гуманитарных исследованиях» в 2005 г.

По теме диссертации автором опубликовано 24 работы.

Структура и объем.

Диссертационная работа состоит из 4 глав, введения, заключения, списка литературы содержащего 100 наименований. Общин объем работы составляет 120 страниц текста, включающего 2 приложения.

Благодарности (коллектив).

Результаты, выносимые на защиту в данной диссертационной работе, не были бы получены без слаженной работы всего научного коллектива, в котором работал автор. Созданию технологии содержательною анализа предшествовала работа над проектом InDoc [2−6], а также дальнейшее развитие основных идей в проектах, связанных с созданием технологии конструирования информационных систем [9−10,17−20]. В разное время в указанных проектах принимали активное участие следующие специалисты: Ю. А. Загорулько (руководитель проекта), А. С. Париньяни (научный руководитель проекта), И. С. Кононенко (лингвист), О. А. Андреева, Ю. В. Костов, А. С. Цецохо, О. И. Боровикова, С. В. Булгаков.

Всем участникам проекта автор выражает большую 6: iaiодарность.

Основные результаты.

Проведенные исследования позволили разработать новый подход к содержательному анализу документов, позволяющий настраивать систему анализа на определенную предметную область.

В работе предложена комплексная модель представления знаний, включающая предметный словарь, модель предметной области и модель описания фактов.

Разработаны методы, которые по предложенной модели реализуют поэтапный анализ текста деловых документов ограниченной тематики: извлечение словарных объектов, поиск фактов и формирование контента документа в виде семантической сети объектов, являющихся экземплярами понятий и отношений, заданных моделью предметной области.

Реализованы проблемно-ориентированная оболочка, предназначенная для конструирования лингвистической базы знаний, и инструментальные средства, использующие построенную базу знаний для анализа текста.

Личный вклад автора.

Результаты, которые выносятся на защиту в данной диссертационной работе, не были бы возможны без слаженной работы всею научного коллектива. Созданию технологии содержательного анализа текста предшествовала работа по проекту InDoc, а также дальнейшее развитие основных идей в проектах, связанных с созданием технологии конструирования информационных систем. Наибольший вклад автором диссертации внесен при решении следующих задач:

— Теоретическая разработка подхода к анализу текста документов, изложенного в данной работе.

— Разработка архитектуры словарного компонента.

— Реализация ядра словарног о компонента.

— Разработка и реализация основных алгоритмов сборки фактов.

— Разработка и реализация алгоритмов идентификации объектов, использующих отношение вложенности.

Дальнейшие исследования.

Среди возможных направлений дальнейшего развития технологии следует назвать исследование построения планировщиков: разработку новых подходов и повышение эффективности уже предложенных.

Кроме того, интерес представляет развитие следующих компонент:. словаря — развитие аппарата описания семантики словарных терминов,. модуля сегментации — распознавание типа документа,. конструктор схем фактов — расширение структуры,. модуль формирования контента — разработка стратегий для неоднозначных и конфликтных ситуаций. Интересные перспективы имеет исследование вопросов адаптации технологии к задачам обработки коротких сообщений (метео-телеграмм, смс-сообщений, сообщений службы знакомств), для которых уже существуют относительно эффективные, но менее универсальные решения.

ЗАКЛЮЧЕНИЕ

.

Онисанная в настоящей работе объектно-ориентированная технология содержательного анализа текстов на основе шаблонных моделей схем фактов с использованием онтологии и предметного словаря позволяет, в большинстве случаев, получать приемлемое по эффективности и экономичное по трудозатратам решение. Для построения прикладной программы, решающей ту или иную задачу анализа текста, не требуется переписывание большого количества программного кода на языке программирования общего назначения — достаточно воспользоваться готовыми модулями предлагаемой технологии, подготовить для них описание онтологии, схем фактов и терминологии, соответствующее предметной области.

Эго позволяет ожидать, что предложенная технология может найти широкое практическое применение.

Показать весь текст

Список литературы

  1. И.С., Сидорова Е. А. Обработка делового письма в системе документооборота // Труды международного семинара Диалог'2002 по компьютерной лингвистике и ее приложениям. -М.: Наука, 2002. -Т.2. -С.299−310.
  2. Ю.А., Кононенко И. С., Костов Ю. В., Сидорова Е. А. Представление знаний в интеллектуальной системе документооборота // Труды 8-й национальной конференции по искусственному интеллекту КИИ'2002. -М.: Физматлит, 2002. -Т.2. -С.867−875.
  3. Ю.А., Кононенко И. С., Сидорова Е. А. Концепция интеллектуализации документооборота // Труды 9-й национальной конференции по искусственному интеллекту КИИ'2004. -М.: Физматлит, 2004.-Т.З.-С.986−993.
  4. Е.А. Интеллектуальная обработка документов // Искусственный интеллект, № 4. -Киев, 2004. -С.738−747.
  5. Ю.А., Кононенко И. С., Костов Ю. В., Сидорова Е. А. Подход к интеллектуализации документооборота // «Информационные технологии» № 11, 2004. -С.2−11.
  6. Е.А. Методы интеллектуальной обработки документов, основанные на экспертных знаниях // Молодая информатика: Сборник научных трудов аспирантов и молодых ученых. -Новосибирск: Институт систем информатики им А. П. Ершова СО РАН, 2005. -С.95−104.
  7. Zagorulko Yu., Borovikova О., Bulgakov S., Sidorova E. Ontology-based approach to development of adjustable knowledge internet portal for support of research activity // Bull, of NCC. Ser.: Computer Science 2005. -Is. 23. -P.45−56.
  8. O.A., Сидорова Е. А. Технология разработки тематических словарей на основе сочетания лингвистических и статистических методов // Технологии Microsoft в теории и практике программирования. -Нововсибирск, 2006. -С.221−223.
  9. Е.А. Подход к описанию фактов для задачи фактографического анализа текста // VI международная конференция «Интеллектуальный анализ информации ИАИ-2006». -Киев, 2006. -С.252−261.
  10. Ю.Д., Богуславский И. М., Иомдин Л. Л. и др. Лингвистический процессор для сложных информационных систем. -М.: Наука, 1992. -256 с.
  11. М.С., Добров Б. В. Тематический анализ коллекции документов online. // Научный сервис в сети ИНТЕРНЕТ: Труды Всероссийской научной конференции. Новороссийск, 2003. — С. 249−252.
  12. М.С., Добров Б. В., Лукашевич II.B. Поддержка системы автоматического р>брицирования для сложных задач классификации текстов // RCDL'2004 Электронные библиотеки: перспективные методы и технологии, электронные коллекции. -Пущино, 2004.
  13. Дж. Краткая история генеративной грамматики. В сб. обзоров: Фундаментальные направления современной американской лингвистики/ Под ред. А. А. Кибрика, И. М. Кобозевой и И. А. Секериной. -М.: Изд-во МГУ, 1997.-С. 13−57.
  14. М.П. Вопросы анализа документооборота организации в условиях использования автоматизированных систем // Делопроизводитель, № 1, 2001. http://\ww.document.ru/readingroom/article.asn?id=7MU8KlFC7P20
  15. О.И., Загорулько Ю. А. Организация порталов знаний на основе онтологий. // Труды международного семинара Диалог'2002 «Компьютерная лингвистика и интеллектуальные технологии». Протвино, 2002. Т.2, -С.76−82.
  16. Д.И. Информация и информационный сервис. // Серия «Наука и технический прогресс». -Л:Наука, 1989. -192 с.
  17. С.В. Подход к построению мультиагентной системы содержательного поиска во множестве разнородных структурированных источников данных. // Труды IX конференции по искусственному интеллекту КИИ-2004. М.: Физматлит, 2004. -Т.2. — С.706−714.
  18. И.А., Тузовский А. Ф. Структура системы управления знаниями // Труды международного симпозиума «Информационные и системные технологии в индустрии, образовании и науке. Караганда: Издательство КарГТУ, 2003. -С.286−288.
  19. Т. Программа, понимающая естественный язык. -М., 1976. -283с.
  20. Т.А., Хорошевский В. Ф. Базы знаний интеллектуальных систем. // Учебник. СПб.:Питер, 2001. -384с.
  21. Дж., Тассо К. Алгоритмы и эвристики в системе понимания ЕЯ. // В Сб.научн. тр. под ред. А. С. Нариньяни. Прикладные и экспериментальные лингвистические Процессоры. -Новосибирск, 1982. -С.37−59
  22. Ф.Г., Трапезников С. П. Фабрика лингвистических процессоров // Конструирование программных средств интеллектуализации.-Новосибирск, 1988. -С.63−76.
  23. А.Е. Поиск фактов в тексте. // Мир ПК, 02/2005. http://wwv.osp.ru/text/302/169 703.html
  24. А.Е., Плешко В. В. Синтаксический разбор в системах статистическою анализа текста. // Информационные технологии. -№ 7, 2002. -С.30−34.
  25. А.П. К методологии построения диалоговых систем: феномен деловой прозы // Избранные труды. -Новосибирск: ВО «Наука», 1994. -С.314−330.
  26. Н.Г., Налетов A.M. Гребенкин И. М., На пути к автоматическому построению онтологии. // Труды международной конференции Диалог'2003 «Компьютерная лингвистика и интеллектуальные технологии». -Протвино, 2003. -С.717−723.
  27. Ю.А., Кононенко И. С., Попов И. Г. Экспериментальная система понимания метеорологических телеграмм. // Трудымеждународного семинара Диалог'99 по компьютерной лингвистике и ее приложениям. Таруса, 1999. — Т.2. -С.57−66.
  28. Л.Л. Грамматический словарь русского языка. Словоизменение. -М.: «Русский язык», 1980. -880с.
  29. И.С. Типологические особенности текста и моделирование процесса понимания. // Труды международного семинара Диалог-95. -Казань, 1995.-С. 159−164
  30. И.С., Першина E.JI. Синтез числовых параметрических конструкций. // В Сб. научных трудов под ред. А. Е. Кибрика и А. С. Париньяни. Моделирование языковой деятельности в интеллектуальных системах. -М.:Наука, 1987. -С.220−256.
  31. И., Попов И. К проблеме понимания несегментированного текста (на материале метеорологических телеграмм). // Труды международного семинара Диалог'2000 по компьютерной лингвистике и ее приложениям. Протвино, 2000. — Т.З. — С. 189−198.
  32. А.А. Анафора // Электронный ресурс.: Энциклопедия «КРУГОСВЕТ»: http://www.krugosvet.ru/articles/76/1 007 610/1007610а 1 .htm
  33. А.А. Об анафоре, дейксисе, и их соотношении. // В сб.: Разработка и применение лингвистических процессоров. Под ред. А. С. Нариньяни. -Новосибирск, 1983.
  34. H.II. Автоматизированный перевод как понимание и реферирование // Прикладные и экспериментальные лингвистические процессоры. -Новосибирск, 1981. -С.21−35.
  35. Н.Н. К теории автоматического понимания естественных текстов. Изд. Московского университета, 2000−2003. Часть 1, 2, 3.
  36. Н.В. От информационного пространства к пространству знаний. Онтологии в Интернет. //Труды конференции КИИ'98. -Пущино, 1998.-С.152−158.
  37. М.Г. Диалог с системой искусственного интеллекта. -М.: Изд-во МГУ, 1985.-214с.
  38. И.А. Опыт теории лингвистических моделей Смысл-Текст. -М.: Наука, 1974.-314 с.
  39. А.С. Кентавр по имени ТЕОН: Тезаурус т Онтология // Труды международного семинара Диалог'2001 по компьютерной лингвистике и ее приложениям. -Аксаково, 2001. -Том 1. -С. 199−154.
  40. А.С. ТЕОН-2: от Тезауруса к Онтологии и обратно // Труды международного семинара Диалог'2002 по компьютерной лингвистике и ее приложениям. -М.: Наука, 2002. -Т. 1. -С. 199−154.
  41. А.С. Автоматическое понимание текста новая перспектива. // Труды Международною семинара Диалог-97 по компьютернойлингвистике и ее приложениям. -Ясная Поляна, 1997. Под ред. Л. С. Нариньяни. -С. 203−208.
  42. Л.С. Модель или алгоритм: новая парадигма информационной технологии // Информационные Технологии, 1997. -С.11−16.
  43. Л.С. Проблема понимания ЕЯ-запросов к базам данных решена // Труды Международного семинара Диалог-95 по компьютерной лингвистике и се приложениям. -Казань, 1995. Под ред. Р. Г. Бухараева, А. С. Нариньяни, В. Д. Соловьева. -С. 206−215.
  44. И.М. Проектирование сегментационного анализатора русского предложения // Труды конференции КИИ-2002. М.: Физматлит, 2002. -Т.1. -С. 212−222.
  45. Э.В., Дракин В. И., Преображенский А. Б. Общение конечных пользователей с системами обработки данных. -М.: Радио и связь, 1988. -288с.
  46. О.И., Загорулько Ю. А. Организация эффективною поиска на основе онтологий. // Труды международного семинара Диалог'2001 по компьютерной лингвистике и ее приложениям. -Т.2. -Аксаково, 2001. -с.333−342.
  47. В.Ш. Семантический компонент в системах понимания текста // Труды Десятой национальной конференции по искусственному интеллекту с международным участием КИИ-2006 (25−28 сентября 2006 г., Обнинск) -Т.2.- М: Физматлит, 2006. -С. 455−463.
  48. А.В. Морфологические модули на сайте www.aot.ru // Труды международного семинара Диалог'2004 «Компьютерная лингвистика и интеллектуальные технологии». М.: Наука, 2004. -С.559−564.
  49. Сулейманов ДТП, Гатиатулин А. Р. Структурно-функциональная компьютерная модель татарских морфем. -Казань: ФЭН, 2003.
  50. И.А. Распознавание интерфейсов Интернег-ресурсов на основе использования неоднородных семантических сетей // Труды 9-й национальной конференции, но искусственному интеллекту КИИ'2004. М.: Физматлит, 2004. Т.1, С. 179−185.
  51. Я. Г. Введение в общий синтаксис. М., РГГУ, 2001.
  52. Ч. Дело о падеже // Новое в зарубежной лингвистике, вып. X. -М.: «Прогресс», 1981.-С. 369−495.
  53. Ю.П., Гражданников Е. Д. Системная классификация археологической науки (элементарное введение в археологическое науковедение). -Новосибирск: Изд-во ИДМИ Минобразования, 2000. -58с.
  54. Н. Три модели описания языка // Кибернетический сборник. -1961. -Вып.2. -С.81−92.
  55. Хорошевский В.Ф. OntosMiner: семейство систем извлечения информации из мультиязычных коллекций документов // Труды 9-й национальной конференции по искусственному интеллекту КИИ-2004. М.: Физматлит, 2004. Т.2.
  56. Р. Обработка концептуальной информации. -М.:Энергия, 1980−361с.
  57. Appel A.W., Jacobson G.J. The world’s fastest scrabblc program. // Communications of the ACM, 1988. -31(5):572−578.
  58. Basili R., Pazienza M.T. An Adaptive and Distributed Framework for Advanced IR // Content-Based Multimedia Information Access. RIAO'2000 Conference Proceedings, v.2, 2000. -P. 902−922.
  59. Bergamaschi S., Castano S., De Capitani di Vimercati S., Montanari S., Vincini M. An intelligent approach to information integration. // In Guarino N. Formal Ontology in Information Systems. IOS Press. — June, 1998.
  60. Blythe J., Gil Y. Incremental formalization of document annotations through ontology-based paraphrasing // Proc. of the 13th international conference on World Wide Web. 2004. — P. 455−461.
  61. Cole Ronald A., Mariani Joseph, Uszkoreit Hans, et al (editors). Survey of the State of the Art Human Language Technology, 1995.
  62. Gruber T. R. Towards principles for the design of ontologies used for knowledge sharing // International Journal of Human-Computer Studies. -1995. Volume 43. — P. 907−928.
  63. Guarino N. Understanding, building and using ontologies // International Journal of Human-Computer Studies, February/March 1997. Volume 46. -Issue2−3.-P. 293−310.
  64. Hausser R. Foundations of Computational Linguistics. // Springer, 1999. -P.33−39.
  65. Hyvonen П., Saarela S., Viljanen K. Application of ontology techniques to view-based semantic search and browsing // Proc. of the 1st European Semantic Web symposium. NY: Springer, 2004. — P. 92−106.
  66. Mizoguchi R. A step towards ontological engineering // Proc. of the 12th National Conference on AI of JSAI. 1998. — P. 24−31.
  67. Spyns P., Oberle D., Volz R. et al. OntoWeb a Semantic Web community portal // Proc. of 4th international conference on practical aspects of knowledge management. — 2002. — P. 189−200.
  68. Takeda H., Takaai M., Nishida T. Collaborative development and Use of Ontologies for Design // Proceedings of the Tenth International IFIP WG 5.2/5.3 Conference PROLAMAT 98. -Italy, 1998. http://wvvvv-kasm.nii.ac.ip/papers/takeda/pdf/prolamat98final.pdf
  69. Wiederhold G. Intelligent integration of information. // Boston: Kluwer Academic Publishers, 1996. 216 p.
  70. Wielinga B. J., Schreiber A. T. Reusable and sharable knowledge bases: a European perspective // Proc. of international conference on building and sharing of very large-scaled knowledge bases. 1993. — P. 103−115.
  71. Wolinski F., Vichot F., Strieker M. Using Learning-based Filters to Detect Rule-based Filtering Obsolescence // Content-Based Multimedia Information Access. RIAO'2000 Conference Proceedings, v.2, 2000, pp. 1208−1220.
  72. Uschold M., Gruninger M. Ontologies: principles, methods and applications // Knowledge Engineering Review. June 1996. — Volume 11(2). — P. 93−113.
  73. Using Dublin Core. http://dublincore.om/documents/usaueuuide/
Заполнить форму текущей работой