Дипломы, курсовые, рефераты, контрольные...
Срочная помощь в учёбе

Обзор основного средства при работе с существующим корпусом

РефератПомощь в написанииУзнать стоимостьмоей работы

Платформа управления, основанная на веб-технологиях, созданная для аннотирования, доступная для совместной рабоы. Это экономичная среда для аннотирования проектов, позволяющая использовать ресурсы и наблюдать за результатами удаленно в режиме настоящего времени. GATE Teamware предоставляет многофункциональный пользовательский интерфейс, где посредствам Интернета можно просматривать, добавлять… Читать ещё >

Обзор основного средства при работе с существующим корпусом (реферат, курсовая, диплом, контрольная)

Специалисты в области компьютерной и корпусной лингвистики создают специальные пакеты автоматического анализа текста, включая всю технологическую цепочку лингвистической обработки, примером такой системы обработки естественного языка может служить GATE и NLTK. Специалисты, работающие в рамках данной темы с собранным корпусом, используют систему GATE.

General Architecture for Text Engineering (GATE) — система обработки естественного языка с открытым исходным кодом, способное решить почти все лингвистические проблемы, возникающие при работе с текстами [2]. Табл.1.1 содержит описание семейства GATE.

Таблица 1.1. Описание семейства GATE

Продукт.

Описание.

GATE Developer.

Среда разработки, которая предоставляет большой набор графических инструментов для создания и изменения программных компонентов для обработки естественных языков. Данная система использует сложные структуры данных и алгоритмы, такие как аннотированные графы и автоматы с конечным числом состояний. GATE Developer помогает при создании этих сложных структур, визуализирует обработанные результаты и измеряет точность обработки относительно ручной или полу автоматизированной обработки.

GATE Embedded.

Объектно-ориентированная платформа (библиотека классов), реализованная в Java. Она используется во всех системах, основанных на принципах GATE, а также формирует основные элементы GATE Developer. GATE Embedded позволяет использовать функционал по обработке естественного языка в различных приложениях. Данная версия — инструмент для программиста и представляет собой набор файлов, написанных на Java.

GATE Teamware.

Платформа управления, основанная на веб-технологиях, созданная для аннотирования, доступная для совместной рабоы. Это экономичная среда для аннотирования проектов, позволяющая использовать ресурсы и наблюдать за результатами удаленно в режиме настоящего времени. GATE Teamware предоставляет многофункциональный пользовательский интерфейс, где посредствам Интернета можно просматривать, добавлять и править аннотации текстов.

GATE Mimir.

Многопарадигменный архив, который может быть использован для индексирования и поиска по тексту, аннотациям, семантическим схемам (онтологиям), семантическим метаданным (данным экземпляра). GATE Mimir работает с запросами, произвольно смешивающими полные, структурные, лингвистические и семантические запросы, масштабируемые до гигабайтов текста. GATE Mimir имеет дело с огромным количеством информации разного типа и представляет собой платформу для применения индексирования и функционального поиска по всем этим типам данных.

GATE Cloud.

Относительно новое направление разработки GATE, предоставляющее решения по обработке естественного языка при использовании облачных технологий.

Наиболее важными для данного исследования являются GATE Developer (рис. 1.1) и GATE Embedded. GATE Developer является средой для лингвистов, так как они могут решить поставленные лингвистические задачи при помощью существующих плагинов. Для программиста основной средой является GATE Embedded, которая предоставляя встроенную библиотеку классов, позволяет программисту написать собственный плагин или приложение с использованием встроенных функций.

Показать весь текст
Заполнить форму текущей работой