Дипломы, курсовые, рефераты, контрольные...
Срочная помощь в учёбе

Архитектура программного модуля

РефератПомощь в написанииУзнать стоимостьмоей работы

Для использования этого модуля необходимо дополнительно установить Python-пакет nodebox-opengl. Установка этого пакета может быть произведена с помощью пакетного менеджера Python — pip — командой pip install nodebox-opengl. Abstracts — предоставляет методы для загрузки аннотаций к научным статьям из электронных библиотек IEEE Xplore и Springer; Graphs — предоставляет возможность визуализировать… Читать ещё >

Архитектура программного модуля (реферат, курсовая, диплом, контрольная)

Python-модуль Bianalyzer разбит на следующие основные пакеты:

  • · abstracts — предоставляет методы для загрузки аннотаций к научным статьям из электронных библиотек IEEE Xplore и Springer;
  • · keywords — предоставляет функции по выделению ключевых слов и словосочетаний из набора текстов. Сюда входит метод выделения ключевых фраз по модифицированному или гибридному алгоритму TextRank и метод выделения ключевых слов на основе их частоты встречаемости в текстах;
  • · relevance — предоставляет методы для подсчёта матриц релевантности фраза/текст на основе коллекции текстов, набора ключевых фраз и метрики релевантности. Также пакет предоставляет метод вычисления матрицы схожести между ключевыми фразами по заданной матрице релевантности фраза/текст и пороговому значению релевантности;
  • · biclustering — предоставляет методы для бикластерного анализа матриц. В данном пакете реализовано три алгоритма бикластеризации — BBox, GreedyBBox и SpectralGraphCoclustering (алгоритм Диллона). В дополнение, пакет предоставляет метод подсчёта матрицы остатков по заданной входной матрице и полученным бикластерам (что может использоваться для формальной оценки полученных результатов) и метод фильтрации биакластеров на основе их схожести между собой по коэффициенту Жаккарда;
  • · graphs — предоставляет возможность визуализировать бикластеры ключевых фраз, как граф связей между понятиями.
  • · Для использования этого модуля необходимо дополнительно установить Python-пакет nodebox-opengl. Установка этого пакета может быть произведена с помощью пакетного менеджера Python — pip — командой pip install nodebox-opengl.

Структура классов алгоритмов для бикластерного анализа матриц имеет вид, соответствующий рисунку 3.

Рисунок 3. Структура классов для алгоритмов бикластеризации Стоит отметить, что точки входа для алгоритмов BBox и GreedyBBox отличаются от алгоритма SpectralGraphCoclustering. Если в первых двух поиск бикластеров происходит итеративно по всем строкам матрицы (метод find_biclusters), то спектральный алгоритм устроен иначе и требует задания пользователем количества бикластеров, которое необходимо найти (метод find_disjoint_biclusters).

Показать весь текст
Заполнить форму текущей работой