Дипломы, курсовые, рефераты, контрольные...
Срочная помощь в учёбе

Разработка математического и программного обеспечения для систем управления мастер-данными

ДиссертацияПомощь в написанииУзнать стоимостьмоей работы

Объединение разрозненных участков информационной среды становится непростой задачей. И первым шагом в ее решении служит сообщение разным компонентам среды возможности понимать данные, с которыми они работают. Как правило, в организации существует определенный набор относительно постоянной информации, которая проникает практически во все аспекты ее деятельности. Списки подразделений, сотрудников… Читать ещё >

Содержание

  • Глава 1. Современное состояние проблемы проектирования систем управления НСИ
    • 1. Анализ современных подходов к моделированию данных
      • 1. 1. Сетевая и иерархическая модели данных
      • 1. 2. Реляционная модель данных
      • 1. 3. Объектные СУБД
      • 1. 4. Моделирование знаний
    • 2. Анализ современного состояния систем управления НСИ
      • 2. 1. НСИ, как особенный класс данных
      • 2. 2. Класификация СУ НСИ
    • 3. Анализ современных методов верификации сетей передачи данных
    • 4. Выводы
  • Глава 2. Построение модели данных для СУ НСИ
    • 1. Основные определения
    • 2. Моделирование истории изменения справочников
    • 3. Утверждения об обновлении справочников через их грани
    • 4. Объединения нескольких справочников в МКМ
    • 5. Выводы
  • Глава 3. Верификация сетей распространения мастер-данных
    • 1. Математическая постановка задачи
    • 2. Аналитическое решение в простейшем случае
    • 3. Отложенная передача данных
    • 4. Выводы
  • Глава 4. Компьютерное моделирование распространения мастер-данных
    • 1. Разработка архитектуры решения по моделированию распространения мастер-данных
    • 2. Особенности моделирования двухпоточной модели СУ НСИ на базе платформы .Net
    • 3. Сравнение численного и аналитического решений
    • 4. Выводы
  • Глава 5. Управление НСИ для Всероссийской переписи населения
    • 1. Структура обрабатываемых справочников
    • 2. Моделирование справочника ТЕРСОН с помощью МКМ
    • 3. ВСТЕ в жизненном цикле НСИ ВПН
    • 4. Выводы

Разработка математического и программного обеспечения для систем управления мастер-данными (реферат, курсовая, диплом, контрольная)

В современном мире информационные технологии стали неотъемлемой частью абсолютно любой организации. Точно также, как совершенно в любой организации неизбежно возникает отдел, подразделение или какая-то другая* часть, занимающаяся бухгалтерским учетом, точно также любое предприятие, в котором больше одного сотрудника, неизбежно подвергается информатизации. Обнаружив многочисленные преимущества, которые несет в себе внедрение компьютерных технологий, предприятия стремятся развить свою информационную структуру, извлечь как можно больше выгоды из своих вложений в автоматизацию производства и создание средств обмена данными и документами внутри предприятия. И в конечном итоге они стремятся к интеграции своей информационной среды. С целью ли достижения большей прозрачности, или большей оперативности управления, или повышения качества бизнес-процессов, но ставится задача превратить каждый программный компонент информационной среды в часть целого, способную отвечать на запросы, уведомлять о своем состоянии другие части среды, поддаваться настройке и эффективно взаимодействовать с любым другим компонентом среды, с каким только можно придумать осмысленный способ взаимодействия.

Однако повсеместное распространение информационных систем и взрывообразное, стихийное их развитие, наблюдавшее в последние годы, оказывается, создают препятствия для такой интеграции. Одно решение «говорит» на языке, совершенно непонятном другому решению, и даже отдаленно не похоже на аналогичное, которое было внедрено в компании, которую только что поглотила организация, стремящаяся к унификации своей информационной среды.

Объединение разрозненных участков информационной среды становится непростой задачей. И первым шагом в ее решении служит сообщение разным компонентам среды возможности понимать данные, с которыми они работают. Как правило, в организации существует определенный набор относительно постоянной информации, которая проникает практически во все аспекты ее деятельности. Списки подразделений, сотрудников, стандартов, спецификаций, все это создает терминологический контекст существованияпредприятия. Вся эта информация неизбежно попадает и в программные компоненты среды. И как правило в каждом из них выглядит по-своему.

Соответственно, чтобы добиться возможности взаимодействия компонентов друг с другом сначала надо добиться того, чтобы они одинаково обрабатывали одни и те же базовые понятия. И решение этой задачи в настоящее время выделилось в отдельное направление разработки программного обеспечения, которое называется управление нормативно-справочной информацией, или иначе мастер-данными.

Существует ряд коммерческих решений в этой области, обзор некоторых из них можно найти в первой главе этой работы. Вкратце можно сказать, что эти решения имеют два общих свойства. Во-первых, они все в первую очередь решают задачу интеграции мастер-данных в единое информационное пространство. Интеграция достигается либо путём представления справочников в единой, общей для всего предприятия форме и адаптации всей информационной среды для работы с этим новым, единым справочником, либо путем построения множества преобразований из каждого существующего представления каждого справочника в каждое отличное от него. Таким образом достигается возможность обмена данными между прежде изолированными частями информационной среды. Это решение, пусть и является существенным шагом вперед по сравнению с неконтролируемым внедрением программных компонент, не связанных друг с другом, лишь частично решает проблему. Ведь мастер-данные, будучи сложными, медленно меняющимися данными, с которыми редко связаны большие объемы информации требуют специфического управления. Вовторых, все эти системы являются коммерческими решениями, которые 5 предназначены для внедрения в больших компаниях в, виде отдельного компонента. В то же время: задача управления мастер-данными решается постоянно при разработке любой крупной информационной системыИ внедрение отдельного сервера управления мастер-данными поряду причин, в том числе и экономических, может быть нежелательным. В? то же времяв открытойпечати практически отсутствуют материалы, посвященные методике разработки системили подсистем" управления мастер-данными. То есть всесуществующие в настоящее время решения являются проприетарными и предназначены исключительно для внедрения в крупных организациях.

Эта работа своей целью предложить способ проектирования системы управления мастер-даннымикоторый можно было использовать в системе любого размера, на основе любой платформы. Что необходимо для тогочтобы спроектировать и реализовать компонент управления НСИ? Во-первых, необходима формальная модель, которая с одной стороны позволила бы описывать с максимальной степенью достоверности, или, как предлагается в дальнейшем говорить в этой работе, с сохранением максимального объема знаний о системе те данные, которые должны быть сохранены в системе, а с другой стороны позволяла бы реализацию своих абстракций с разумными трудозатратами на основании существующих технологий программирования и хранения баз данных. Во-вторых, необходим способ априорной верификации проектируемой системы управления мастер-данными. Так как по самой своей природе системы управления мастер-данными являются распределенными системами и основные проблемы, которые в них возникают связаны с передачей данных из одной точки внедрения в другую, речь идет об описании механизма верификации распределенной сети распространения мастер-данных в рамках информационной среды.

Таким образом, данная работа ставит перед собой следующий задачи:

• Анализ существующих технологий управления нормативно-справочной информации;

• Разработать специфически предназначенную для описания мастер-данных модель данных, гарантирующую возможность представления данных в разных формах для разных компонентов информационной среды;

• Обеспечить явную поддержку данной моделью элементов математического моделирования, необходимых при описании справочников, но отсутствующих в распространенных моделях данных, таких как иерархии, множества и наследование одними сущностями свойств других сущностей;

• Обеспечить реализуемость модели на базе наиболее распространенных в настоящее время технологий программирования;

• Реализовать на основе данной модели действующий программный продукт по управлению НСИ и тем самым продемонстрировать ее практическую применимость;

• Разработать механизм верификации качества работы распределенной СУ НСИ, с учетом взаимодействия мастер-данных с текущими данными;

• Реализовать этот механизм и применить его для оценки реально существующей системы управления мастер-данными, тем самым продемонстрировать его эффективность в качестве средства оценки результатов проектирования новых систем управления мастер-данными. I.

В соответствии с поставленной целью и сформулированными задачами, в данной работе на защиту выносятся следующие результаты:

• Модель данных, позволяющая описывать НСИ с учетом ее сложной структуры и многообразия представлений в информационной среде;

• Математическая модель, описывающая взаимодействие мастер-данных с текущими данными в распределенной СУ НСИ;

• Метод обнаружения потенциальных сбоев в работе распределенной СУ НСИ, связанных с взаимодействием текущих данных и мастер-данных, на этапе проектирования системы;

• Реализация программного комплекса, обеспечивающего имитационное моделирование распределенной СУ НСИ на основании предложенной модели и позволяющего обнаруживать возникающие в ходе моделирования сбои.

4. Выводы.

В данной главе описана реально решаемая в настоящее время задача по обеспечению актуальности и полноты одной из важнейших пар справочников, задействованных в автоматизированной обработке результатов всероссийской переписи населения 2010. Описана архитектура подсистемы, решающей эту задачу, спроектированной на основе модели МКМ. Отмечено снижение затрат на разработку и рисков с ней связанных в результате применения заранее продуманной модели, успешно описывающей все необходимые системе функции.

Описан перспективный путь развития подсистемы, обеспечивающий постоянную адаптацию результатов переписи к текущему территориальному делению. С помощью двухпоточной модели распределенной СУ НСИ предсказано запаздывание результатов работы системы по отношению к текущим нормативным документам, совпадающая с экспертными оценками. Тем самым подтверждена применимость модели к реальным системам и снижены риски, сопутствующие реализации доработок, необходимых для дальнейшего развития АС ВПН-2010.

Заключение

.

Корректное управление мастер-данными — это актуальная и: сложная задача. Настолько сложная, что в данной работе для работы с ними было предложено воспользоваться элементами логического программирования и объектно-ориентированного моделирования. Следуя поставленным: н начале работы целям, были разработаны математические инструменты, существенно облегчающие проектирование даже весьма сложных по своей структуре СУ НСИ. При разработке этих инструментов были достигнуты следующие результаты:

• Разработана оригинальная модель данных МКМ на базе релядионной модели данных, учитывающая характерные особенности задачи управления НСИ. Для модели построена алгебра запросов по аналогии с реляционной алгеброй, доказана реляционная полнота этой алгебры и ее большая выразительность по-сравнению с реляционной. Доказана возможность обновления справочников через их особые альтернативные версии, получившие название граней;

• Так как модель основана на реляционной модели данных, она допускает хранение всех своих объектов в реляционной СУБД, а реализация ее логики требует введения слоя доступа к данным над I.

СУБД, который бы использовал бы не выразимые в ре л зэдиоыной модели абстракции для манипуляции данными там, где это необходимо системе;

• Модель успешно использована при проектировании подсистетугы ВСТЕ, входящей в автоматизированную систему ВПН-2010, предназначенную для обработки результатов всероссийской переписи населения 2.010;

• Разработана оригинальная модель, описывающая функционирование распределенной СУ НСИ на основе двуцветных графов, существенно отличная от сетей Петри. Идентифицированы два схожих класса потенциальных проблем обновления. Получено аналитическое решение для задачи вычисления вероятности возникновения одной, наиболее опасной, из них в некоторых случаях;

• Реализован программно-аппаратный комплекс, позволяющий имитировать процесс работы распределенной СУ НСИ, описанной с помощью предложенной модели. Программа апробирована, как путем испытания на примерах, для которых получено аналитическое решение, так и при решении промышленной задачи в рамках проектирования дальнейшего пути развития АС ВПН-2010. Оригинальное сочетание компонентов модели МКМ, каждый из которых, хотя и имеет аналоги в различных видах программного обеспечения, но никогда не использовался, как часть СУ НСИ составляет научную новизну модели МКМ. Двухпоточная модель распределенной СУ НСИ и поставленная в ее рамках проблема, обнаружения конфликтов на основании сравнения набора обновлений в исходном и принимающем узлах при пересылке рабочих документов из одного узла распределенной системы в другой также являются оригинальными разработками, впервые предложенными в этой работе. Решение этой проблемы, как численное, так и аналитическое следовательно также являются оригинальными.

В заключение работы хотелось бы выразить благодарность моему научному руководителю, доценту, к.т.н., Белову Александру Владимировичу и заведующему кафедрой Кибернетики профессору, д.т.н., Афанасьеву Валерию Николаевичу за их помощь в подготовке этой работы. Также, хотелось бы выразить благодарность компании «КРОК Инкорпорэйтед» за разрешение на публикацию материалов, связанных с АС ВПН-2010 и содействие в проведении апробации результатов данной работы на практике. Полученный в ходе работы над АС ВПН-2010 опыт оказался без преувеличения бесценен при написании данной работы.

Показать весь текст

Список литературы

  1. М.Р. Перспективные технологии информационных систем, Mi: ДМК Пресс, 2003 г., стр. 82−129
  2. М.Р. Абстракции и модели в системах баз данных. М.: СУБД, 1998 г., № 4−5 стр. 73−813: CODASYL DBTG Report.-New York: ACM, 1969. 191 р.
  3. ANSI/X3/SPARC Study Group on Data Base Management Systems. Interiin Report. FDTBull. ASM-S1GMOD. v. 7, no. 2 (1975), р. 1140. .
  4. Д., Лоховски Д. Модели данных, М.: Финансы и статистика, 1983 г., стр. 1−334.
  5. Как работать над терминологией. Основы и методы КНТТ АН- СССР. М.: Наука, 1968. — 76 с.
  6. Л.А. Методы и средства интеграции неоднородных баз данных, М.: Наука, 1983 г. стр. 1−424
  7. The Codasyl Approach to Data Base Management. Т. William Olle. Wiley, 1978, p. 1−287
  8. Дж. Основы систем баз данных, М.: Финансы и статистика, 1983, стр. 1−331.
  9. A.B. Системы программирования баз данных и знаний, Новосипирск: Наука, 1990 г., стр. 39−122
  10. , E.F. (June 1970). «A Relational Model of Data for Large SharedData Banks». Communications of the ACM (Association for Computing Machinery) 13 (6): p. 377−387
  11. M.P. Технология баз данных на персональных ЭВМ, М.: Финансы и статистика, 1992 г., стр. 185−189.
  12. Selinger, P. G.- Astrahan, M. M.- Chamberlin, D. D.- Lorie, R. A.- Price, T. G. (1979). «Access Path Selection in a Relational Database Management System». Proceedings of the 1979 ACM SIGMOD International Conference on Management of Data. pp. 23—34
  13. Ullman J. Principles of Database and knowledge-base systems. Volume II: The New Technologies, Stanford: Computer Science Press, 1989, p. 633−733.
  14. , E.F. (June 1970). «A Relational Model of Data for Large Shared Data Banks». Communications of the ACM 13 (6): p. 377 387.
  15. JI.A. Стандарт систем управления объектными базами данных ODMG-93, Краткий обзор и оценка состояния, М?.: СУБД № 1, 1996 г., стр. 102−109
  16. Burleson D. OODBMSs gaining MIS ground but RDBMSs still own the road. Software Magazine, 1994, 14(11), p. 63
  17. Darwen H., Date C.J. The Third Manifesto: Foundation of Object/Relational Databases, Mass.: Addison-Wesley, 1998, C.J.Date: Relational Database Writings 1994−1997.
  18. С.Д., Третий манифест Дейта и Дарвена, М?.: «Открытые системы», N 4, 2000, стр. 61−66
  19. Alfred Horn, (1951) «On sentences which are true of direct unions of algebras», Journal of Symbolic Logic, 16, p. 14−21.
  20. Иван Братко. Алгоритмы искусственного интеллекта на языке PROLOG — М.: Вильяме, 2004. — 640 с
  21. .Г., Тыугу Э. Х. Применение знаний в автоматизированных системах проектирования и управления, М.: Финансы и статистика, Прикладная информатика № 1(8), 1985 г. стр. 7.
  22. С.С. Расширяемость языков. Подходы и практика. М.: Финансы и статистика, Прикладная информатика № 2, стр. 17−22
  23. Doctorow С. Metacrap: Putting the torch to seven straw-men of the meta-utopia, Электронный ресурс. — Электронные данные. — 2001 г. Режим доступа: http://www.well.com/~doctorow/metacrap.htm, свободный. — Загл. с экрана. — Яз. англ.
  24. Nigel Shadbolt, Wendy Hall, Tim Berners-Lee, The Semantic Web Revisited, ШЕЕ Intelligent Systems, may/june 2006, p. 96−101
  25. Алексей Чернобровцев. Задачи управления мастер-данными Электронный ресурс. — Электронный журнал. — [М?].: Открытые системы, 2007 г. Режим доступа: http://www.osp.ru/os/2007/05/4 260 254/, свободный. — Загл. с экрана. — Яз. рус.
  26. Дмитрий Гулько. Мастер-данные: найден кратчайший путь к COA Электронный ресурс. Электронный журнал. — [М?].: CNews, 2006 г. — Режим доступа: http://www.cnews.ru/reviews/index.shtml72006/12/21/2 293 682, свободный. Загл. с экрана. — Яз. рус.
  27. John, Сох. Object databases driving new generation of applications. Network World № 49 T13. 1996 r. Framingham: Network World. Стр. 32
  28. Talend MDM Technology Электронный ресурс. Электронные данные. — Los Altos: Talend Inc. — Режим доступа: http://www.talend.com/master-data-management/talend-mdm-features.php, свободный. — Загл. с экрана. — Яз. англ.
  29. Семенов Ю.А., Telecommunication technologies -телекоммуникационные технологии Электронный ресурс. -Электронные данные. [М?]: ГНЦ ИТЭФ, 2010 г. — Режим доступа: http://book.itep.ru/10/petri.htm, свободный. — Загл. с экрана. — Яз. рус.
  30. С. Ghezzi, D. Mandrioli, S. Moraska, M. Pezze. A general way to put time in Petri nets, Pittsburg, Pennsylvania: Proc. 5th Internat. Workshop on Software Specification and Design, 1989, p. 60−67.
  31. B.E., Непомнящий B.A., Новиков P.M. Верификация раскрашенных сетей Петри методом роверки моделей, Новосибирск: Сибирское отделение РАН, институт проблем информатики им. А. П. Ершова, препринт 89, 2004 г., стр 5−23
  32. Marsan М.А. Stochastic Petri nets: elementary introduction, Lect. Notes in Computer Science Vol. 424, 1989.
  33. Chiardo G., German R., Lindemann C. A characterization of the stochastic process underlying a stochastic Petri net, New York: IEEE Transaction on software engeneering, vol. 20№ 7, july 1994 p, 506 514
  34. Campas J., Colom J.M., Jungnitz H., Silva M. Approximate throughput computation of stochastic marked graphs, New York: IEEE Transaction on software engeneering, vol. 20№ 7, july 1994 p, 526−535
  35. , К. Дж. Введение в системы баз данных. Москва, Санкт-Петербург, Киев: Вильяме, 2005 г. Стр. 163−391.
  36. Словарь по кибернетике / Под редакцией академика В. С. Михалевича, Киев: Главная редакция Украинской Советской Энциклопедии имени М. П. Бажана, 1989, стр. 534. — 751 с.
  37. Чжун Кай-лай, Однородные цепи Маркова. Перев. с англ., М.: Мир, 1964 г., стр. 425
  38. Grimes R. Managed Or Unmanaged? Электронный ресурс. — Электронные данные. 2007 — Режим доступа: http://www.grimes.demon.co.uk/dotnet/manunman.htm, свободный. — Загл. с экрана. — Яз. англ.
  39. В. Вопросы производительности .NET Framework Электронный ресурс. — Электронные данные. — MyCode, 2006 -2008 г. Режим доступа: http://www.mycode.ws/index.php7elijNasp/aspnetl391702016322007 1212.htm, свободный. Загл. с экрана. — Яз. англ.
Заполнить форму текущей работой