Дипломы, курсовые, рефераты, контрольные...
Срочная помощь в учёбе

Технологии Больших Данных

РефератПомощь в написанииУзнать стоимостьмоей работы

Технологии, используемые для сбора и обработки Больших Данных, можно разделить на 3 группы: К наиболее распространенным подходам обработки данных (ПО) относятся: Например, для сбора и хранения информации в социальных сетях. Серверы включают в себя хранилища данных. К технологическому оборудованию относят: Инфраструктурное оборудование. Программное обеспечение; Сервисные услуги. Оборудование… Читать ещё >

Технологии Больших Данных (реферат, курсовая, диплом, контрольная)

Технологии, используемые для сбора и обработки Больших Данных, можно разделить на 3 группы:

  • · Программное обеспечение;
  • · Оборудование;
  • · Сервисные услуги.

К наиболее распространенным подходам обработки данных (ПО) относятся:

SQL — язык структурированных запросов, позволяющий работать с базами данных. С помощью SQL можно создавать и модифицировать данные, а управлением массива данных занимается соответствующая система управления базами данных.

NoSQL — термин расшифровывается как Not Only SQL (не только SQL). Включает в себя ряд подходов, направленных на реализацию базы данных, имеющих отличия от моделей, используемых в традиционных, реляционных СУБД. Их удобно использовать при постоянно меняющейся структуре данных.

Например, для сбора и хранения информации в социальных сетях.

MapReduce — модель распределения вычислений. Используется для параллельных вычислений над очень большими наборами данных (петабайты* и более).

В программном интерфейсе не данные передаются на обработку программе, а программа — данным. Таким образом запрос представляет собой отдельную программу. Принцип работы заключается в последовательной обработке данных двумя методами Map и Reduce. Map выбирает предварительные данные, Reduce агрегирует их.

Hadoop — используется для реализации поисковых и контекстных механизмов высоконагруженных сайтов — Facebook, eBay, Amazon и др. Отличительной особенностью является то, что система защищена от выхода из строя любого из узлов кластера, так как каждый блок имеет, как минимум, одну копию данных на другом узле.

SAP HANA — высокопроизводительная NewSQL платформа для хранения и обработки данных. Обеспечивает высокую скорость обработки запросов. Еще одним отличительным признаком является то, что SAP HANA упрощает системный ландшафт, уменьшая затраты на поддержку аналитических систем.

К технологическому оборудованию относят:

  • · серверы;
  • · инфраструктурное оборудование.

Серверы включают в себя хранилища данных.

К инфраструктурному оборудованию относят средства ускорения платформ, источники бесперебойного питания, комплекты серверных консолей и др.

Показать весь текст
Заполнить форму текущей работой