Технологии Больших Данных
Технологии, используемые для сбора и обработки Больших Данных, можно разделить на 3 группы: К наиболее распространенным подходам обработки данных (ПО) относятся: Например, для сбора и хранения информации в социальных сетях. Серверы включают в себя хранилища данных. К технологическому оборудованию относят: Инфраструктурное оборудование. Программное обеспечение; Сервисные услуги. Оборудование… Читать ещё >
Технологии Больших Данных (реферат, курсовая, диплом, контрольная)
Технологии, используемые для сбора и обработки Больших Данных, можно разделить на 3 группы:
- · Программное обеспечение;
- · Оборудование;
- · Сервисные услуги.
К наиболее распространенным подходам обработки данных (ПО) относятся:
SQL — язык структурированных запросов, позволяющий работать с базами данных. С помощью SQL можно создавать и модифицировать данные, а управлением массива данных занимается соответствующая система управления базами данных.
NoSQL — термин расшифровывается как Not Only SQL (не только SQL). Включает в себя ряд подходов, направленных на реализацию базы данных, имеющих отличия от моделей, используемых в традиционных, реляционных СУБД. Их удобно использовать при постоянно меняющейся структуре данных.
Например, для сбора и хранения информации в социальных сетях.
MapReduce — модель распределения вычислений. Используется для параллельных вычислений над очень большими наборами данных (петабайты* и более).
В программном интерфейсе не данные передаются на обработку программе, а программа — данным. Таким образом запрос представляет собой отдельную программу. Принцип работы заключается в последовательной обработке данных двумя методами Map и Reduce. Map выбирает предварительные данные, Reduce агрегирует их.
Hadoop — используется для реализации поисковых и контекстных механизмов высоконагруженных сайтов — Facebook, eBay, Amazon и др. Отличительной особенностью является то, что система защищена от выхода из строя любого из узлов кластера, так как каждый блок имеет, как минимум, одну копию данных на другом узле.
SAP HANA — высокопроизводительная NewSQL платформа для хранения и обработки данных. Обеспечивает высокую скорость обработки запросов. Еще одним отличительным признаком является то, что SAP HANA упрощает системный ландшафт, уменьшая затраты на поддержку аналитических систем.
К технологическому оборудованию относят:
- · серверы;
- · инфраструктурное оборудование.
Серверы включают в себя хранилища данных.
К инфраструктурному оборудованию относят средства ускорения платформ, источники бесперебойного питания, комплекты серверных консолей и др.