Результаты для запроса: mapreduce
-
Анализ современных технологий хранения сверхбольших объемов информации
Статья была опубликована в выпуске №1
В статье делается обзор существующих технологий и программных решений для хранения большого объема информации.
Выбор технологии хранения данных, главным образом, влияет на производительность БД и всей системы в целом. Несмотря на то, что подходы и модели хранения сверхбольших данных непрерывно совершенствуются, как для крупных компаний, так и для научных групп организация хранения остается крайне трудоемким процессом. В большинстве случаев различные технологии хранения данных предназначены для решения конкретных задач.
Цель настоящей работы – обобщить имеющийся опыт хранения сверхбольших данных, который мог бы стать основой для создания новых методов. Авторы рассматривают сильные и слабые стороны технологий, применяющихся для хранения и управления большими объемами данных: распределенные и параллельные БД, технология MapReduce, их особенности и области применения. Также делают сравнительный анализ возможностей существующих программных решений, реализующих эти модели. На основе анализа даны рекомендации, направленные на совместное использование реляционных и нереляционных моделей с целью объединения преимуществ обеих технологий.