Hadoop — самая популярная файловая системы хранения и обработки больших данных в рамках парадигмы MapReduce. Эта обзорная статья с картинками поможет вам понять его отличия от других систем.
Обратите внимание, в конце статьи есть откомментированный список разнообразной литературы и других источников по Hadoop.
Цитируем:
«Hadoop-кластер состоит из нод трех типов: NameNode, Secondary NameNode, Datanode. Namenode — мозг системы. Как правило, одна нода на кластер (больше в случае Namenode Federation, но мы этот случай оставляем за бортом). Хранит в себе все метаданные системы — непосредственно маппинг между файлами и блоками. Если нода 1 то она же и является Single Point of Failure. Эта проблема решена во второй версии Hadoop с помощью Namenode Federation».