Skip to content

Index

Вопросы по Hadoop.

  1. Что такое Hadoop и из каких компонентов он состоит?
  2. Что такое YARN?
  3. Для чего нужен Apache Oozie?
  4. Что такое Hive и объясни, как он работает с данными?
  5. Объясни парадигму MapReduce и почему Spark пришел ей на замену?
  6. Как работает HDFS?
  7. Для чего нужна NameNode, Secondary NameNode?
  8. Нам необходимо считать текстовый файл из HDFS, объясни, что будет происходить?
  9. Что такое партиционирование и что оно из себя представляет в Hadoop?
  10. Что такое фактор репликации в HDFS и для чего он нужен?
  11. Что такое HDFS блоки и какие у них есть минусы?
  12. Как бороться с маленькими файлами в HDFS? Переполнение NameNode
  13. Если мы записываем файл размером меньше 128Мб, то какого размера будет блок нового файла?