Index
Вопросы по Hadoop.
- Что такое Hadoop и из каких компонентов он состоит?
- Что такое YARN?
- Для чего нужен Apache Oozie?
- Что такое Hive и объясни, как он работает с данными?
- Объясни парадигму MapReduce и почему Spark пришел ей на замену?
- Как работает HDFS?
- Для чего нужна NameNode, Secondary NameNode?
- Нам необходимо считать текстовый файл из HDFS, объясни, что будет происходить?
- Что такое партиционирование и что оно из себя представляет в Hadoop?
- Что такое фактор репликации в HDFS и для чего он нужен?
- Что такое HDFS блоки и какие у них есть минусы?
- Как бороться с маленькими файлами в HDFS? Переполнение NameNode
- Если мы записываем файл размером меньше 128Мб, то какого размера будет блок нового файла?