Descrição:
Neste curso, além da aprendizagem e uso de banco de dados não relacionais e NoSQL, o aluno obterá um entendimento completo da arquitetura do Apache Kafka e como ele adotou princípios comprovados de design de sistemas distribuídos que permitem que ele seja escalonado e executado de forma confiável. Em seguida, dividiremos essa arquitetura em componentes individuais e o aluno aprenderá sobre cada uma delas detalhadamente. Por fim, você verá os componentes em ação.
Serão apresentados também, os conceitos de computação distribuída, Hadoop e MapReduce e, em seguida, entrar em grandes detalhes no Apache Hive. O curso apresenta alguns desafios que você pode enfrentar ao resolver problemas reais de produção e como o Apache Hive torna essa tarefa mais fácil de realizar.
Por fim, depois de entender a estrutura MapReduce do Hadoop para processamento em lote, será verificado que as demandas modernas de processamento de big data superaram essa estrutura. É aí que o Apache Spark entra em ação, ostentando velocidades 10-100x mais rápidas do que o Hadoop e estabelecendo o recorde mundial em classificação em grande escala. A abstração geral do Spark significa que ele pode se expandir além do simples processamento em lote, tornando-o capaz de coisas como algoritmos extremamente rápidos e iterativos.