✆  55 (11) 3382-1503    |   ⌧  comercial@infomev.com.br       

Dominando o Big Data: NoSQL, Kafka, Hive e Spark

40h

Duração

Presencial Online

Formato

DESCRIÇÃO

Neste curso, além da aprendizagem e uso de banco de dados não relacionais e NoSQL, o aluno obterá um entendimento completo da arquitetura do Apache Kafka e como ele adota princípios de design de sistemas distribuídos que permitem que ele seja escalonado e executado de forma confiável. Em seguida, dividiremos essa arquitetura em componentes individuais e o aluno aprenderá sobre cada uma delas detalhadamente. Serão apresentados também, os conceitos de computação distribuída, Hadoop e MapReduce e, em seguida, entrar em grandes detalhes no Apache Hive. Por fim, SERÁ APRESENTADO o Apache Spark, ostentando velocidades 10-100x mais rápidas do que o Hadoop.

OBJETIVOS DO CURSO

PÚBLICO ALVO

Profissionais técnicos ou de negócio que necessitam trabalhar com processamento de grandes volumes de dados através de uma linguagem de consulta.

Conteúdo

Bancos de Dados Não Rel em XML  | Apache Kafka: Introdução e Conhecendo a arquitetura do Apache Kafka, Kafka e seus componentes: Tópicos, Partições e Brokers, Consumer Offset; Kafka CLI; Criação de um tópico; Listando os tópicos, Kafka Producer; Kafka Consumer; Replicação, Demonstração: Utilização do Kafka para produzir e consumir mensagens | Apache Hive: Hadoop, HDFS e MapReduce​, HiveQL: Criação e manipulação de dados​ | Apache Spark:​ Componentes e RDDs​, Transformações e ações​, Exemplos práticos com Dataframes

Depoimentos