Descrição do Curso

  • Por que aprender Big Data e Hadoop?

    O mundo está ficando cada vez mais digital, e isso significa que o big data está aqui para ficar. De fato, a importância do Big Data e da análise de dados continuará crescendo nos próximos anos. Escolher uma carreira na área de big data e analytics pode ser apenas o tipo de função que você está tentando encontrar para atender às suas expectativas de carreira. Profissionais que estão trabalhando neste campo podem esperar um salário impressionante, com o salário médio para os cientistas de dados sendo US $ 116.000. Mesmo aqueles que estão no nível de entrada vão encontrar altos salários, com ganhos médios de US $ 92.000. À medida que mais e mais empresas percebem a necessidade de especialistas em big data e analytics, o número desses jobs continuará a crescer. Cerca de 80% dos cientistas de dados dizem que atualmente há escassez de profissionais trabalhando no campo.

    hadoop training

  • Quais são os objetivos do nosso curso on-line Big Data Hadoop?

    O curso Big Data Hadoop Certification foi desenvolvido para fornecer um conhecimento profundo da estrutura de Big Data usando o Hadoop e o Spark, incluindo HDFS, YARN e MapReduce. Você aprenderá a usar o Pig, o Hive eo Impala para processar e analisar grandes conjuntos de dados armazenados no HDFS e usar o Sqoop e o Flume para o processamento de dados com o nosso treinamento em big data.

    Você irá dominar o processamento de dados em tempo real usando o Spark, incluindo programação funcional no Spark, implementação de aplicativos Spark, entendimento do processamento paralelo no Spark e uso de técnicas de otimização do Spark RDD. Com nosso curso de big data, você também aprenderá os vários algoritmos interativos no Spark e usará o Spark SQL para criar, transformar e consultar formulários de dados.

    Como parte do curso de big data, você será solicitado a executar projetos reais baseados na indústria usando o CloudLab nos domínios bancário, de telecomunicações, mídia social, seguros e comércio eletrônico. Este curso de treinamento Big Data Hadoop preparará você para a certificação de big data Cloudera CCA175.

  • Quais habilidades você aprenderá com nosso treinamento de certificação Big Data Hadoop?

    O treinamento Big Data Hadoop permitirá que você domine os conceitos do framework Hadoop e sua implementação em um ambiente de cluster. Você aprenderá a:

    • Entenda os diferentes componentes do ecossistema do Hadoop, como Hadoop 2.7, Yarn, MapReduce, Pig, Hive, Impala, HBase, Sqoop, Flume e Apache Spark com este curso do Hadoop.
    • Entenda a arquitetura do Hadoop Distributed File System (HDFS) e do YARN e saiba como trabalhar com eles para armazenamento e gerenciamento de recursos
    • Entenda o MapReduce e suas características e assimile os conceitos avançados do MapReduce
    • Ingerir dados usando Sqoop e Flume
    • Crie o banco de dados e as tabelas no Hive e no Impala, entenda o HBase e use o Hive e o Impala para particionamento
    • Entenda diferentes tipos de formatos de arquivos, Avro Schema, usando Arvo com Hive, e Sqoop e Schema evolution
    • Entenda a arquitetura Flume, Flume, fontes, sumidouros de canal, canais e configurações de canal
    • Entenda e trabalhe com o HBase, sua arquitetura e armazenamento de dados, e aprenda a diferença entre HBase e RDBMS
    • Obter um conhecimento prático do Pig e seus componentes
    • Faça programação funcional no Spark e implemente e crie aplicativos Spark
    • Entenda conjuntos de dados de distribuição resiliente (RDD) em detalhes
    • Obtenha uma compreensão profunda do processamento paralelo nas técnicas de otimização do Spark e do Spark RDD
    • Entenda os casos de uso comuns do Spark e vários algoritmos interativos
    • Aprenda o Spark SQL, criando, transformando e consultando quadros de dados
    • Prepare-se para a certificação Cloudera CCA175 Big Data

  • Quem deve fazer este curso de treinamento em Big Data Hadoop?

    As oportunidades de carreira em Big Data estão aumentando e o Hadoop está rapidamente se tornando uma tecnologia obrigatória na arquitetura de Big Data. O treinamento em Big Data é mais adequado para profissionais de TI, gerenciamento de dados e análise que buscam obter experiência em Big Data, incluindo:

    • Desenvolvedores de Software e Arquitetos
    • Profissionais do Analytics
    • Profissionais de TI sênior
    • Profissionais de teste e mainframe
    • Profissionais de gerenciamento de dados
    • Profissionais de Business Intelligence
    • Gerentes de projeto
    • Cientistas de dados aspirantes
    • Graduados que desejam construir uma carreira no Big Data Analytics

  • Quais projetos estão incluídos neste curso de treinamento on-line Big Data Hadoop?

    O curso de Treinamento do Hadoop inclui cinco projetos reais baseados na indústria no CloudLab. A avaliação bem-sucedida de um dos dois projetos a seguir é parte dos critérios de elegibilidade da certificação.

    Projeto 1
    Domínio-Banca

    Descrição: Uma instituição bancária portuguesa realizou uma campanha de marketing para convencer potenciais clientes a investirem num depósito a prazo. Suas campanhas de marketing foram realizadas por meio de telefonemas e, às vezes, o mesmo cliente foi contatado mais de uma vez. Seu trabalho é analisar os dados coletados da campanha de marketing.

    Projeto 2
    Domínio-telecomunicação

    Descrição: Um provedor de serviços de telefonia móvel lançou uma nova campanha de rede aberta. A empresa convidou os usuários a fazer reclamações sobre as torres em sua localidade, caso enfrentem problemas com sua rede móvel. A empresa coletou o conjunto de dados de usuários que fizeram uma reclamação. O quarto e o quinto campo do conjunto de dados têm latitude e longitude de usuários, o que é uma informação importante para a empresa. Você deve encontrar essas informações de latitude e longitude com base no conjunto de dados disponível e criar três clusters de usuários com um algoritmo k-means.

    Para prática adicional, temos mais três projetos para ajudá-lo a iniciar sua jornada no Hadoop e no Spark.

    Projeto 3
    Domínio - Mídia Social

    Descrição: Como parte de um exercício de recrutamento, uma grande empresa de mídia social pediu aos candidatos que analisassem um conjunto de dados do Stack Exchange. Você usará o conjunto de dados para chegar a algumas informações importantes.

    Projeto 4
    Domínio - Website que fornece informações relacionadas a filmes

    Descrição: O IMDB é um banco de dados on-line de informações relacionadas a filmes. IMDB os usuários classificam os filmes em uma escala de 1 a 5, sendo 1 o pior e 5 o melhor, e fornecem resenhas. O conjunto de dados também tem informações adicionais, como o ano de lançamento do filme. Você tem a tarefa de analisar os dados coletados.

    Projeto 5
    Domínio-Seguro

    Descrição: Um fornecedor de seguros com sede nos EUA decidiu lançar um novo programa de seguro médico visando vários clientes. Para ajudar um cliente a entender melhor o mercado, você deve executar uma série de análises de dados usando o Hadoop.

  • Como o Big Data Training ajudará sua carreira?

    O campo de big data e analytics é dinâmico, adaptando-se rapidamente à medida que a tecnologia evolui ao longo do tempo. Os profissionais que tomam a iniciativa e se destacam em big data e analytics estão bem posicionados para acompanhar as mudanças no espaço tecnológico e preencher as oportunidades de emprego em crescimento. Algumas tendências em big data incluem:

    Mercado global de Hadoop chegará a US $ 84,6 bilhões até 2021 - Allied Market Research
    Escassez de 1,4 a 1,9 milhões de analistas de dados do Hadoop só nos EUA até 2018 - McKinsey
    Administradores do Hadoop nos EUA recebem salários de até US $ 123.000 - indeed.com

  • Como vou executar projetos neste curso de treinamento do Hadoop?

    Você usará o CloudLab da Simplilearn para concluir projetos.

  • O que é o CloudLab?

    O CloudLab é um laboratório de ambiente Hadoop e Spark baseado em nuvem que o Simplilearn oferece com o curso Treinamento do Hadoop para garantir uma execução livre de problemas de seus projetos práticos. Não há necessidade de instalar e manter o Hadoop ou o Spark em uma máquina virtual. Em vez disso, você poderá acessar um ambiente pré-configurado no CloudLab por meio do seu navegador. Esse ambiente é muito semelhante ao que as empresas estão usando hoje para otimizar a escalabilidade e a disponibilidade da instalação do Hadoop.

    Você terá acesso ao CloudLab a partir do LMS (Learning Management System) da Simplilearn durante o curso. Você pode aprender mais sobre o CloudLab visualizando nosso vídeo do CloudLab.

Prévia do curso

    • Lição 00 - Introdução ao Curso 04:10
      • 0.1 Introduction04:10
    • Lição 01 - Introdução ao Big Data e ao Hadoop Ecosystem 15:43
      • 1.1 Introduction00:38
      • 1.2 Visão Geral para Big Data e Hadoop05:13
      • 1.3 Pop Quiz
      • 1.4 Ecossistema Hadoop08:57
      • 1.5 Quiz
      • 1.6 Principais Resultados00:55
    • Lição 02 - HDFS e YARN 47:08
      • 2.1 Introduction06:10
      • 2.2 Arquitetura e Componentes do HDFS08:59
      • 2.3 Quiz Pop
      • 2.4 Arquitetura de Replicação de Bloco09:53
      • 2.5 FIO Introdução21:25
      • 2.6 Quiz
      • 2.7 Principais Conclusões00:41
      • 2.8 Exercício prático
    • Lição 03 - MapReduce and Sqoop 57:00
      • 3.1 Introduction00:41
      • 3.2 Por que Mapreduce11:57
      • 3.3 Dados Pequenos e Big Data15:53
      • 3.4 Questionário Pop
      • 3.5 Tipos de Dados no Hadoop04:23
      • 3.6 Junções no MapReduce04:43
      • 3.7 O que é o Sqoop?18:21
      • 3.8 Quiz
      • 3.9 Principais Conclusões01:02
      • 3.10 Exercício prático
    • Lição 04 - Noções Básicas de Colmeia e Impala 19:00
      • 4.1 Introduction04:07
      • 4.2 Questionário Pop
      • 4.3 Interagindo com a Colmeia e a Impala14:07
      • 4.4 Quiz
      • 4.5 Principais Conclusões00:46
    • Lição 05 - Trabalhando com o Hive e o Impala 28:36
      • 5.1 Trabalhando com a colméia e a Impala07:08
      • 5,2 Pop Quiz
      • 5.3 Tipos de Dados na Colmeia07:47
      • 5.4 Validação de Dados07:47
      • 5.5 O que é o Hcatalog e seus usos05:25
      • 5.6 Quiz
      • 5,7 principais Takeaways00:29
      • 5.8 Exercício prático
    • Lição 06 - Tipos de formatos de dados 14:35
      • 6.1 Introduction00:44
      • 6.2 Tipos de Formato de Arquivo02:35
      • 6,3 Pop Quiz
      • 6.4 Serialização de Dados03:11
      • 6.5 Importando o MySql e Criando o hivetb04:32
      • 6.6 Parquet Com Sqoop02:37
      • 6.7 Quiz
      • 6.8 Principais Remoções00:56
      • 6.9 Exercício prático
    • Lição 07 - Conceito Hive Avançado e Particionamento de Arquivo de Dados 17:00
      • 7.1 Introduction07:41
      • 7,2 Pop Quiz
      • 7.3 Visão geral da linguagem de consulta do Hive08:18
      • 7.4 Quiz
      • 7.5 Principais Reminiscências01:01
      • 7.6 Exercício prático
    • Lição 08 - Apache Flume e HBase 28:06
      • 8.1 Introduction12:29
      • 8,2 Pop Quiz
      • 8.3 Introdução ao HBase14:40
      • 8.4 Quiz
      • 8,5 principais Takeaways00:57
      • 8.6 Exercício prático
    • Lição 09 - Porco 18:08
      • 9.1 Introduction10:45
      • 9,2 Pop Quiz
      • 9.3 Obtendo conjuntos de dados para desenvolvimento de porcos06:45
      • 9.4 Quiz
      • 9.5 Principais Reminiscências00:38
      • 9.6 Exercício prático
    • Lição 10 - Noções básicas do Apache Spark 39:54
      • 10.1 Introduction16:04
      • 10.2 Spark - Arquitetura, Execução e Conceitos Relacionados07:10
      • 10,3 Pop Quiz
      • 10.4 Operações do RDD10:39
      • 10.5 Programação Funcional no Spark05:34
      • 10.6 Quiz
      • 10.7 Principais Remoções00:27
      • 10.8 Exercício prático
    • Lição 11 - RDDs no Spark 16:09
      • 11.1 Introduction00:46
      • 11.2 Tipos de dados RDD e criação de RDD10:14
      • 11,3 Questionário Pop
      • 11.4 Operações em RDDs04:35
      • 11.5 Quiz
      • 11.6 Principais Remoções00:34
      • 11.7 Exercício prático
    • Lição 12 - Implementação de aplicativos Spark 13:54
      • 12.1 Introduction03:57
      • 12.2 Executando o Spark no YARN01:27
      • 12,3 Pop Quiz
      • 12.4 Executando um aplicativo Spark01:47
      • 12.5 Atribuição dinâmica de recursos01:06
      • 12.6 Configurando seu aplicativo Spark04:24
      • 12.7 Quiz
      • 12.8 Principais Remoções01:13
    • Lição 13 - Processamento Paralelo de Faísca 08:40
      • 13.1 Introduction05:41
      • 13,2 Pop Quiz
      • 13.3 Operações paralelas em partições02:28
      • 13.4 Quiz
      • 13.5 Principais Reminiscências00:31
      • 13.6 Exercício prático
    • Lição 14 - Técnicas de Otimização do RDD do Spark 14:23
      • 14.1 Introduction04:40
      • 14,2 Pop Quiz
      • 14.3 Persistência do RDD08:59
      • 14.4 Quiz
      • 14.5 Principais Reminiscências00:44
      • 14.6 Exercício prático
    • Lição 15 - Algoritmo Spark 27:09
      • 15.1 Introduction00:49
      • 15.2 Spark: um algoritmo iterativo03:13
      • 15.3 Introdução ao sistema paralelo gráfico02:34
      • 15,4 Pop Quiz
      • 15.5 Introdução ao aprendizado de máquina10:27
      • 15.6 Introdução a três C's08:07
      • 15.7 Quiz
      • 15.8 Principais Reminiscências01:59
    • Qual é o próximo? 05:28
      • O próximo passo05:28
    • Lição 16 - Spark SQL 13:21
      • 16.1 Introduction06:36
      • 16,2 Pop Quiz
      • 16.3 Interoperando com RDDs06:08
      • 16.4 Quiz
      • 16.5 Principais Reminiscências00:37
      • 16.6 Exercício prático
    • Projects
      • Projeto para Submissão
      • Projetos com soluções
    • Instruções de papel de teste de simulação 00:20
      • Instructions00:20
    • Feedback do Curso
      • Feedback do Curso
    • Lição 01 - ARQUITETURA APACHE KAFKA 14:43
      • 1.1- Visão Geral do Curso02:24
      • 1.2- Criando aplicativos na arquitetura Publish-Subscribe02:37
      • 1.3- Tópicos e Partições04:39
      • 1.4- Como o Kafka Cluster é construído? - Corretores02:56
      • 1.5- Configuração do Kafka - Usando o Docker02:07
    • Lição 02 - PRODUTORES E CONSUMIDORES 38:07
      • 2.1- Enviando Eventos para o Kafka - Producers API04:55
      • 2.2- Envio assíncrono08:02
      • 2.3- Particionamento de Tópicos - Implementando o Particionador Personalizado02:52
      • 2.4- Lendo Eventos do Kafka - API do Consumidor06:24
      • 2.5- Consumer Pool Loop - Gerenciamento de Offset07:41
      • 2.6- Reequilíbrio de Consumidores08:13
    • Lição 03- KAFKA AVANÇADO - ENTENDENDO INTERNOS 09:07
      • 3.1- Elegendo Líderes de Partição - Kafka Controller Component02:44
      • 3.2- Replicação de dados em Kafka01:50
      • 3.3- Log distribuído somente por anexo - armazenando eventos em Kafka02:00
      • 3.4- Processo de Compactação01:41
      • 3.5- Resumo do Curso Apache Kafka00:52
    • Lição 01 - Introdução ao Java 1:18:27
      • 1.1 Introdução ao Java25:37
      • 1.2 Recursos do Java811:41
      • 1.3 Programação Orientada a Objetos (OOP)23:00
      • 1.4 Fundamentos de Java18:09
      • Quiz
    • Lição 02 - Trabalhando com Variáveis ​​Java 36:00
      • 2.1 Declarando e Inicializando Variáveis11:47
      • 2.2 Tipos de dados primitivos06:50
      • 2.3 Ler e gravar campos de objetos Java10:27
      • 2.4 Ciclo de Vida do Objeto06:56
      • Quiz
    • Lição 03 - Operadores Java e Construções de Decisão 15:01
      • 3.1 Operadores Java e Construções de Decisão15:01
      • Quiz
    • Lição 04 - Usando construções de loop em Java 17:42
      • 4.1 Usando construções de loop em Java17:42
      • Quiz
    • Lição 05 - Criando e usando array 36:16
      • 5.1 Criando e usando uma matriz unidimensional26:53
      • 5.2 Criando e usando o array multidimensional09:23
      • Quiz
    • Lição 06 - Métodos e encapsulamento 35:55
      • 6.1 Método Java04:36
      • 6.2 Palavra-chave estática e final15:16
      • 6.3 Construtores e Modificadores de Acesso em Java07:04
      • 6.4 Encapsulation08:59
      • Quiz
    • Lição 07 - Herança 40:32
      • 7.1 Fundição Polimórfica e Super23:46
      • 7.2 Classe e Interfaces Abstratas16:46
      • Quiz
    • Lição 08 - Tratamento de Exceções 36:17
      • 8.1 Tipos de Exceções e Declaração Try-catch18:48
      • 8.2 Lança Declaração e Finalmente Bloqueia11:27
      • 8.3 Classes de Exceção06:02
      • Quiz
    • Lição 09 - Trabalhar com Classes Selecionadas da API Java 1:01:06
      • 9.1 String28:16
      • 9.2 Trabalhando com StringBuffer05:44
      • 9.3 Criar e manipular dados do calendário13:03
      • 9.4 Declarar e usar o Arraylist14:03
      • Quiz
    • Lição 10 - Tópicos adicionais 45:03
      • 10.1 Classes internas Interfaces internas e linha16:51
      • 10.2 Quadro de Cobrança05:05
      • 10.3 Comparador Comparável e Iterador10:19
      • 10.4 Manipulação e serialização de arquivos12:48
      • Quiz
    • Lição 11 - JDBC 47:54
      • 11.1 JDBC e sua arquitetura08:50
      • 11.2 Drivers no JDBC03:09
      • 11.3 API JDBC e Exemplos24:44
      • 11.4 Gerenciamento de transações no JDBC11:11
      • Quiz
    • Lição 12 - Diversos e Testes Unitários 19:24
      • 12.1 Teste de Unidade19:24
      • Quiz
    • Lição 13 - Introdução ao Java 8 18:53
      • 13.1 Introdução ao Java 818:53
      • Quiz
    • Lição 14 - Expressão Lambda 14:39
      • 14.1 Expressão Lambda14:39
      • Quiz
    • {{childObj.title}}
      • {{childObj.childSection.chapter_name}}
        • {{lesson.title}}
      • {{lesson.title}}

    View More

    View Less

Exame e certificação FREE PRACTICE TEST

  • O que preciso fazer para desbloquear meu certificado Simplilearn?

    Sala de aula on-line:

    • Participe de um lote completo
    • Conclua um projeto e um teste de simulação com uma pontuação mínima de 80%

    Auto-aprendizagem online:

    • Complete 85% do curso
    • Conclua um projeto e um teste de simulação com uma pontuação mínima de 80%

  • Quais são os pré-requisitos para este curso de treinamento do Hadoop?

    Não há pré-requisitos para aprender este curso. No entanto, o conhecimento do Core Java e SQL será benéfico, mas certamente não é um mandato. Se você deseja aperfeiçoar suas habilidades de Core-Java, o Simplilearn oferece um curso individualizado de cortesia "Princípios básicos do Java para o Hadoop" ao se inscrever neste curso. Para Spark, este curso usa Python e Scala, e um e-book é fornecido para apoiar seu aprendizado.

    Jane Yi
    Jane Yi Programmer Analyst at Langara College, Vancouver

    Flexibilidade, acessibilidade e qualidade - isso torna o treinamento interessante.

    Rohit Gupta
    Rohit Gupta Associate Consultant at CGI, Victoria

    O treinamento é muito bom. O treinador tem um bom conhecimento. Estou aprendendo mais sobre esse pequeno elefante Hadoop.

    Malek ِAl Haddad
    Malek ِAl Haddad Founder and General Manager at DST International DMCC, Houston

    O Simplilearn é uma excelente plataforma on-line para treinamentos on-line com horários flexíveis de treinamento e conteúdo de curso bem planejado, com grande profundidade e estudos de caso. A parte mais interessante que diferencia o Simplilearn de outros fornecedores on-line é a qualidade do serviço ao cliente - 24 / 7. Eu recomendaria fortemente Simplilearn a todos que estão procurando uma mudança na carreira. Inscreva-se nos cursos e ganhe experiência para se tornar um profissional.

    Read more Read less
    Ludovick Jacob
    Ludovick Jacob Manager of Enterprise Database Engineering & Support at USAC, Washington

    Eu realmente gosto do conteúdo do curso e do modo como o treinador o relaciona com exemplos da vida real.

    Puviarasan Sivanantham
    Puviarasan Sivanantham Data Engineer at Fanatics, Inc., Sunnyvale

    A dedicação do formador no sentido de responder a todas as perguntas dos formandos faz com que nos sintamos bem e a sessão online tão real como numa sessão de sala de aula.

    Read more Read less
    Richard Kershner
    Richard Kershner Software Developer, Colorado Springs

    O treinador foi instruído e paciente em explicar as coisas. Muitas coisas foram significativamente mais fáceis de entender com um instrutor interativo ao vivo. Eu também gosto que ele saiu do seu caminho para enviar informações e soluções adicionais após a aula via e-mail.

    Read more Read less
    Aaron Whigham
    Aaron Whigham Business Analyst at CNA Surety, Chicago

    Treinador muito experiente, aprecie o horário também ... Adorei tudo até agora. Estou muito animado…

    Rudolf Schier
    Rudolf Schier Java Software Engineer at DAT Solutions, Portland

    Ótima abordagem para o entendimento básico do Hadoop. Os conceitos são repetidos de diferentes pontos de vista, respondendo ao público. No final da aula você entende.

    Read more Read less
    Kinshuk Srivastava
    Kinshuk Srivastava Data Scientist at Walmart, Little Rock

    O curso é muito informativo e interativo e essa é a melhor parte deste treinamento.

    Priyanka Garg
    Priyanka Garg Sr. Consultant, Detroit

    Sessões muito informativas e ativas. Treinador é fácil e muito interativo.

    Peter Dao
    Peter Dao Senior Technical Analyst at Sutter Health, Sacramento

    O conteúdo é bem desenhado e o instrutor foi excelente.

    Anil Prakash Singh
    Anil Prakash Singh Project Manager/Senior Business Analyst @ Tata Consultancy Services, Honolulu

    O treinador realmente foi a milha extra para me ajudar a trabalhar junto. obrigado

    Dipto Mukherjee
    Dipto Mukherjee Etl Lead at Syntel, Phoenix

    Excelente experiência de aprendizagem. O treinamento foi excelente! Obrigado Simplilearn por organizar sessões tão maravilhosas.

    Amit Mutreja
    Amit Mutreja Project Manager, Houston

    Este curso me proporcionou conhecimentos teóricos e práticos.

    Soumya Mukhopadhyay
    Soumya Mukhopadhyay Software Developer, Houston

    O treinamento foi bom em termos de explicação e limpeza dos conceitos teoricamente. Os fundamentos foram cobertos.

    • Disclaimer
    • PMP, PMI, PMBOK, CAPM, PgMP, PfMP, ACP, PBA, RMP, SP, and OPM3 are registered marks of the Project Management Institute, Inc.