Atenção! Nosso Atendimento é 100% automatizado por Inteligência Artificial!

Curso de Aprendizado por Reforço Moderno: Agentes Deep Q (PyTorch e TF2)

Economize R$ 87,10

Preço:
Preço promocionalR$ 39,90 Preço normalR$ 127,00

Descrição

Aprendizado por Reforço Moderno: Agentes Deep Q (PyTorch & TF2)

Domine a Arte de Implementar Pesquisas em Aprendizado por Reforço Profundo

Classificação: 4.7 de 5935 avaliações Total de horas: 7 Número de aulas: 50 Nível de dificuldade: Intermediário Neste curso abrangente sobre aprendizado por reforço moderno, você descobrirá uma estrutura comprovada para ler e implementar pesquisas em aprendizado por reforço profundo. Você mergulhará nos artigos originais que introduziram algoritmos inovadores como Deep Q learning, Double Deep Q learning e Dueling Deep Q learning. Através de exercícios práticos, você adquirirá proficiência na implementação desses algoritmos usando código conciso e pythonico em PyTorch e Tensorflow 2. Além disso, as habilidades que você adquirir podem ser facilmente estendidas para incorporar futuros algoritmos de aprendizado profundo Q. Ao longo do curso, você aplicará esses algoritmos para resolver vários ambientes da biblioteca Atari do Open AI Gym, incluindo jogos populares como Pong, Breakout e Bankheist. Você descobrirá os principais fatores que tornam esses algoritmos de Aprendizado Profundo Q bem-sucedidos, como modificar a biblioteca Atari do Open AI Gym para se alinhar com as especificações descritas nos artigos originais de Aprendizado Profundo Q. Especificamente, você aprenderá como:

1. Repetir ações para reduzir a sobrecarga computacional

Ao repetir ações, você pode minimizar a carga computacional e aumentar a eficiência do agente Deep Q.

2. Redimensionar as imagens da tela do Atari para aumentar a eficiência

Redimensionar as imagens da tela do Atari permite uma melhoria na eficiência do desempenho do agente Deep Q.

3. Empilhar quadros para dar ao agente Deep Q uma sensação de movimento

Empilhar quadros fornece ao agente Deep Q uma sensação de movimento, permitindo que ele tome decisões mais informadas.

4. Avaliar o desempenho do agente Deep Q com random no-ops para lidar com o supertreinamento do modelo

Random no-ops são empregados para avaliar o desempenho do agente Deep Q e evitar o supertreinamento.

5. Recortar recompensas para permitir que o agente de aprendizado profundo Q generalize entre jogos Atari com escalas de pontuação diferentes

Ao recortar recompensas, o agente de aprendizado profundo Q pode generalizar efetivamente seu desempenho entre jogos Atari com escalas de pontuação variadas. Se você não tem experiência prévia em aprendizado por reforço ou aprendizado profundo por reforço, não há motivo para se preocupar. Este curso inclui uma introdução abrangente e concisa aos fundamentos do aprendizado por reforço. O curso introdutório será ministrado no contexto da resolução do ambiente Frozen Lake do Open AI Gym. Você explorará tópicos como:

1. Processos de decisão de Markov

Obtenha uma compreensão sólida dos processos de decisão de Markov, um conceito-chave no aprendizado por reforço.

2. Aprendizado de diferença temporal

Aprenda sobre aprendizado de diferença temporal e sua importância no aprendizado por reforço.

3. O algoritmo Q learning original

Descubra o algoritmo Q learning original e seu papel no aprendizado por reforço.

4. Resolvendo a equação de Bellman

Domine as técnicas para resolver a equação de Bellman, uma equação fundamental no aprendizado por reforço.

5. Funções de valor e funções de valor de ação

Compreenda os conceitos de funções de valor e funções de valor de ação e sua importância no aprendizado por reforço.

6. Aprendizado por reforço baseado em modelo vs. livre de modelo

Diferencie entre abordagens de aprendizado por reforço baseadas em modelo e livres de modelo.

7. Soluções para o dilema explorar-explorar

Explore várias soluções para o dilema explorar-explorar, incluindo valores iniciais otimistas e seleção de ação epsilon-greedy. Além disso, este curso inclui um mini-curso sobre aprendizado profundo usando a estrutura PyTorch. Esta seção é projetada para estudantes que possuem uma compreensão básica dos conceitos de aprendizado profundo, mas podem não ter conhecimento específico ou se sentirem confortáveis com aprendizado profundo em outras estruturas como Tensorflow ou Keras. Você ganhará experiência prática na codificação de uma rede neural profunda em PyTorch e aprenderá como as redes neurais convolucionais funcionam. Essas habilidades serão utilizadas na implementação de um agente de aprendizado profundo Q ingênuo para resolver o problema do Cartpole do Open AI Gym. O que você aprenderá: - Como ler e implementar efetivamente pesquisas em aprendizado por reforço profundo - Como codificar agentes de aprendizado profundo Q - Como codificar agentes de aprendizado profundo Q duplos - Como codificar agentes de aprendizado profundo Q Dueling e Dueling Double Deep Q - Como escrever software modular e extensível de aprendizado por reforço profundo - Como automatizar a sintonia de hiperparâmetros com argumentos de linha de comando

Estimar frete

Payment & Security

Dúvidas Gerais

Após a confirmação do pagamento, você receberá um e-mail com todas as instruções para acessar seus cursos. O e-mail incluirá um link para a plataforma de ensino, onde você poderá fazer login utilizando suas credenciais cadastradas no momento da compra. Caso seja um curso em formato de arquivo para download, o mesmo estará disponível na área do aluno e poderá ser acessado diretamente pelo link enviado. Se você não receber o e-mail de acesso em até 24 horas, verifique sua caixa de spam ou entre em contato com nossa equipe pelo e-mail suporte@amentil.com.br.

Após a confirmação do pagamento, seu pedido será processado e enviado para o endereço cadastrado. Você receberá um e-mail com os detalhes do envio, incluindo o código de rastreamento para acompanhar a entrega. Trabalhamos com transportadoras confiáveis e os prazos variam de acordo com o método de envio escolhido e sua localização. É importante garantir que o endereço de entrega esteja correto para evitar atrasos. Caso tenha dúvidas ou problemas com a entrega, nossa equipe de suporte está à disposição pelo e-mail suporte@amentil.com.br.

Você pode tirar dúvidas diretamente com nossa equipe de suporte por diversos canais:

  • E-mail: Envie sua pergunta para suporte@amentil.com.br, e nossa equipe responderá em até 2 dias úteis.
  • Telefone: Ligue para +55 (48) 1234-5678, disponível de segunda a sexta, das 9h às 18h.
  • WhatsApp: Envie uma mensagem para +55 (48) 91265-4321 e receba atendimento rápido e prático.
  • Formulário de Contato: Preencha o formulário disponível em nosso site na página Contato.
  • Redes Sociais: Você também pode enviar suas dúvidas pelo Instagram ou Facebook em @amentil.sa.

Estamos sempre prontos para ajudar!

Reembolso e garantias

O prazo de reembolso pode variar dependendo da forma de pagamento utilizada:

  • Cartão de Crédito: O estorno será realizado em até 7 dias úteis após a aprovação do reembolso, mas o crédito poderá aparecer na sua fatura em um prazo de 30 a 60 dias, conforme a política da operadora do cartão.
  • Boleto Bancário ou Transferência: O valor será devolvido via depósito em conta bancária em até 7 dias úteis após a aprovação do reembolso.

Você pode solicitar a devolução de produtos físicos seguindo o passo a passo abaixo:

  1. Entre em contato com nosso suporte:
  2. Aguarde nossa resposta:
    Nossa equipe analisará sua solicitação em até 3 dias úteis e fornecerá as instruções detalhadas para a devolução.
  3. Prepare o produto:
  4. Envie o produto:
  5. Reembolso ou troca:

Nosso compromisso é fornecer uma experiência confiável e segura ao acessar nossa enciclopédia online. Garantimos a qualidade dos serviços e funcionalidades oferecidos, seguindo as condições descritas abaixo:

1. Garantia de Acesso

  • Disponibilidade: Oferecemos garantia de disponibilidade da enciclopédia online 24 horas por dia, 7 dias por semana, exceto durante períodos programados de manutenção ou por problemas técnicos fora do nosso controle.
  • Resolução de Problemas: Em caso de interrupções no serviço, nossa equipe técnica atuará para restaurar o acesso no menor tempo possível.

2. Garantia de Conteúdo

  • Precisão e Atualização: Todo o conteúdo disponibilizado é cuidadosamente revisado para garantir precisão e relevância. No entanto, a enciclopédia online é constantemente atualizada, e não podemos garantir a exatidão absoluta em casos de informações sujeitas a mudanças rápidas.
  • Correção de Erros: Caso identifique erros ou inconsistências no conteúdo, você pode nos informar pelo e-mail conteudo@amentil.com.br, e faremos a análise e correção, se necessário.

3. Garantia de Segurança

  • Proteção de Dados: Utilizamos tecnologias avançadas para proteger suas informações pessoais e garantir que sua navegação na enciclopédia seja segura.
  • Privacidade: Todos os dados coletados seguem as diretrizes da nossa Política de Privacidade.

4. Garantia de Reembolso

Para assinaturas da enciclopédia online:

  • Direito de Arrependimento: Você pode solicitar o cancelamento e reembolso integral em até 7 dias corridos após a compra, desde que não tenha acessado conteúdos pagos da plataforma.
  • Problemas Técnicos: Caso não consiga acessar os conteúdos devido a falhas técnicas imputáveis à plataforma, garantimos suporte prioritário e, se o problema não for resolvido, você pode solicitar reembolso proporcional ao período não utilizado.

5. Limitações

  • Conexão à Internet: Não garantimos acesso à enciclopédia em situações de instabilidade ou falhas na conexão de internet do usuário.
  • Uso Indevido: O acesso e uso da enciclopédia são pessoais e intransferíveis. O compartilhamento de credenciais pode resultar na suspensão ou cancelamento da assinatura sem reembolso.

6. Contato para Garantias

Caso precise de suporte ou queira exercer algum direito de garantia, entre em contato conosco:

  • E-mail: suporte@amentil.com.br
  • Telefone: +55 (48) 1234-5678
  • Horário de atendimento: Segunda a sexta, das 9h às 18h.