Atenção! Nosso Atendimento é 100% automatizado por Inteligência Artificial!

Curso de Aprendizado por Reforço Moderno: Agentes Ator-Crítico

Economize R$ 87,10

Preço:
Preço promocionalR$ 39,90 Preço normalR$ 127,00

Descrição

"""

Aprendizado por Reforço Moderno: Agentes Avançados de Ator-Crítico

Implemente Pesquisas de Inteligência Artificial de Ponta no Open AI Gym Usando PyTorch e Tensorflow2

Neste curso avançado sobre aprendizado profundo por reforço, você aprenderá como implementar algoritmos de ponta, como gradiente de política, ator-crítico, gradiente de política determinística profunda (DDPG), gradiente de política determinística profunda com atraso duplo (TD3) e ator crítico suave (SAC) em vários ambientes desafiadores fornecidos pelo Open AI gym. O foco será em lidar com ambientes com espaços de ação contínuos, o que é especialmente relevante para aqueles interessados em pesquisar o controle robótico usando aprendizado profundo por reforço. Em vez de ser um curso que fornece informações mastigadas, aqui você aprenderá a ler e implementar independentemente pesquisas de aprendizado profundo por reforço a partir do zero. Você adquirirá um framework repetível para implementar eficientemente algoritmos discutidos em artigos de pesquisa avançada. Dominar o conteúdo deste curso aumentará significativamente suas habilidades como engenheiro de inteligência artificial, diferenciando você de estudantes que dependem de outros para simplificar conceitos complexos. Não se preocupe se já faz um tempo desde o seu último curso de aprendizado por reforço; começaremos com uma revisão rápida dos tópicos principais. O curso começa com uma visão prática dos fundamentos do aprendizado por reforço, abordando tópicos como a Equação de Bellman, Processos de Decisão de Markov, Predição de Monte Carlo, Controle de Monte Carlo, Predição de Diferença Temporal TD(0), Controle de Diferença Temporal com Q Learning, e prossegue para codificar nosso primeiro agente: uma inteligência artificial capaz de jogar blackjack. Em seguida, avançaremos para ensinar um agente a equilibrar um pêndulo de carrinho usando Q learning. Uma vez que os fundamentos estejam solidificados, o ritmo acelera e mergulhamos em métodos de gradiente de política. Exploramos o algoritmo REINFORCE e o utilizamos para treinar uma inteligência artificial a pousar com sucesso na lua no ambiente lunar fornecido pelo Open AI gym. Em seguida, passamos a codificar o algoritmo de ator-crítico de um passo para mais uma vez conquistar o desafio lunar. Com os fundamentos cobertos, passamos a projetos mais desafiadores: implementar artigos de pesquisa de aprendizado profundo por reforço. Começamos com os Gradientes de Política Determinística Profunda (DDPG), um algoritmo projetado para treinar robôs a se destacarem em várias tarefas de controle contínuo. O DDPG combina os avanços do Aprendizado Q Profundo com métodos tradicionais de ator-crítico, alcançando resultados de ponta em ambientes com espaços de ação contínuos. Em seguida, implementamos um algoritmo de inteligência artificial de ponta: Twin Delayed Deep Deterministic Policy Gradients (TD3). Este algoritmo estabelece um novo referencial de desempenho em tarefas de controle robótico contínuo, e demonstraremos seu desempenho de classe mundial no ambiente Bipedal Walker fornecido pelo Open AI gym. O TD3 se baseia no algoritmo DDPG, abordando vários problemas de aproximação que prejudicam o desempenho do DDPG e de outros algoritmos de ator-crítico. Por fim, implementaremos o algoritmo de ator crítico suave (SAC). O SAC aborda o aprendizado profundo por reforço de uma perspectiva única, priorizando a maximização da entropia em vez da maximização do escore como um objetivo viável. Essa abordagem leva a um aumento na exploração por parte do nosso agente e um desempenho excepcional em vários ambientes cruciais do Open AI Gym. Ao final do curso, você terá uma compreensão abrangente dos métodos de Ator-Crítico e será capaz de responder a perguntas fundamentais, como por que os métodos de ator-crítico são valiosos apesar do sucesso do aprendizado Q profundo, como os avanços no aprendizado Q profundo podem ser aplicados a outras áreas do aprendizado por reforço, como lidar com o dilema de explorar-explorar com uma política determinística, como lidar com o viés de superestimação em métodos de ator-crítico e como gerenciar erros de aproximação inerentes em redes neurais profundas. Este curso é projetado para estudantes altamente motivados e avançados. Para ter sucesso, você deve ter cursado anteriormente os seguintes tópicos: cálculo de nível universitário, aprendizado por reforço e aprendizado profundo. O curso progride em um ritmo acelerado, abordando tópicos de ponta em pesquisas de aprendizado profundo por reforço. No entanto, a recompensa é que você ganhará a habilidade de ler artigos de pesquisa e traduzi-los eficientemente em código funcional. Você não precisará mais depender de postagens de blog não confiáveis.

O que você aprenderá:

- Como implementar métodos de gradiente de política em PyTorch - Como codificar Gradientes de Política Determinística Profunda (DDPG) em PyTorch - Como codificar Twin Delayed Deep Deterministic Policy Gradients (TD3) em PyTorch - Como codificar algoritmos de ator-crítico em PyTorch - Como implementar pesquisas de inteligência artificial de ponta em Python

Estimar frete

Payment & Security

Dúvidas Gerais

Após a confirmação do pagamento, você receberá um e-mail com todas as instruções para acessar seus cursos. O e-mail incluirá um link para a plataforma de ensino, onde você poderá fazer login utilizando suas credenciais cadastradas no momento da compra. Caso seja um curso em formato de arquivo para download, o mesmo estará disponível na área do aluno e poderá ser acessado diretamente pelo link enviado. Se você não receber o e-mail de acesso em até 24 horas, verifique sua caixa de spam ou entre em contato com nossa equipe pelo e-mail suporte@amentil.com.br.

Após a confirmação do pagamento, seu pedido será processado e enviado para o endereço cadastrado. Você receberá um e-mail com os detalhes do envio, incluindo o código de rastreamento para acompanhar a entrega. Trabalhamos com transportadoras confiáveis e os prazos variam de acordo com o método de envio escolhido e sua localização. É importante garantir que o endereço de entrega esteja correto para evitar atrasos. Caso tenha dúvidas ou problemas com a entrega, nossa equipe de suporte está à disposição pelo e-mail suporte@amentil.com.br.

Você pode tirar dúvidas diretamente com nossa equipe de suporte por diversos canais:

  • E-mail: Envie sua pergunta para suporte@amentil.com.br, e nossa equipe responderá em até 2 dias úteis.
  • Telefone: Ligue para +55 (48) 1234-5678, disponível de segunda a sexta, das 9h às 18h.
  • WhatsApp: Envie uma mensagem para +55 (48) 91265-4321 e receba atendimento rápido e prático.
  • Formulário de Contato: Preencha o formulário disponível em nosso site na página Contato.
  • Redes Sociais: Você também pode enviar suas dúvidas pelo Instagram ou Facebook em @amentil.sa.

Estamos sempre prontos para ajudar!

Reembolso e garantias

O prazo de reembolso pode variar dependendo da forma de pagamento utilizada:

  • Cartão de Crédito: O estorno será realizado em até 7 dias úteis após a aprovação do reembolso, mas o crédito poderá aparecer na sua fatura em um prazo de 30 a 60 dias, conforme a política da operadora do cartão.
  • Boleto Bancário ou Transferência: O valor será devolvido via depósito em conta bancária em até 7 dias úteis após a aprovação do reembolso.

Você pode solicitar a devolução de produtos físicos seguindo o passo a passo abaixo:

  1. Entre em contato com nosso suporte:
  2. Aguarde nossa resposta:
    Nossa equipe analisará sua solicitação em até 3 dias úteis e fornecerá as instruções detalhadas para a devolução.
  3. Prepare o produto:
  4. Envie o produto:
  5. Reembolso ou troca:

Nosso compromisso é fornecer uma experiência confiável e segura ao acessar nossa enciclopédia online. Garantimos a qualidade dos serviços e funcionalidades oferecidos, seguindo as condições descritas abaixo:

1. Garantia de Acesso

  • Disponibilidade: Oferecemos garantia de disponibilidade da enciclopédia online 24 horas por dia, 7 dias por semana, exceto durante períodos programados de manutenção ou por problemas técnicos fora do nosso controle.
  • Resolução de Problemas: Em caso de interrupções no serviço, nossa equipe técnica atuará para restaurar o acesso no menor tempo possível.

2. Garantia de Conteúdo

  • Precisão e Atualização: Todo o conteúdo disponibilizado é cuidadosamente revisado para garantir precisão e relevância. No entanto, a enciclopédia online é constantemente atualizada, e não podemos garantir a exatidão absoluta em casos de informações sujeitas a mudanças rápidas.
  • Correção de Erros: Caso identifique erros ou inconsistências no conteúdo, você pode nos informar pelo e-mail conteudo@amentil.com.br, e faremos a análise e correção, se necessário.

3. Garantia de Segurança

  • Proteção de Dados: Utilizamos tecnologias avançadas para proteger suas informações pessoais e garantir que sua navegação na enciclopédia seja segura.
  • Privacidade: Todos os dados coletados seguem as diretrizes da nossa Política de Privacidade.

4. Garantia de Reembolso

Para assinaturas da enciclopédia online:

  • Direito de Arrependimento: Você pode solicitar o cancelamento e reembolso integral em até 7 dias corridos após a compra, desde que não tenha acessado conteúdos pagos da plataforma.
  • Problemas Técnicos: Caso não consiga acessar os conteúdos devido a falhas técnicas imputáveis à plataforma, garantimos suporte prioritário e, se o problema não for resolvido, você pode solicitar reembolso proporcional ao período não utilizado.

5. Limitações

  • Conexão à Internet: Não garantimos acesso à enciclopédia em situações de instabilidade ou falhas na conexão de internet do usuário.
  • Uso Indevido: O acesso e uso da enciclopédia são pessoais e intransferíveis. O compartilhamento de credenciais pode resultar na suspensão ou cancelamento da assinatura sem reembolso.

6. Contato para Garantias

Caso precise de suporte ou queira exercer algum direito de garantia, entre em contato conosco:

  • E-mail: suporte@amentil.com.br
  • Telefone: +55 (48) 1234-5678
  • Horário de atendimento: Segunda a sexta, das 9h às 18h.