Descrição
Aprendizado por Reforço do Zero ao Mestre - IA em Python (EN)
Inteligência Artificial (IA) para Tomada de Decisão. Aprendizado por Reforço - Aprendizado por Reforço (Profundo)
Este é o curso mais abrangente de Aprendizado por Reforço em inglês. Neste curso, você aprenderá os fundamentos do Aprendizado por Reforço, um dos três paradigmas da inteligência artificial moderna. Você implementará algoritmos adaptativos do zero que resolvem tarefas de controle com base na experiência. Você também aprenderá como combinar esses algoritmos com técnicas de Aprendizado Profundo e redes neurais, dando origem ao ramo conhecido como Aprendizado por Reforço Profundo. Este curso é o primeiro da série "Aprendizado por Reforço do Iniciante ao Mestre" e fornecerá as bases necessárias para entender novos algoritmos à medida que surgem. Ele também o preparará para os cursos seguintes desta série, onde aprofundaremos muito mais em diferentes ramos do Aprendizado por Reforço e exploraremos alguns dos algoritmos mais avançados que existem. O curso é focado no desenvolvimento de habilidades práticas. Portanto, após aprender os conceitos mais importantes de cada família de métodos, implementaremos um ou mais de seus algoritmos do zero em notebooks de código. Este curso é dividido em três partes e aborda os seguintes tópicos:Parte 1 (Métodos Tabulares):
- Processo de Decisão de Markov - Programação Dinâmica - Métodos de Monte Carlo - Métodos de Diferença Temporal (SARSA, Q-Learning) - Bootstrapping de n etapasParte 2 (Adaptação a Espaços de Estado Contínuos):
- Agregação de Estados - Codificação de TilesParte 3 (Aprendizado por Reforço Profundo):
- SARSA Profundo - Q-Learning Profundo - REINFORCE - Ator-Crítico de Vantagem / A2C (método Ator-Crítico de Vantagem) O que você aprenderá: - Compreender o que é Aprendizado por Reforço e as tarefas para as quais é mais adequado. - Algoritmos básicos de Aprendizado por Reforço. - Aprendizado por Reforço Profundo (algoritmos de Aprendizado por Reforço combinados com redes neurais). - Métodos de Gradiente de Política. - Implementar algoritmos de Aprendizado por Reforço do zero. - Compreender as diferentes famílias de métodos de Aprendizado por Reforço, suas vantagens e desvantagens. - Compreender fundamentalmente o processo de aprendizado de cada algoritmo. - Ser capaz de implementar novos algoritmos ao encontrá-los em artigos científicos."Estimar frete
Payment & Security

Featured collection





















![Curso de Angular e NodeJS - O Guia da Pilha MEAN [Edição 2023] - IBRATH Instituto Brasileiro de Terapias Holísticas teste011020230809](http://loja.ibrath.com/cdn/shop/products/a19556.png?v=1699935448&width=1024)




![Curso de Docker & Kubernetes: O Guia Prático [Edição 2023] - IBRATH Instituto Brasileiro de Terapias Holísticas teste011020230809](http://loja.ibrath.com/cdn/shop/products/a19570.png?v=1699935525&width=1024)





















Dúvidas Gerais
Após a confirmação do pagamento, você receberá um e-mail com todas as instruções para acessar seus cursos. O e-mail incluirá um link para a plataforma de ensino, onde você poderá fazer login utilizando suas credenciais cadastradas no momento da compra. Caso seja um curso em formato de arquivo para download, o mesmo estará disponível na área do aluno e poderá ser acessado diretamente pelo link enviado. Se você não receber o e-mail de acesso em até 24 horas, verifique sua caixa de spam ou entre em contato com nossa equipe pelo e-mail suporte@amentil.com.br.
Após a confirmação do pagamento, seu pedido será processado e enviado para o endereço cadastrado. Você receberá um e-mail com os detalhes do envio, incluindo o código de rastreamento para acompanhar a entrega. Trabalhamos com transportadoras confiáveis e os prazos variam de acordo com o método de envio escolhido e sua localização. É importante garantir que o endereço de entrega esteja correto para evitar atrasos. Caso tenha dúvidas ou problemas com a entrega, nossa equipe de suporte está à disposição pelo e-mail suporte@amentil.com.br.
Você pode tirar dúvidas diretamente com nossa equipe de suporte por diversos canais:
- E-mail: Envie sua pergunta para suporte@amentil.com.br, e nossa equipe responderá em até 2 dias úteis.
- Telefone: Ligue para +55 (48) 1234-5678, disponível de segunda a sexta, das 9h às 18h.
- WhatsApp: Envie uma mensagem para +55 (48) 91265-4321 e receba atendimento rápido e prático.
- Formulário de Contato: Preencha o formulário disponível em nosso site na página Contato.
- Redes Sociais: Você também pode enviar suas dúvidas pelo Instagram ou Facebook em @amentil.sa.
Estamos sempre prontos para ajudar!
Reembolso e garantias
O prazo de reembolso pode variar dependendo da forma de pagamento utilizada:
- Cartão de Crédito: O estorno será realizado em até 7 dias úteis após a aprovação do reembolso, mas o crédito poderá aparecer na sua fatura em um prazo de 30 a 60 dias, conforme a política da operadora do cartão.
- Boleto Bancário ou Transferência: O valor será devolvido via depósito em conta bancária em até 7 dias úteis após a aprovação do reembolso.
Você pode solicitar a devolução de produtos físicos seguindo o passo a passo abaixo:
- Entre em contato com nosso suporte:
- Aguarde nossa resposta:
Nossa equipe analisará sua solicitação em até 3 dias úteis e fornecerá as instruções detalhadas para a devolução. - Prepare o produto:
- Envie o produto:
- Reembolso ou troca:
Nosso compromisso é fornecer uma experiência confiável e segura ao acessar nossa enciclopédia online. Garantimos a qualidade dos serviços e funcionalidades oferecidos, seguindo as condições descritas abaixo:
1. Garantia de Acesso
- Disponibilidade: Oferecemos garantia de disponibilidade da enciclopédia online 24 horas por dia, 7 dias por semana, exceto durante períodos programados de manutenção ou por problemas técnicos fora do nosso controle.
- Resolução de Problemas: Em caso de interrupções no serviço, nossa equipe técnica atuará para restaurar o acesso no menor tempo possível.
2. Garantia de Conteúdo
- Precisão e Atualização: Todo o conteúdo disponibilizado é cuidadosamente revisado para garantir precisão e relevância. No entanto, a enciclopédia online é constantemente atualizada, e não podemos garantir a exatidão absoluta em casos de informações sujeitas a mudanças rápidas.
- Correção de Erros: Caso identifique erros ou inconsistências no conteúdo, você pode nos informar pelo e-mail conteudo@amentil.com.br, e faremos a análise e correção, se necessário.
3. Garantia de Segurança
- Proteção de Dados: Utilizamos tecnologias avançadas para proteger suas informações pessoais e garantir que sua navegação na enciclopédia seja segura.
- Privacidade: Todos os dados coletados seguem as diretrizes da nossa Política de Privacidade.
4. Garantia de Reembolso
Para assinaturas da enciclopédia online:
- Direito de Arrependimento: Você pode solicitar o cancelamento e reembolso integral em até 7 dias corridos após a compra, desde que não tenha acessado conteúdos pagos da plataforma.
- Problemas Técnicos: Caso não consiga acessar os conteúdos devido a falhas técnicas imputáveis à plataforma, garantimos suporte prioritário e, se o problema não for resolvido, você pode solicitar reembolso proporcional ao período não utilizado.
5. Limitações
- Conexão à Internet: Não garantimos acesso à enciclopédia em situações de instabilidade ou falhas na conexão de internet do usuário.
- Uso Indevido: O acesso e uso da enciclopédia são pessoais e intransferíveis. O compartilhamento de credenciais pode resultar na suspensão ou cancelamento da assinatura sem reembolso.
6. Contato para Garantias
Caso precise de suporte ou queira exercer algum direito de garantia, entre em contato conosco:
- E-mail: suporte@amentil.com.br
- Telefone: +55 (48) 1234-5678
- Horário de atendimento: Segunda a sexta, das 9h às 18h.