Reinforcement Learning e metodi Model-free (parte 2)

Reinforcement Learning e metodi Model-free (parte 2)

Come insegnare a imparare: Reinforcement Learning + Deep Learning (2)

Reinforcement Learning e metodi Model-free (parte 2)

Come insegnare a imparare: Reinforcement Learning + Deep Learning (2)
Panoramica

Negli ultimi anni l’intelligenza artificiale ha fatto passi da gigante. Uno dei paradigmi più di successo dal 2013 ad oggi è il Deep Reinforcement Learning, ovvero la sinergia tra Deep Learning e Reinforcement Learning.

Ma cos’è il Reinforcement Learning? Si intendono tutte quelle le tecniche che permettono alle macchine di imparare a prendere decisioni.

Negli ultimi anni l’intelligenza artificiale ha fatto passi da gigante. Uno dei paradigmi più di successo dal 2013 ad oggi è il Deep Reinforcement Learning, ovvero la sinergia tra Deep Learning e Reinforcement Learning.

Ma cos’è il Reinforcement Learning? Si intendono tutte quelle le tecniche che permettono alle macchine di imparare a prendere decisioni.

Cosa Imparerai nel corso?

Cosa Imparerai nel corso?

Il corso prevede vari moduli che ti insegneranno come, in presenza di un problema, una macchina riesca ad eseguire determinate azioni per poterlo risolvere. Le macchine eseguono azioni solo se queste sono associate ad una ricompensa. Imparerai a dire alla macchina quali azioni fare e quale sarà la ricompensa. Più questa sarà alta e più sarà giusto quello che la macchina sta facendo.

È possibile descrivere le azioni della macchina tramite tabelle, quando il problema presenta pochi stati e quando non si conosce il modello.

Il caso tabellare senza modello è il primo vero approccio al RL. Poiché non sappiamo in anticipo come risponderà l’ambiente alle nostre azioni, dobbiamo per forza “sperimentare”: facciamo un’azione, vediamo cosa succede, e la prossima volta agiremo di conseguenza!

Ci mettiamo nella situazione in cui sappiamo poco o nulla di come ragiona l’ambiente, e cerchiamo di usare le tecniche imparate per capire quanto valgono le nostre azioni: se io in questo stato faccio questa azione, alla fine di tutto quanto avrò guadagnato in totale? Cerchiamo di “predire” il valore delle nostre azioni.

La domanda successiva sarà: so che in questo stato, se faccio questa azione, guadagno tot, quale azione devo allora fare per guadagnare più di tot? Questa parte si chiama “controllo”, perché controlliamo le nostre azioni per migliorarle.

Il corso prevede vari moduli che ti insegneranno come, in presenza di un problema, una macchina riesca ad eseguire determinate azioni per poterlo risolvere. Le macchine eseguono azioni solo se queste sono associate ad una ricompensa. Imparerai a dire alla macchina quali azioni fare e quale sarà la ricompensa. Più questa sarà alta e più sarà giusto quello che la macchina sta facendo.

È possibile descrivere le azioni della macchina tramite tabelle, quando il problema presenta pochi stati e quando non si conosce il modello.

Il caso tabellare senza modello è il primo vero approccio al RL. Poiché non sappiamo in anticipo come risponderà l’ambiente alle nostre azioni, dobbiamo per forza “sperimentare”: facciamo un’azione, vediamo cosa succede, e la prossima volta agiremo di conseguenza!

Ci mettiamo nella situazione in cui sappiamo poco o nulla di come ragiona l’ambiente, e cerchiamo di usare le tecniche imparate per capire quanto valgono le nostre azioni: se io in questo stato faccio questa azione, alla fine di tutto quanto avrò guadagnato in totale? Cerchiamo di “predire” il valore delle nostre azioni.

La domanda successiva sarà: so che in questo stato, se faccio questa azione, guadagno tot, quale azione devo allora fare per guadagnare più di tot? Questa parte si chiama “controllo”, perché controlliamo le nostre azioni per migliorarle.

Struttura delle lezioni

Struttura delle lezioni

Deep Learning Italia struttura le sue lezioni in maniera molto semplice: all’interno di ogni sezione ci sono video esplicativi, in cui il docente spiega la lezione, corredati da slides. Vengono proposti esercizi mirati per testare ciò che si è appreso e viene richiesto al discente di mettere in pausa la riproduzione e provare a fare l’esercizio, prima di ascoltare la soluzione.

Nonostante la teoria sia presente e necessaria, questo corso comprende una forte componente applicativa, che viene svolta nelle esercitazioni associate a ogni lezione.

Le esercitazioni sono in Python, pertanto è altamente consigliato il “Corso Propedeutico: Programmazione in Python per il Deep Learning”.

Inoltre, Fondamenti di Reinforcement Learning e Reinforcement Learning e metodi Model-Free inizialmente è stato pensato come un corso unico, ma per l’esigenza di rilasciare CFU, ci ha costretto a dividerlo in due parti.

Deep Learning Italia struttura le sue lezioni in maniera molto semplice: all’interno di ogni sezione ci sono video esplicativi, in cui il docente spiega la lezione, corredati da slides. Vengono proposti esercizi mirati per testare ciò che si è appreso e viene richiesto al discente di mettere in pausa la riproduzione e provare a fare l’esercizio, prima di ascoltare la soluzione.

Nonostante la teoria sia presente e necessaria, questo corso comprende una forte componente applicativa, che viene svolta nelle esercitazioni associate a ogni lezione.

Le esercitazioni sono in Python, pertanto è altamente consigliato il “Corso Propedeutico: Programmazione in Python per il Deep Learning”.

Inoltre, Fondamenti di Reinforcement Learning e Reinforcement Learning e metodi Model-Free inizialmente è stato pensato come un corso unico, ma per l’esigenza di rilasciare CFU, ci ha costretto a dividerlo in due parti.

Chi può seguire il corso?

Chi può seguire il corso?

Chi ha una mente aperta e predisposta all’analisi: le lezioni sono adatte a chiunque ma è necessario avere passione per i numeri e i calcoli, oltre che tanta pazienza.

Chi lavora anche full time: se sei un lavoratore full time non ti preoccupare! Potrai seguire le lezioni in completa autonomia nel tuo tempo libero.

Chi vuole crescere professionalmente: Se vuoi elevare la tua carriera Deep Learning Italia ti da l’opportunità di poterlo fare a costi contenuti.

Chi ha una mente aperta e predisposta all’analisi: le lezioni sono adatte a chiunque ma è necessario avere passione per i numeri e i calcoli, oltre che tanta pazienza.

Chi lavora anche full time: se sei un lavoratore full time non ti preoccupare! Potrai seguire le lezioni in completa autonomia nel tuo tempo libero.

Chi vuole crescere professionalmente: Se vuoi elevare la tua carriera Deep Learning Italia ti da l’opportunità di poterlo fare a costi contenuti.

Programma

Reinforcement Learning

    • Model-free Prediction
    • Monte Carlo Prediction: Blackjack Example
    • Temporal-Difference Prediction
    • Example: Random Walk
    • n-step TD Prediction
    • Esercitazione: Reinforcement Learning Prediction

Model-Free Control

      • On-Policy MC Control
      • On-policy TD Control
      • Off-policy Prediction & Control

Esercitazione: Addestramento di un agente
Certificato

Reinforcement Learning

    • Model-free Prediction
    • Monte Carlo Prediction: Blackjack Example
    • Temporal-Difference Prediction
    • Example: Random Walk
    • n-step TD Prediction
    • Esercitazione: Reinforcement Learning Prediction

Model-Free Control

      • On-Policy MC Control
      • On-policy TD Control
      • Off-policy Prediction & Control

Esercitazione: Addestramento di un agente
Certificato

Docenti
maurizio parton
andrea-mercuri.png
Descrizione Docenti

Maurizio Parton

Sono professore associato di matematica all’Università di Chieti-Pescara, dove insegno a Economia, nel corso di laurea in Economia e Informatica per le Imprese. Sono presidente della Federazione Italiana Gioco Go dal 2013.

Mi occupo di intelligenza artificiale dal 28 gennaio 2016, data in cui è apparso per la prima volta AlphaGo.

Da matematico ho potuto fin da subito apprezzare l’immensa potenzialità delle tecniche usate nello sviluppo di AlphaGo e ho cominciato a studiare approfonditamente reti neurali e apprendimento per rinforzo. Da allora ho tenuto corsi per matematici e molteplici conferenze divulgative. Sono profondamente convinto che l’intelligenza artificiale segnerà il nostro futuro, e per questo motivo mi dedico con passione alla disseminazione dei suoi principi fondamentali e tecniche di base.

Andrea Mercuri

Per circa dieci anni ha lavorato come sviluppatore in due società di consulenza romane. In seguito si è iscritto al corso di laurea in Fisica dell’università La Sapienza di Roma, conseguendo una laurea triennale e, successivamente, al corso di Laurea in Matematica per le Applicazioni, conseguendo una laurea magistrale col massimo dei voti. Dal 2015 si occupa di Machine Learning, Deep Learning con un focus particolare in applicazioni di Reinforcement Learning.

 

Vantaggi
  • Puoi seguire il corso dove e quando vuoi: Deep Learning, infatti, ti offre l’opportunità di accedere alla piattaforma in qualsiasi momento tu abbia voglia e possibilità di studiare. Basta semplicemente un dispositivo elettronico e una connessione internet!

  • Troverai sempre materiale nuovo e lezioni aggiornate: i nostri professori ti forniranno moltissimo materiale per supportare i tuoi studi e aggiorneranno periodicamente la piattaforma con nuove slides o con nuovi moduli;

  • Nei nostri corsi troverai sempre una componente interattiva per stimolare l‘apprendimento: giochi, quiz, podcast e tanto altro ti aiuteranno a migliorare e a rendere la tua formazione unica;

  • Non sarai mai solo! Avrai a disposizione la nostra community per metterti in contatto con altri studenti.

  • A fine percorso riceverai una certificazione che potrai aggiungere al tuo CV e che ti darà la possibilità di farti notare da grandi aziende del settore;

  • Se lo vorrai, Deep Learning Italia, ti potrà aiutare a trovare lavoro mettendoti in contatto con le nostre aziende partner.

  • Puoi seguire il corso dove e quando vuoi: Deep Learning, infatti, ti offre l’opportunità di accedere alla piattaforma in qualsiasi momento tu abbia voglia e possibilità di studiare. Basta semplicemente un dispositivo elettronico e una connessione internet!

  • Troverai sempre materiale nuovo e lezioni aggiornate: i nostri professori ti forniranno moltissimo materiale per supportare i tuoi studi e aggiorneranno periodicamente la piattaforma con nuove slides o con nuovi moduli;

  • Nei nostri corsi troverai sempre una componente interattiva per stimolare l‘apprendimento: giochi, quiz, podcast e tanto altro ti aiuteranno a migliorare e a rendere la tua formazione unica;

  • Non sarai mai solo! Avrai a disposizione la nostra community per metterti in contatto con altri studenti.

  • A fine percorso riceverai una certificazione che potrai aggiungere al tuo CV e che ti darà la possibilità di farti notare da grandi aziende del settore;

  • Se lo vorrai, Deep Learning Italia, ti potrà aiutare a trovare lavoro mettendoti in contatto con le nostre aziende partner.

  • Accesso al corso life long
  • Accesso al corso life long
Play Video
80,00 
Durata
9:27
Quiz
0
Accesso life long
si
Certificato
si
slide, github, dataset
si
esercitazioni
si
Prodotti Correlati
Torna in alto