Skip to content

Commit e09630a

Browse files
authored
Update README.md
1 parent 8f08e30 commit e09630a

File tree

1 file changed

+2
-2
lines changed

1 file changed

+2
-2
lines changed

README.md

Lines changed: 2 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -83,7 +83,7 @@ In particolare, svilupperemo l'algorimo Semi-Gradient one step SARSA, con modell
8383
>File : [Value_Function_Approximation_parte1_RL_ITA](https://github.com/MarioFiorino/Tutorial-Reinforcement-Learning-ITA-Python/blob/main/Value_Function_Approximation_parte1_RL_ITA.ipynb)
8484
8585

86-
Nel notebook successivo un'implementazione dell'algoritmo Deep Q Networks, contesto MsPacman(Atari), con Convolutional neural network(CNN).
86+
Nel notebook successivo un'implementazione dell'algoritmo Deep Q Networks, contesto MsPacman(Atari), con Convolutional neural network(CNN); ed un introduzione al concetto di: Experience Replay.
8787

8888
>File : [Value_Function_Approximation_parte2_RL_ITA](https://github.com/MarioFiorino/Tutorial-Reinforcement-Learning-ITA-Python/blob/main/Value_Function_Approximation_parte2_RL_ITA.ipynb)
8989
@@ -107,7 +107,7 @@ Nel notebook sottostante sono presentati i metodi policy-based, in particolare i
107107
>File : [Policy_Gradient_ITA](https://github.com/MarioFiorino/Tutorial-Reinforcement-Learning-ITA-Python/blob/main/Policy_Gradient__ITA.ipynb)
108108
109109

110-
Nel prossimo notebook troverete un'introduzione agli algoritmi Actor-Critic, una loro implementazione per la risoluzione dell'ambiente Pendulum(Gym); e un primo accenno alla tecnica di Entropy regularization.
110+
Nel prossimo notebook troverete un'introduzione agli algoritmi Actor-Critic, una loro implementazione per la risoluzione dell'ambiente Pendulum(Gym); un approfondimento al dilemma "Varianza-Bias"; poi un introduzione ai concetti: Advantage Function, ed, Entropy Regularization.
111111

112112
>File : [Actor_Critic_ITA](https://github.com/MarioFiorino/Tutorial-Reinforcement-Learning-ITA-Python/blob/main/Actor_Critic_ITA.ipynb)
113113

0 commit comments

Comments
 (0)