Science4All | L'intelligence ultime (AIXI) @le_science4all | Uploaded 3 years ago | Updated 2 hours ago
AIXI est un algorithme (non-calculable) proposé par Marcus Hutter pour résoudre le problème de l'apprentissage par renforcement, en supposant un a priori bayésien. Il est souvent reconnu comme étant la forme ultime d'intelligence (ou en tout cas de maximisation de prises de décision sous incertitude).
Script + sources : docs.google.com/document/d/e/2PACX-1vQ5SC9GmHtj2LrCoabKR8I0CppxLRtntgQtNwsHHKrJHKyPH0cADyIRTxSF8dNuU3AJ2FAPN-upxXkc/pub
2:13 L'apprentissage par renforcement
5:05 Récompenses futures, espérées et escomptées
8:17 L'optimisation contrafactuelle de politiques
10:31 Newcomb... et la limite fatale à AIXI ?
11:25 Quel objectif ?
Twitter : twitter.com/le_science4all
Facebook : facebook.com/Science4Allorg
Mes goodies : https://shop.spreadshirt.fr/science4all
La formule du savoir (mon 1er livre) :
https://laboutique.edpsciences.fr/produit/1035/9782759822614/La%20formule%20du%20savoir
Le fabuleux chantier (mon 2e livre, avec El Mahdi El Mhamdi) :
https://laboutique.edpsciences.fr/produit/1107/9782759824304/Le%20fabuleux%20chantier
Turing à la plage (mon 3e livre, avec Rachid Guerraoui) :
dunod.com/sciences-techniques/turing-plage-intelligence-artificielle-dans-un-transat
Probablement? en audio : http://playlists.podmytube.com/UC0NCbj8CxzeCGIF6sODJ-7A/PLtzmb84AoqRQ0ikLb4yC4lKgjeDEIpE1i.xml
Moi en podcast avec Mr Phi :
Version YouTube : youtube.com/channel/UCNHFiyWgsnaSOsMtSoV_Q1A
Version Audio : http://feeds.feedburner.com/Axiome
Sous-titres sur les autres vidéos : http://www.youtube.com/timedtext_cs_panel?tab=2&c=UC0NCbj8CxzeCGIF6sODJ-7A
AIXI est un algorithme (non-calculable) proposé par Marcus Hutter pour résoudre le problème de l'apprentissage par renforcement, en supposant un a priori bayésien. Il est souvent reconnu comme étant la forme ultime d'intelligence (ou en tout cas de maximisation de prises de décision sous incertitude).
Script + sources : docs.google.com/document/d/e/2PACX-1vQ5SC9GmHtj2LrCoabKR8I0CppxLRtntgQtNwsHHKrJHKyPH0cADyIRTxSF8dNuU3AJ2FAPN-upxXkc/pub
2:13 L'apprentissage par renforcement
5:05 Récompenses futures, espérées et escomptées
8:17 L'optimisation contrafactuelle de politiques
10:31 Newcomb... et la limite fatale à AIXI ?
11:25 Quel objectif ?
Twitter : twitter.com/le_science4all
Facebook : facebook.com/Science4Allorg
Mes goodies : https://shop.spreadshirt.fr/science4all
La formule du savoir (mon 1er livre) :
https://laboutique.edpsciences.fr/produit/1035/9782759822614/La%20formule%20du%20savoir
Le fabuleux chantier (mon 2e livre, avec El Mahdi El Mhamdi) :
https://laboutique.edpsciences.fr/produit/1107/9782759824304/Le%20fabuleux%20chantier
Turing à la plage (mon 3e livre, avec Rachid Guerraoui) :
dunod.com/sciences-techniques/turing-plage-intelligence-artificielle-dans-un-transat
Probablement? en audio : http://playlists.podmytube.com/UC0NCbj8CxzeCGIF6sODJ-7A/PLtzmb84AoqRQ0ikLb4yC4lKgjeDEIpE1i.xml
Moi en podcast avec Mr Phi :
Version YouTube : youtube.com/channel/UCNHFiyWgsnaSOsMtSoV_Q1A
Version Audio : http://feeds.feedburner.com/Axiome
Sous-titres sur les autres vidéos : http://www.youtube.com/timedtext_cs_panel?tab=2&c=UC0NCbj8CxzeCGIF6sODJ-7A