Q -learning on tekoälyssä käytetty menetelmä agenttipohjaisella lähestymistavalla . Viittaa vahvistusoppimiskokeisiin . Agentti muodostaa ympäristöstä saamansa palkkion perusteella hyödyllisyysfunktion Q, joka antaa hänelle myöhemmin mahdollisuuden olla valitsematta satunnaisesti käyttäytymisstrategiaa, vaan ottaa huomioon aikaisemman vuorovaikutuksen ympäristön kanssa. Yksi Q-learningin eduista on, että se pystyy vertailemaan käytettävissä olevien toimintojen odotettua hyödyllisyyttä ilman, että ympäristöä tarvitsee mallintaa. Koskee tilanteita, jotka voidaan esittää Markovin päätösprosessina .
Koneoppiminen ja tiedon louhinta | |
---|---|
Tehtävät | |
Opettajan kanssa oppimista | |
ryhmäanalyysi | |
Mittasuhteiden vähentäminen | |
Rakenteellinen ennustaminen | |
Anomalian havaitseminen | |
Piirrä todennäköisyysmallit | |
Neuroverkot | |
Vahvistusoppiminen |
|
Teoria | |
Lehdet ja konferenssit |
|