πŸ’»/ML

[λ¨Έμ‹ λŸ¬λ‹] κ°•ν™”ν•™μŠ΅

ruhz 2020. 11. 6. 17:32

μ•žμ—μ„œ Neural Network에 λŒ€ν•΄ λ‹€λ€˜λ˜ 것은, κ°•ν™”ν•™μŠ΅μ΄ μ—¬νƒœ ν–ˆλ˜ 것에 μ—°μž₯선은 μ•„λ‹ˆμ§€λ§Œ κ²°κ΅­ 고도화 λ˜λ©΄μ„œ 신경망을 μ‚¬μš©ν•˜κΈ° λ•Œλ¬Έμ΄λ‹€. μ²˜μŒμ— λ¬΄μž‘μ • κ°•ν™”ν•™μŠ΅μ— λ€λ³λ”λ‹ˆ μ½”λ“œμ— μžˆλŠ” 신경망을 이해할 수 μ—†μ—ˆκ³ , 신경망을 μ•Œλ €λ‹ˆ κ²°κ΅­ λ”₯λŸ¬λ‹μ˜ 기초적인 뢀뢄에 λŒ€ν•΄ 곡뢀해야 ν–ˆλ‹€. 덕뢄에 정말 μ½”λ“œλ₯Ό μ—¬λŸ¬λ²ˆ ν…ŒμŠ€νŠΈλ₯Ό ν•˜λ©° μ’Œμ ˆκ°λ„ 맛봀닀. ν•˜μ§€λ§Œ κ°•ν™”ν•™μŠ΅μ΄ κ²°κ΅­ μ—μ΄μ „νŠΈκ°€ λ‹€μ–‘ν•œ κ²½ν—˜μ„ ν•˜λ©° μ‹€λ§ˆλ¦¬λ₯Ό μ°Ύμ•„λ‚˜κ°€λŠ” ν•™μŠ΅λ°©λ²•μ΄ μ•„λ‹ˆκ² λŠ”κ°€!

 

사싀 μ•„λž˜ μžλ£Œλ“€ 보닀 더 κ³ ν†΅μŠ€λŸ½κ²Œ 자료λ₯Ό λ’€μ‘Œμ§€λ§Œ 그건 λ‚˜μ€‘μ— μ—¬μœ κ°€ 되면 ν¬μŠ€νŒ…ν•˜κ³ , 일단은 봀던 μžλ£Œλ“€ 쀑 μ’‹μ•˜λ˜ μžλ£Œλ“€μ„ 링크둜 λͺ¨μ•„λ†“μ•˜λ‹€. κ°œλ…μ„ μ΄ν•΄ν•˜κ³  μ˜ˆμ œμ½”λ“œλ₯Ό ν•œ 쀄 ν•œ 쀄 λœ―μ–΄λ³΄λ©΄ 쒋을 것 κ°™λ‹€. νŠΉμ„±μƒ μ˜ˆμ œμ½”λ“œλ³„ 버전 μ°¨μ΄μ—μ„œ μ˜€λŠ” 였λ₯˜κ°€ λ§ŽμœΌλ‹ˆ, κ΅¬κΈ€μ΄λ‚˜ stackoverflowλ₯Ό 잘 뒀져보며 돌리자.

 

 

κ°•ν™”ν•™μŠ΅ 기초

κ°•ν™”ν•™μŠ΅ κ°œλ…

κ°•ν™”ν•™μŠ΅ μ˜ˆμ œμ½”λ“œ

 


DQN

DQN κ°œλ…

Deep SARSA κ°œλ…

DQN μ˜ˆμ œμ½”λ“œ

Deep SARSA μ˜ˆμ œμ½”λ“œ

 

 

A3C

A3C κ°œλ…