MODÜLER BULANIK TAKVİYELİ ÖĞRENME

Yüksek Lisans Tezi

MODÜLER BULANIK TAKVİYELİ ÖĞRENME

İrfan GÜLTEKİN

Fırat Üniversitesi

Fen Bilimleri Enstitüsü

Bilgisayar Mühendisliği Anabilim Dalı

2002, Sayfa: 47

Çoklu etmenli sistemlerdeki takviyeli  öğrenme uygulamaları son zamanlarda oldukça ilgi çekmiştir. Çoklu etmenli sistemlerde, durum uzayının fazla olması etmenlerin öğrenmesinde büyük problem teşkil eder. Aynı ortamdaki etmenlerin birlikte hareket etmesi için, çoklu etmenli sistemlerdeki etmenlerin birbirlerinin hareketlerini değerlendirmesi ve gözlemlemesi gerekir. Bu durumda durum uzayının boyutu etmen sayısıyla eksporansiyel olarak artar.

Bu tezde bu problemin çözümü için yeni bir yöntem sunulacaktır. Bu yöntemde çoklu etmenli sistemlerde, modüler mimari, dahili modelin tahmini ve bulanık mantığın avantajları birlikte kullanılmıştır. Geliştirilen koordinasyon yöntemi bir etmenin, diğer etmenlerin dahili modellerine göre hareketlerinin tahminine dayanır. Dahili model diğer etmenlerin hareketlerinin gözlemlenmesi ve değerlendirilmesi ile oluşturulur. Bulanık mantık, her öğrenme modülünün durum uzayından oluşturulan bulanık giriş kümelerinden ve hareket uzayından oluşturulan bulanık çıkış kümelerinden oluşturulur. Her öğrenme modülünün bulanık kural tabanı Q – öğrenme doğrultusunda yapılandırılır. Deneysel sonuçlar, durum uzayında gerçekleştirilen uygulamanın geçerliliğini göstermek için sunulmuştur.

Anahtar kelimeler: Yapay zekâ, takviyeli öğrenme, Q öğrenme, modüler mimari, markov karar verme süreci, dahili modelin tahmini, bulanık mantık, modüler bulanık-takviyeli öğrenme.

 

TEZE ULAŞABİLMEK İÇİN TIKLAYIN

Posted in Uncategorised.

Bir cevap yazın