Markov Karar Süreci (MDP)

Yazar: Laura McKinney
Yaratılış Tarihi: 5 Nisan 2021
Güncelleme Tarihi: 22 Haziran 2024
Anonim
Markov Karar Süreci (MDP) - Teknoloji
Markov Karar Süreci (MDP) - Teknoloji

İçerik

Tanım - Markov Karar Süreci (MDP) ne anlama geliyor?

Markov karar süreci (MDP), profesyonellerin “ayrık zamanlı stokastik kontrol süreci” olarak adlandırdığı bir şeydir. 19. yüzyılın sonlarında ve 20. yüzyılın başlarında Rus akademik Andrey Markov'un öncülüğü matematiğe dayanmaktadır.


Microsoft Azure ve Microsoft Cloud'a Giriş | Bu kılavuz boyunca, bulut bilişimin neyle ilgili olduğunu ve Microsoft Azure'un işinizi buluttan geçirmenize ve yürütmenize nasıl yardımcı olabileceğini öğreneceksiniz.

Techopedia Markov Karar Sürecini (MDP) Açıklıyor

Bir Markov karar sürecini ve ilişkili Markov zincirlerini açıklamanın bir yolu, bunların, birkaç yıl önce Rus bilim insanı tarafından daha basit matematiksel araştırmalara dayanan modern oyun teorisi unsurları olmasıdır. Bir Markov karar sürecinin açıklaması, bir sistemin belirli bir dizi durumda olduğu bir senaryoyu incelemesi ve bir karar vericinin kararlarına dayanarak başka bir duruma ilerlemesidir.

Model olarak bir Markov zinciri, belirli bir olayın olasılığının önceden elde edilmiş bir duruma bağlı olduğu bir olay dizisini gösterir. Profesyoneller, Markov karar sürecini tanımlarken “sayılabilir bir devlet alanı” hakkında konuşabilirler - bazıları Markov karar modeli fikrini “rastgele yürüyüş” modeli ya da olasılıklara dayanan diğer rassal yürüyüş modeliyle ilişkilendirir (genellikle Duvarda belirtilen rastgele yürüyüş modeli) Street, bir hisse senedinin piyasa olasılığına bağlı olarak aşağı veya yukarı hareketini modellemektedir).


Genel olarak, Markov karar süreçleri genellikle profesyonellerin bugün üzerinde çalıştığı en gelişmiş teknolojilerin bazılarına, örneğin robotik, otomasyon ve araştırma modellerinde uygulanır.