Year:2018   Issue: 29   Area: Econometrics  

Rukiye Şamcı KARADENİZ, Sergey UTEV
EMBEDDING PROBLEM FOR FINANCIAL DATA
 
Aim: The main goal of this research is to analyze whether the discrete time model permits extension or embedding to the continuous time model. Method: In the study, we consider BP day by day closing share prices for four different financial year (April to April) and we suggest modeling them as a random walk on a discrete time Markov Chain perturbed by the Gaussian noise. Also, the share prices of twenty different companies for four different financial years are considered to check embeddability. This research identifies conditions under which a true generator does or does not exist. Results: This study shows that using a continuous time model for volatility is more stable than the original share prices. In addition, considering a small number of carefully chosen states is more reliable. Conclusion: As a result, in general we could not embed the discrete time Markov chain in the continuous time Markov chain. This means that the model we considered should be treated as a discrete time model.

Keywords: Embedding Problem, Tensor Product, Missing Data, Machine Learning, Markov Chain, Share Price, Volatility

Doi: 10.17364/IIB.2018.29.4

FİNANSAL VERİLER İÇİN EMBEDING PROBLEM
 
Giriş: Finans alanında, verileri modellemek için basit ama aynı zamanda gerçekçi bir yol çok önemlidir. Bu nedenle bu çalışmanın verileri olan hisse fiyatları için Gaussian-noisse modeli tarafından üretilen bir Markov zinciri kullanıldı. Bu çalışma, Markov zincirleri için bilinen Embedding problemiyle ilgilidir. Bu problem her zaman kesikli Markov zinciri sürekli zamanlı Markov zincirine dönüşebilir değildir ve bunun olması için gerekli ve yeterli koşullar bilinmemektedir. P, verilerle ilişkili bir (n×n) geçiş matrisi olsun. Buradaki soru, P=e^Q şeklinde bir P’nin Q matrisinin geçiş matrisi olup olmadığıdır. Bu soru Embedding problem olarak adlandırılır. Burada Q matris, üreteç, gerçek üreteç veya yoğunluk matrisidir. Aksi halde Q matrisi gerçek bir üreteç veya tam bir üreteç değildir. Embedding problemini ilk olarak Elfving değerlendirdiği için Elfving’in problemi olarak da bilinir. Elfving, özellikle P’nin öz değerlerinin iki koşulu yerine getirmesi gerektiğini göz önünde bulundurarak, bazı gerekli koşulları vermiştir: (i) birimden başka öz değerin birim modüle sahip olamayacağı (ve böylece P’nin periyodik olmaması gerektiği); (ii) her negatif öz değerin bir çift (cebirsel) çokluğa sahip olması gerekir (Elfving, 1937: 1-17). İlk başlarda, Embedding problem, teorik matematik problemi olarak ele alındı. Daha sonra, 1990'larda, geçiş matrislerinin derecelendirilmesinde kullanılan Embedding problem, finansal matematik literatüründe giderek artan bir ilgi görmüştür (Israel, Rosenthal, Wei, 1999: 245-65). Finans literatürdeki pek çok araştırmacının Embedding problemin çözümünün pozitif olduğunu, yani verilerin sürekli zamanlı Markov sürecinden geldiğini ve üretecinin var olduğunu kabul ettiğini de unutmamak gerekir. Amaç: Bu araştırmanın temel amacı, kesikli zaman modelinin sürekli zaman modeline dönüştürülmesine izin verilip verilmediğini analiz etmektir. Bu çalışmada, BP'nin dört farklı mali yıl (Nisan ayından Nisan ayına) için günlük kapanış hisse bedelini ele aldık ve bunları kesikli zaman Markov zinciri üzerinde rastgele bir yürüyüş olarak modelledik. Ayrıca, bu dönüşümün yapılıp yapılamayacağını kontrol etmek amacı ile dört farklı mali yıl için yirmi farklı şirketin hisse bedellerini ve volatiliteyi de kullandık. Dolayısıyla, rastgele seçilmiş olan yirmi bir farklı şirketin hisse fiyatları kullanılarak bu dönüşümün yapılıp yapılamayacağını kontrol edildi. Veri kümesinin genişletilmesi araştırmayı daha uygun hale getirse de, zaman alıcı olmuştur. Yöntem: Veriler öncelikle Aktüerya literatüründe popüler olan log-lineer regresyon ile modellenmiş ve sonrasında artıklar için Markov zincirleri inşa edilmiştir. Markov zincirlerinin durumlarını tanımlayıp, geçiş olasılıklarını hesapladık. Daha sonra veriler iki kısma ayrılmış ve onların Tansör çarpımı değerlendirilmiştir. Bu Tansör çarpımı, parametre sayısını önemli ölçüde azaltmanın bir yoludur. Buna ek olarak, finansal perspektiften, Tansör çarpım yapısı her bir bileşen için finansal riskten korunmak (hedging) adına büyük önem taşır. Ancak, Tansör çarpım modellemesinin dezavantajı, bu yapı kurulurken veri kaybına (missing data) neden olmasıdır. Bu nedenle, meydana gelen veri kaybı problemini çözmemiz gerekmektedir. Veri kaybı problemini çözmek için, bir parametre tahmin metodu olan Beklenti-Maksimizasyon (EM) algoritmasını ve bir veri atama metodu olan Makine Öğrenme algoritmasını (C4.5) uyguladık. Özetle, bu makalenin amacı, ayrık zaman modelinin sürekli zaman modelinde dönüştürülmesine izin verip vermediğini analiz etmekti. Model sürekli bir zaman modeline dönüştürülürse, sonuç (veri) her seferinde gözlemlenebilir olduğu anlamına gelir. Bu, finansal sektörde makul ve önemli bir yöntemdir. Model sürekli bir zaman modeliyse, modele seçenek fiyatlandırması gibi birçok mevcut formül uygulanabilir. Çalışmamızda Embedding problemi, ele aldığımız verilere uygulayarak analiz ediyoruz. Genel olarak, bu araştırma finansal veriler ve onların volatilitesi için Embedding probleminin analizinin yapıldığı kapsamlı bir durum çalışmasıdır. Ayrıca çalışma Embedding probleminin önemini gösteren gerçek bir finansal uygulama sunar. Sonuç: Volatilite için sürekli bir zaman modeli kullanılması orijinal hisse fiyatlarından daha istikrarlı olduğunu göstermektedir. Ayrıca, az sayıda dikkatle seçilmiş Markov zincir durumunun ele alınması daha güvenilirdir. Sonuç olarak, kesikli zaman Markov zincirini sürekli zaman Markov zincirine dönüştüremedik. Böylece ele aldığımız modelin kesikli bir zaman modeli olarak değerlendirilmesi gerektiğini söyleyebiliriz.

Anahtar Kelimeler: Embedding Problem, Tansör Çarpımı, Missing Data, Makine Öğrenmesi, Markov Zinciri, Hisse Bedeli, Volatilite

Doi: 10.17364/IIB.2018.29.4

Tam Metin