Geleceği En İyi Gören Yapay Zekâ Modeli Hangisi?

Geleceği En İyi Gören Yapay Zekâ Modeli Hangisi?

Gelecekte ne olabileceğini tahmin etmek, çok uzun zamandır insanlığı düşündüren, merak uyandıran bir konudur (Aladağ, 2017). “Yarın yağmur yağıp yağmayacağı”, “gelecekte ne zaman büyük bir deprem meydana gelebileceği” ya da “ekonomide ne zaman bir kriz yaşanabileceği” gibi soruların cevapları daima merak uyandırmış ve insanlığı bu ve bunun gibi soruların cevaplarını aramaya yöneltmiştir. Tarihte krallar, padişahlar, devlet adamları, komutanlar ve bilim adamları başta olmak üzere birçok insan geleceği tahmin etmeye çalışmıştır. Bazen bilimsel bir bakış açısıyla, bazen de farklı inançlara göre doğaüstü güçlerle, gelecekte ne olacağı sorusunun yanıtı aranmıştır hep. Hangi yöntemle olursa olsun yapılan gelecek tahminlerine göre, bazen bir ülkenin kaderini belirleyecek ekonomik bir hamle, bazen çok büyük bir savaşın sonucunu şekillendirecek stratejik bir müdahale yapılmıştır. İnsanlık tarihi yapılan gelecek tahminleri doğrultusunda verilen büyük veya küçük kararlarla doludur. (Aladağ, 2009)

İnsanlık tarihi yapılan gelecek tahminleri doğrultusunda verilen büyük veya küçük kararlarla doludur.

Günümüzde, artan teknolojik olanaklar doğrultusunda giderek zorlaşan rekabet koşulları, bireylerin, işletmelerin, kurumların ya da ülkelerin “Gelecekte ne olabilir?” sorusunun cevabını daha büyük bir iştahla araştırmalarına neden olmaktadır. Günümüz rekabet koşullarında, en iyi stratejileri belirleyebilmek için geleceğe yönelik tahminler elde edebilmek amacıyla birçok yöntem geliştirilmiş ve geliştirilmektedir. Gelecek olayları ya da koşulları tahmin etmeye öngörü denir. Farklı disiplinlerden araştırmacılar daha güvenilir öngörüler elde edebilmek için çeşitli yöntemler üretmekte ya da mevcut yöntemleri daha da iyileştirmek için çalışmaktadırlar. (Aladağ, 2009)

Gelecek tahmini elde etmek amacıyla üzerinde en çok çalışılan veri türlerinden biri zaman serileridir. Olayların zaman içinde gözlemlenmesi ile elde edilen ölçümlerin oluşturduğu serilere zaman serileri denir (Günay vd., 2007). Belli bir zaman aralığında, havadaki kirlilik oranı, su tüketimi, elektrik tüketimi, bir ülkeye gelen turist sayısı, bir hastaneye gelen hasta sayısı, kişi başına düşen milli gelir, işsizlik oranı, rüzgâr şiddeti, hava sıcaklığı, borsa değerleri, fiyat tahmini, e-ticaret verileri ve bunlar gibi farklı zaman serileri için öngörüler elde etmek amacıyla çeşitli matematiksel modeller kullanılmaktadır (Tokgozoglu vd., 2021). Zaman serileri öngörü yöntemlerinin temel dayanak noktası, geçmişte gözlemlenen değerler göz önünde bulundurularak oluşturulan modelle gelecek tahminleri yapmaktır (Aladağ vd., 2009). Öncelikle gözlemlenmiş zaman serisi değerlerini en iyi temsil eden istatistiksel ya da makine öğrenme temelli model oluşturulur. Daha sonra oluşturulan bu model kullanılarak gelecek için tahminler elde edilir.

Günümüzde zaman serileri analiz edilip gelecek öngörüleri elde edilirken kullanılan yaklaşımlar, ARIMA gibi istatistik temelli modellerden (Box ve Jenkins, 1970), Yapay Sinir Ağları (Gündoğdu vd., 2016) veya Bulanık Zaman serileri (Güney vd., 2018) gibi makine öğrenme temelli modellere ya da tüm bu modellerin akıllı birleşimlerinden oluşan melez modellere (Aladağ, 2014) kadar büyük bir çeşitlilik göstermektedir. Gün geçtikçe, daha güvenilir öngörüler elde etmek amacıyla çok çeşitli yeni yaklaşımlar literatürde yer almaktadır (Aladağ ve Potas, 2022).

Literatürde geliştirilen bunca çeşitli öngörü yaklaşımları için ortak ve çok önemli bir sorun vardır. Kullanılan öngörü yöntemi istatistik ya da makine öğrenme temelli olsun, herhangi bir bulanık zaman serisi ya da derin öğrenme modeli olsun karşılaşılan en hayati sorun, modelden üretilen öngörülerin gerçeği ne kadar iyi yakaladığının nasıl ortaya konulacağı yani, kullanılan modelin ne kadar güvenilir öngörüler verdiğinin nasıl ölçüleceğidir. Bir başka ifadeyle, en iyi öngörüleri veren modelin nasıl seçileceği en önemli problemdir (Aladağ, 2019).

En hayati sorun kullanılan modelin ne kadar güvenilir öngörüler verdiğinin nasıl ölçüleceğidir.

Herhangi bir zaman serisi için çeşitli modellerin öngörü performansı yani, ne kadar iyi, ne kadar güvenilir öngörüler ürettiği bir performans ölçütü tarafından belirlenir. En iyi öngörü modelinin belirlenmesi çok önemli problem olduğu için literatürde bu konu üzerinde yapılmış birçok çalışma mevcuttur (Aladağ, 2017). En iyi modelin belirlenmesinde yaygın olarak kullanılan bazı performans ölçütleri aşağıda verilmiştir.

Akaike bilgi kriteri (Akaike information criterion, AIC):

AIC, hem modelin uyumunu hem de karmaşıklığını dikkate alarak optimal bir denge sağlamayı hedefler. AIC, 1970’lerde Hirotugu Akaike tarafından geliştirilmiştir. Temel fikir, bir modelin verilere uyum sağlama yeteneğinin, modelin karmaşıklığından ne kadar “maliyetli” olduğunu değerlendirmektir. AIC, hem modelin uyumunu ölçen bir terim hem de modelin karmaşıklığını cezalandıran bir terim içerir.

AIC’nin formülü aşağıdaki gibidir:

AIC = -2 * log-likelihood + 2 * k

Burada, log-likelihood, modelin veriye uyumunu ölçen logaritmik olabilirlik fonksiyonudur. k, modelin serbestlik derecesini temsil eder, yani kullanılan parametre sayısıdır.

AIC, model seçimi için kullanılan bir istatistiksel ölçüdür. AIC değeri, daha düşük olması tercih edilen bir değerdir. Daha düşük AIC değeri, daha iyi bir model uyumunu ve daha az karmaşık bir modeli gösterir. AIC kullanılarak farklı modeller karşılaştırılır ve en küçük AIC değeri olan model tercih edilir.

AIC’nin avantajlarından biri, farklı model türlerini ve karmaşıklıklarını karşılaştırabilmesidir. Ancak AIC, bazen özel durumlar için yanlı sonuçlar verebilir ve gerçek modele tam olarak uymaz. Bu nedenle, model seçimi için tek başına kullanılmamalıdır. Diğer kriterler ve analiz yöntemleriyle birlikte değerlendirme yapmak önemlidir.

Bayesian bilgi kriteri (Bayesian information criterion, BIC):

BIC, veriye en uygun olan modelin hem iyi bir uyum sağlamasını hem de basitlik ilkesine uymasını dikkate alır. BIC, Akaike Bilgi Kriteri’ne (AIC) benzer bir kriterdir, ancak daha fazla parametre içeren modellerin cezalandırılmasında daha kesin bir yaklaşım kullanır. BIC’nin amacı, karmaşık modellerin aşırı uyum yapmasını önlemek ve daha basit modelleri tercih etmektir.

BIC, bir modelin kalitesini ölçmek için iki bileşeni kullanır: uyum terimi ve parametre cezası terimi. Uyum terimi, modelin veriye olan uyumunu ölçerken, parametre cezası terimi modelin karmaşıklığını göz önünde bulundurur. BIC değeri, düşük değere sahip olan modelin tercih edilmesini sağlar.

BIC’nin formülü aşağıdaki gibidir:

BIC = -2 * log-likelihood + k * log(n)

Burada, log-likelihood, modelin veriye uyumunu ölçen logaritmik olabilirlik fonksiyonudur. k, modelin serbestlik derecesini temsil eder (yani, kullanılan parametre sayısıdır) ve n, veri noktalarının sayısıdır.

BIC, model seçimi için kullanılan yaygın bir kriterdir ve genellikle maksimum olabilirlik tahminine dayalı istatistiksel modellerin seçiminde tercih edilen bir ölçüdür. Daha düşük BIC değeri, daha iyi bir model uyumunu ve daha basit bir modeli gösterir.

Ortalama Kare Hatası (Mean Square Error, MSE):

Gerçek değerler ile tahmin edilen değerler arasındaki farkların karelerinin ortalamasıdır. MSE, MAE’ye benzer şekilde tahmin hatalarının büyüklüğünü ölçer, ancak büyük hataların daha fazla ağırlığı vardır. Ayrıca, tahmin edilen değerlerin gerçek değerlere göre hata miktarını ölçer.

Yine MSE, gerçek değerlerle tahmin edilen değerler arasındaki farkların karelerinin ortalamasını alır. Aşağıdaki formülle gösterilebilir:

MSE = (1/n) * Σ(Gerçek Değer — Tahmin Değeri)²

Burada n, gözlem sayısını temsil eder ve Σ sembolü, tüm gözlemler için toplamın alındığını ifade eder.

MSE, tahmin hatalarının büyüklüğünü ölçer. Karelerin alınması, hataların pozitif veya negatif olmasına bakılmaksızın tüm hataları pozitif değerlere dönüştürür ve büyük hataların daha fazla ağırlığı olduğunu gösterir. MSE değeri ne kadar düşükse, tahmin modelinin daha iyi performans gösterdiği anlamına gelir.

MSE, orijinal veri birimlerinden bağımsız olarak kareli hata miktarını ölçer. Bu nedenle, RMSE (Kök Ortalama Kare Hatası) ile birlikte kullanılarak tahminlerin orijinal veri birimlerinde değerlendirilmesi tercih edilebilir.

MSE, zaman serileri analizinde yaygın olarak kullanılan bir performans ölçütüdür. Ancak, MSE değeri, hataların büyüklüğünün ölçeğine bağlı olarak değişebilir ve farklı veri setleri arasında doğrudan karşılaştırma yapmak için dikkatlice kullanılmalıdır. MSE, diğer ölçütlerle birlikte kullanılarak tahmin modellerinin doğruluğunu değerlendirmek için kullanılır.

Kök Ortalama Kare Hatası (Root Mean Square Error, RMSE):

MSE’nin karekökü alınarak elde edilir. RMSE, tahmin hatalarının standart sapmasını ölçer ve orijinal veri birimleri üzerinde yorumlanabilir. Ayrıca, tahmin edilen değerlerin gerçek değerlere göre hata miktarını ölçer.

Buna ek olarak, gerçek değerlerle tahmin edilen değerler arasındaki farkların karelerinin ortalamasını alır ve sonucun karekökünü alarak hesaplanır. Aşağıdaki formülle gösterilebilir:

RMSE = √((1/n) * Σ(Gerçek Değer — Tahmin Değeri)²)

Burada n, gözlem sayısını temsil eder ve Σ sembolü, tüm gözlemler için toplamın alındığını ifade eder.

RMSE, ölçeği orijinal veri birimlerinde değerlendirmeyi sağlar. Bu nedenle, RMSE değeri, tahmin modelinin gerçek değerlere göre ne kadar hata yaptığını daha kolay yorumlamamıza yardımcı olur. RMSE değeri ne kadar düşükse, tahmin modelinin daha iyi performans gösterdiği anlamına gelir.

RMSE, özellikle büyük hataların daha fazla ağırlığı olduğu durumlarda kullanışlıdır. Karelerin alınması nedeniyle büyük hataların daha belirgin bir etkisi vardır. Bununla birlikte, RMSE değeri, hataların büyüklüğünün ölçeğine bağlı olarak değişebilir ve bu nedenle farklı veri setleri arasında doğrudan karşılaştırma yapmak için dikkatlice kullanılmalıdır.

RMSE, zaman serileri analizinde yaygın olarak kullanılan bir performans ölçütüdür ve tahmin modellerinin doğruluğunu değerlendirmek için diğer ölçütlerle birlikte de kullanılır.

RMSE, zaman serileri analizinde yaygın olarak kullanılan bir performans ölçütüdür.

Ortalama Mutlak Hata (Mean Absolute Error, MAE):

Gerçek değerler ile tahmin edilen değerler arasındaki mutlak farkların ortalamasıdır. MAE, tahmin hatalarının büyüklüğünü ölçer ve düşük bir MAE değeri, daha iyi bir tahmin performansını gösterir. Buna ek olarak, tahmin edilen değerlerin gerçek değerlere göre ortalama hata miktarını ölçer.

MAE, gerçek değerlerle tahmin edilen değerler arasındaki mutlak farkları alır ve bu farkların ortalamasını hesaplar. Aşağıdaki formülle gösterilebilir:

MAE = (1/n) * Σ|Gerçek Değer — Tahmin Değeri|

Burada n, gözlem sayısını temsil eder ve Σ sembolü, tüm gözlemler için toplamın alındığını ifade eder.

MAE, hataların mutlak değerlerini kullanır, yani pozitif veya negatif hataların önemi arasında ayrım yapmaz. Bu nedenle, MAE, hataların büyüklüğünü doğrudan yansıtır. MAE değeri ne kadar düşükse, tahmin modelinin daha iyi performans gösterdiği anlamına gelir.

MAE, orijinal veri birimlerinde değerlendirilir, bu nedenle tahminlerin orijinal veri birimlerinde anlamlı bir ölçüm sağlar. Aynı zamanda, MAE, büyük hataların etkisini yumuşatır, çünkü mutlak değerler kullanılır.

Ortalama Mutlak Hata Yüzdesi (Mean Absolute Percentage Error, MAPE):

Gerçek değerlere göre tahmin hatalarının yüzdesel farklarının ortalamasıdır. MAPE, tahmin hatalarını orantılı olarak değerlendirir ve ölçeklendirme etkisini azaltır. Tahmin edilen değerlerin gerçek değerlere göre yüzde olarak ne kadar hata yaptığını ölçer.

MAPE, gerçek değerlerle tahmin edilen değerler arasındaki mutlak farkları gerçek değerlere göre yüzde olarak ifade eder ve bu farkların ortalamasını alır. Aşağıdaki formülle hesaplanır:

MAPE = (1/n) * Σ |(Gerçek Değer — Tahmin Değeri) / Gerçek Değer| * 100

Burada n, gözlem sayısını temsil eder ve Σ sembolü, tüm gözlemler için toplamın alındığını ifade eder.

MAPE’nin yüzde cinsinden ifade edildiği unutulmamalıdır. Yüzde olarak ifade edilen bir oran olduğu için, 0 ile sonsuz arasında bir değer alır. MAPE değeri ne kadar düşükse, tahmin modelinin daha iyi performans gösterdiği anlamına gelir. Ancak, MAPE değeri bazen sıfır olan gerçek değerlerden kaynaklanan bölme sorunları nedeniyle sınırlı bir kullanımı vardır. Bu nedenle, MAPE’nin sıfır olan gerçek değerlere karşı hassas olduğunu unutmamak önemlidir.

MAPE, zaman serileri tahminlerinin doğruluğunu değerlendirmek için kullanılan faydalı bir ölçüttür. Ancak, bazen yüzde oranlarının yorumlanması zor olabilir ve mutlak değerlere dayalı ölçütlerle birlikte kullanılması daha geniş bir perspektif sunabilir.

Ortanca Mutlak Hata Yüzdesi (Median Absolute Percentage Error, MdAPE):

MdAPE, tahmin edilen değerlerin gerçek değerlere göre yüzde olarak medyan hata miktarını ölçer. MdAPE, gerçek değerlerle tahmin edilen değerler arasındaki mutlak farkları gerçek değerlere göre yüzde olarak ifade eder ve bu farkların medyanını alır. Aşağıdaki formülle hesaplanır:

MdAPE = Median(|(Gerçek Değer — Tahmin Değeri) / Gerçek Değer|) * 100

MdAPE, yüzde cinsinden ifade edilen bir orandır ve 0 ile 100 arasında bir değer alır. Medyan kullanılması, tahmin hatalarının dağılımında aykırı değerlerin etkisini azaltır ve daha dirençli bir ölçüt sağlar.

MdAPE, MAPE kriterine benzer bir ölçüttür, ancak medyan kullanılarak hesaplandığı için daha dirençli bir ölçüdür. Aykırı değerlerin etkisi daha azdır ve tahminlerin yüzde hata miktarının daha dengeli bir ölçümünü sunar. Diğer performans ölçütleriyle birlikte kullanılarak daha kapsamlı bir değerlendirme sağlar.

Yön Sağlamlığı (Direction Accuracy, DA):

Yön sağlamlığı kriteri, tahmin edilen değerlerin gerçek değerlerin yönünü doğru bir şekilde tahmin etme yeteneğini ölçer.

Zaman serileri analizinde genellikle bir sonraki adımın yönünü tahmin etmek önemlidir. Örneğin, hisse senedi fiyatları üzerinde çalışırken, yatırımcılar gelecekteki fiyat hareketinin yönünü tahmin etmek isteyebilirler. Bu durumda, yön sağlamlığı ölçütü, tahmin edilen yönün gerçek yönle ne kadar uyumlu olduğunu değerlendirir.

Yön sağlamlığı, genellikle doğru yön tahminlerinin toplam gözlem sayısına oranı olarak ifade edilir. Yüzde cinsinden ifade edilen bir orandır ve %0 ile %100 arasında değer alır. Yüzde 50’lik bir yön sağlamlığı, rastgele tahmin etmekle aynı performansı gösterirken, yüzde 100’e yaklaşan bir yön sağlamlığı, tahmin modelinin gerçek yönleri mükemmel bir şekilde tahmin ettiğini gösterir.

Yön sağlamlığı, diğer performans ölçütleriyle birlikte kullanılarak bir tahmin modelinin başarısını daha kapsamlı bir şekilde değerlendirmeye yardımcı olur. Ancak, yön sağlamlığı tek başına yeterli bir ölçüt değildir. Zaman serileri analizinde kullanılan diğer ölçütlerle birlikte değerlendirme yapmak daha sağlıklı sonuçlar elde etmemizi sağlar.

Geleceği tahmin etmek amacıyla yapılan zaman serileri analizlerinde, en güvenilir gelecek öngörülerini üreten modeli seçmek için yukarıda verilen performans ölçütleri sıklıkla kullanılmaktadır. Ek olarak, yukarıda verilen performans ölçütleri dışında da literatürde önerilen yine pek çok çeşitli ölçüt bulunmaktadır. Yukarıda açıklandığı gibi, performans ölçütleri modelin ürettiği tahminler ile bunlara karşılık gelen, gerçekleşen/gözlenen değerler arasındaki farkı yani, hatayı ölçmektedir. Ve dikkat edilirse, her performans ölçütü bahsedilen hatayı farklı bir şekilde hesaplamaktadır. Buna göre, uygulamalarda kullanılan performans ölçütüne göre seçilen en iyi model yani, en iyi öngörüleri vermesi beklenen model değişebilmektedir. Bir başka ifadeyle, aynı veri seti için bile her farklı performans ölçütü farklı bir modeli en iyi model olarak belirleyebilir. Ve literatürde kullanılabilecek onlarca farklı performans ölçütü mevcuttur. Tam bu nokta hayati önemde bir soru ortaya çıkar:

En iyi modeli belirlemek için hangi performans ölçütü kullanılmalıdır?

Aynı veri seti için bile her farklı performans ölçütü farklı bir modeli en iyi model olarak belirleyebilir

Bir örnek üzerinde anlatılanları açıklamaya çalışalım. Günümüzün en önemli ve popüler alanlarından olan e-ticaret ile ilgili bir uygulama düşünülsün. Bu önemli uygulama alanında, Artifica yapay zeka yazılım geliştirme şirketiyle (Artifica.io, 2023) üzerinde beraber çalıştığımız bir projeden örnek vermek istiyorum. Örneğin, bir X ürününün fiyat tahmini elde edilmek istensin. Bu amaçla, yapay sinir ağları yaklaşımı kullanılsın. Kullanılacak yapay sinir ağı çeşidine bağlı olarak binlerce yapay sinir ağı modeli belirtilen fiyat tahmini için kullanılabilir. Sözü geçen bu binlerce sinir ağı modelinden hangisinin en iyi olduğunu yani, hangi modelin en iyi tahminleri verdiğini belirlemek amacıyla, her model için performans ölçütü değeri hesaplanır. Ve en az hatayı veren model yani, gerçeğe en yakın sonuçları üreten model X ürünü fiyat tahmini için kullanılır.

Yukarıda özetlenen süreçte, AIC, BIC, RMSE, MAPE, MdAPE ve DA performans ölçütleri kullanılsın. Yukarıda açıklamaları verilen bu kriterler kendilerine göre sağladıkları avantaj ve dezavantajlara sahiptirler. X ürünü fiyat tahmini için denenen binlerce sinir ağı modelini değerlendirmek amacıyla kullanıldıklarında, yapılarındaki farklılıklardan dolayı, hepsi farklı bir sinir ağı modelini en iyi olarak belirleyebilir. Peki bu durumda en iyi sinir ağı modeli hangisidir? Bir başka ifadeyle, hangi performans ölçütüne göre karar vermeliyiz?

Belirtilen bu performans ölçütlerine ait yukarda verilen açıklamalar incelendiğinde, her birinin modelin öngörü hatasını farklı bir açıdan ölçtüğü görülmektedir. Örneğin AIC modeldeki parametre sayısını cezalandırarak hatanın içine dahil eder. Diğer yandan, RMSE gerçekleşen gözlemle modelin ürettiği tahmin arasındaki hatayı doğrudan ölçer. DA ise gerçekleşen gözlemle modelin ürettiği tahmin arasındaki miktar farkını değil, sadece artış azalışların gözlemle karşılık gelen tahmininde aynı şekilde olup olmadığını ölçer. Benzer biçimde, tüm performans ölçütleri gözlemler ve modelin ürettiği tahminler arasındaki uzaklığı farklı bir açıdan ölçmektedir. Buna göre, bu kriterlerin hangisine göre seçim yapılmalıdır?

Aladağ ve arkadaşları (2010, 2008) bu önemli sorunun farkına varmış. Bu problemi geliştirdikleri bir yaklaşımla çözmeyi başarmışlardır. Aladağ ve arkadaşlarının geliştirdiği parlak fikrin arkasındaki nokta şudur: “Her farklı kriter hatayı başka bir açıdan ölçüyorsa, her kriteri kullanarak hatayı farklı farklı açılardan ölçen tek bir kriter geliştirmek.” Buna göre, birçok farklı kriteri aynı anda kullanarak, gözlemler ve tahminler arasındaki farkı aynı anda birçok farklı açıdan ölçebilen yeni bir performans ölçütü geliştirmişlerdir (Aladağ vd., 2010). Geliştirdikleri bu kritere Ağırlıklı Bilgi Kriteri (Weighted Information Criterion) adını vermişlerdir (Eğrioğlu vd., 2008).

Tek bir performans ölçütü kullanıldığında o ölçütün yaklaşımıyla tahmin hataları ölçülürken, WIC kullanıldığında birden çok yaklaşımla tahminlerin hatası hesaplanır ve en iyi model buna göre belirlenir. Şimdi yukarıda verilen örneğe dönüldüğünde, “hangi performans ölçütünü kullanmalıyız” sorusu artık ortadan kalkmıştır. Aşağıda formülü verilen WIC kullanılarak en güvenilir öngörüleri veren yapay sinir ağı modelini belirlemek oldukça basittir.

WIC = w1 AIC + w2 BIC + w3 RMSE + w4 MAPE + w5 MdAPE + w6 DA

Açıkça görüldüğü gibi, WIC farklı tüm performans ölçütlerinin sağladığı farklı bilgiyi tek bir ölçütte toplamayı başarır. Böylece en iyi modelin seçiminde etkin biçimde çalışarak en doğru kararın verilmesini sağlar. Yukarıda her ölçüt karşılık gelen bir wi ağırlığıyla çarpılmaktadır. Aladağ ve arkadaşları geliştirdikleri bu etkin performans ölçütünü ilk tanıttıkları makalede belirtilen ağırlıkları uzmanlığa göre seçmişlerdir (Eğrioğlu vd., 2008). Ancak bu durum WIC ölçütünün objektif çalışamaması anlamına gelebilir. Bu nedenle, Aladağ ve arkadaşları WIC kriterini geliştirerek, çözümlenen veriye göre, wi ağırlıklarını optimizasyon ile kendi belirleyen Uyarlamalı Ağırlıklı Bilgi Kriterini (Adaptive Weighted Information Criterion, AWIC) önermişlerdir (Aladağ vd., 2010). WIC kriterinin yeni versiyonu olan AWIC optimizasyon süreci ile ağırlıklarını da çözümlenen zaman serisine uygun olarak kendi belirleyen, çok etkin bir makine öğrenme performans ölçütüdür.

X ürünü fiyat tahmini için en iyi yapay sinir ağı modelinin belirlenmesi süreci AWIC ile işletildiğinde, X ürünü fiyat verisine uygun şekilde çalışan ve incelenen tüm modellerin hatasını aynı anda birçok farklı açıdan ölçebilen bir performans ölçütü kullanılmış olur. AWIC ölçütüne göre belirlenen en iyi yapay sinir ağı modeli kullanıldığında, gerçeğe en yakın öngörüleri elde etmek de artık mümkün olacaktır.

Bu yazının orjinalini okumak için tıklayınız: https://medium.com/@chaladag/gelece%C4%9Fi-en-i%CC%87yi-tahmin-eden-yapay-zek%C3%A2-modeli-hangisi-bdb1f319362d

Bizi sosyal medya hesaplarınızda takip etmeyi unutmayın!✨

Kaynaklar

Aladağ, Ç.H. (2009) Yapay Sinir Ağlarının Mimari Seçimi için Tabu Arama Algoritması. Doktora Tezi. Hacettepe Üniversitesi, Fen Bilimleri Enstitüsü, İstatistik Anabilim Dalı, Ankara, Türkiye.

Aladag, Ç.H., Eğrioğlu, E., Kadılar, C. (2009) Forecasting nonlinear time series with a hybrid methodology, Applied Mathematics Letters 22, 1467–1470.

Aladag, C.H., Egrioglu, E., Gunay, S., Basaran, M.A. (2010), Improving weighted information criterion by using optimization, Journal of Computational and Applied Mathematics, 233, 2683–2687.

Aladag, C.H., Yolcu, U., Egrioglu, E., Eren, B. (2014) Fuzzy lagged variable selection in fuzzy time series with genetic algorithms, Applied Soft Computing, 22, 465–473.

Aladag, C.H., Editor, (2017) Advances in Time Series Forecasting, Volume 2, Bentham Science Publishers Ltd., eISBN: 978–1–68108–528–9, ISBN: 978–1–68108–529–6.

Aladag, C.H. (2019) Architecture Selection in Neural Networks by Statistical and Machine Learning, Oriental Journal of Computer Science and Technology, 12 (3), pp. 76–89.

Aladag, C.H., Potas, N., Editors, (2022) Modeling and Advanced Techniques in Modern Economics, World Scientific, London.

Artifica.io yazılım geliştirme şirketi (2023) https://artifica.io

Box, G.E.P. ve Jenkins, G.M. (1970) Time series analysis: Forecasting and control, San Francisco: Holden-Day.

Egrioglu, E., Aladag, C.H. and, Gunay, S. (2008), A new model selection strategy in artificial neural network, Applied Mathematics and Computation 195, 591–597.

Günay, S., Eğrioğlu, E., Aladağ, Ç.H. (2007) Tek Değişkenli Zaman Serileri Analizine Giriş, Hacettepe Üniversitesi yayınları, ISBN 978–975–491–242–5.

Guney, H., Bakir, M.A., Aladag, C.H. (2018) A Novel Stochastic Seasonal Fuzzy Time Series Forecasting Model, International Journal of Fuzzy Systems, Volume 20, Issue 2, pp 729–740.

Gundogdu, O., Egrioglu, E., Aladag, C.H., Yolcu, U. (2016) Multiplicative Neuron Model Artificial Neural Network Based on Gaussian Activation Function, Neural Computing and Applications, Volume 27, Issue 4, pp 927–935.

Tokgozoglu, K., Aladag, C.H., Gokceoglu, C. (2021) Artificial neural networks to predict deformation modulus of rock masses considering overburden stress, Geomechanics and Geoengineering, pp. 1–17.