Microsoft Word - Derin Öğrenmeye Karşı Geleneksel Modeller_Abdel Hai_Final.Bölüm 2

Jan 03, 2024

Verileri makine öğrenimi modellerine hazırlamak için aşağıdaki veri ön işleme teknikleri uygulandı.

Veri ve bellek yakından ilişkilidir. Modern toplumda her gün metin, resim, video vb. dahil olmak üzere büyük miktarda bilgi ve veri alıyoruz. Bu verilerin etkili bir şekilde işlenmesi ve organize edilmesi güçlü bir hafızaya sahip olmamızı gerektirir.

Bir yandan veriler bize hafıza desteği sağlayabilir. Örneğin, yeni bilgiler öğrendiğimizde ilgili verileri ve gerçekleri ezberleyerek bilgi noktalarını daha hızlı ve daha iyi anlayabilir ve bunlara hakim olabiliriz. Bu tür bir öğrenme yöntemi, güçlü bir hafıza oluşturmamıza ve bilgiyi uzun süre kontrol etme yeteneğimizi korumamıza yardımcı olabilir.

Öte yandan veriler hafızayı eğitmemize ve geliştirmemize de yardımcı olabilir. Çeşitli hafıza eğitimi yöntemleri sayesinde verileri esnek bir şekilde hafıza eğitimi gerçekleştirmek için kullanabilir, hafıza yeteneğimizi belirli bir dereceye kadar geliştirebilir ve böylece toplumun gelişimine, iş ve yaşam ihtiyaçlarına daha iyi uyum sağlayabiliriz.

Veri ile hafıza arasındaki ilişkinin çok yakın ve önemli olduğu görülmektedir. Yalnızca verileri aktif ve etkili bir şekilde işleyerek ve kullanarak bellek yeteneklerimizi daha iyi kullanabilir ve daha iyi sonuçlar elde edebiliriz. Bu nedenle veri ve hafıza arasındaki ilişkiyi aktif olarak ele almalı, ilgili eğitim ve uygulamaları yapmalı, yeteneklerimizi sürekli geliştirmeliyiz. Belleği geliştirmemiz gerektiği görülebilir ve Cistanche Deserticola hafızayı önemli ölçüde geliştirebilir, çünkü Cistanche Deserticola aynı zamanda asetilkolin ve büyüme faktörlerinin seviyelerini arttırmak gibi nörotransmitterlerin dengesini de düzenleyebilir. Bu maddeler hafıza ve öğrenme için çok önemlidir. Ayrıca et, kan akışını iyileştirebilir ve oksijen dağıtımını destekleyebilir, bu da beynin yeterli besin ve enerji almasını sağlayarak beyin canlılığını ve dayanıklılığını artırır.

improve short term memory

Beyin fonksiyonunu iyileştirmenin yollarını bilin'e tıklayın

Kategorik özellikler sıcak kodlanmış bir özellikti; sürekli ve ayrık özellikler min-maxnormalizasyon teknikleri32 kullanılarak normalleştirildi ve şu şekilde tanımlandı:

increase brain power

Aşağıdaki özelliklerin her biri için her karşılaşmada farklı sayıda kayıt vardı. Böylece bunun yerine aşağıdaki istatistiksel değerler hesaplandı. Diyastolik ve sistolik kan basınçları için minimum, maksimum ve ortalama değerleri hesapladık.

BMI için minimum, maksimum, ortalama ve varyans katsayısı kullanıldı. Bu istatistiksel değerler normalleştirildi ve özellik olarak kullanıldı. Üstelik, farklı sayıdaki laboratuvar testleri, tanılar ve prosedürler nedeniyle, özelliklerin sayısı karşılaşmalarda farklılık gösteriyordu. Bir karşılaşmada birden fazla teşhis ve/veya prosedür kodu bulunabilir veya hiçbiri olmayabilir.

Bunu düzeltmek ve özellik vektörlerinin boyutluluğunu birleştirmek için modellerin öğrenilmesini geliştirmek üzere aşağıdaki veri temsil teknikleri kullanıldı. Teşhis ve prosedür kodları için, her bir değerin 0 veya 1 olarak ayarlandığı ve her karşılaşma için teşhis/prosedür kodunun mevcut olup olmadığını belirten tek-etkin kodlamaların gösterimini kullandık. Her testin ilişkili bir sonucu olduğundan, bu veri temsil tekniğini laboratuvar testleri için biraz değiştirdik.

Bu nedenle kodun var olduğunu belirten 1 sayısını laboratuvar sonucuyla değiştirdik. Laboratuvar sonuçları Denklem 1 kullanılarak normalleştirildi. Sonuçlar farklı birim ve ölçümlere sahip olduğundan, laboratuvar sonuçlarını normalleştirirken her laboratuvar kodu için minimum ve maksimum değerleri ayrı ayrı dikkate aldık. Bu teknik, birçok benzersiz kod nedeniyle yüksek boyutlu seyrek bir dizi oluşturdu.
Daha sonra gömme ve azaltılmış boyutluluğu öğrenmek için Tekil Değer Ayrıştırma (SVD) algoritmasını kullandık. Giriş olarak kare matris varsaymadığı ve seyrek veriler için daha iyi olduğu için SVD kullanıldı.33 Laboratuvar testleri 50 bileşene düşürüldü, prosedür kodlar 45 bileşene, teşhis kodları ise 25 bileşene düşürüldü.

Farklı bileşenler araştırıldı ve boyutluluğu azaltmak için en uygun bileşen sayısını belirlemek amacıyla varyans oranının toplamı gözlemlendi. Tüm özellikler, her karşılaşma için bir özellik vektöründe birleştirildi. Boyutları azaltmak ve birleştirmek için her karşılaşmaya ayrı ayrı SVD uygulandı; karşılaşmaların boyutu karşılaşma başına 50 özelliğe düşürüldü.

help with memory

Daha sonra, belirli bir hasta için tüm karşılaşmaları, başvuru tarihine göre sıralanmış bir özellik vektöründe birleştirdik. Sınıf dağılımı, yeniden kabul edilmeyen 27.511 hasta (negatif sınıf) ve yeniden kabul edilen 9.130 hasta (pozitif sınıf) idi.

Deneysel Yaklaşımlar

Aşağıdaki hedeflere ulaşmak için EHR verilerini kullanarak kapsamlı deneyler yaptık:

- Diyabetli hastaların 30 gün içinde tekrar kabul edilip edilmeyeceğini tahmin edin

- Kullanılan DL yöntemlerinin performansını çeşitli geleneksel modellerle karşılaştırın

- Geri kabulü tahmin etmek için 2 yıl içinde daha önce kaç karşılaşmanın (yani geçmiş verilerin) en uygun olduğunu analiz edin

- Bir alan uzmanı tarafından seçilen bir test alt kümesinden öğrenmeye karşı tüm laboratuvar testlerini verilere dahil etmenin etkilerini değerlendirin

Bu çalışmada DL modelleri, p hasta için her bir karşılaşmanın f özelliğini temsil etmek üzere bir 3-3-boyutsal tensör � x � x �'yi girdi olarak alır. Bunun tersine, geleneksel modellerde veriler tipik olarak, tüm karşılaşmaların tüm özelliklerinin uzun bir özellik vektöründe birleştirilmiş tek bir hastaya karşılık geldiği bir 2-boyutlu matris olarak temsil edilir.

Her karşılaşmanın boyutu azaltılmış ve 50 özelliğe birleştirilmiştir, dolayısıyla derin modelde - 50 boyutundadır. Geleneksel bir modelde özellik vektörü tüm karşılaşmalardan oluşur ve dolayısıyla boyutu - x 50'dir.

Hastalar, tekdüze olmayan boyutlarla sonuçlanan farklı sayıda karşılaşmalara sahiptir; bu nedenle, birleşik bir form elde etmek için özellik vektörleri 0'lerle dolduruldu. DL ve geleneksel modeller için girdi olarak kullanılan veri gösterimi, sırasıyla Şekil 1'in sol ve sağ panellerinde gösterilmektedir.
Heterojen sıralı verileri modellemek için DL modellerinin 2 çeşidini geliştirdik ve her ikisini de temel olarak kullanılan birkaç geleneksel modelle karşılaştırdık. Çalışmamızda kullanılan DL modelleri şunlardır: 1) 1-sıraya bağımlı ardışık verileri öğrenme yeteneğine sahip Tekrarlayan Sinir Ağının (RNN) bir çeşidi olan uzun kısa süreli bellek (LSTM) yolu ağları32; ve 2) RNN'nin başka bir çeşidi olan Çift Yönlü Geçitli Tekrarlama Birimi (GRU).

Temel olarak kullanılan geleneksel modeller şunlardır: 1) Rastgele Orman (RF), sınıflandırma ve regresyon için bir topluluk yöntemi; eğitim sırasında birden fazla karar ağacı oluşturur;30 RF sıklıkla tıbbi verileri kullanarak tahminler konusunda mevcut literatürdeki en gelişmiş performansı elde eder. 2) Çok katmanlı Perceptron (MLP), zamansal bilgiyi hesaba katmayan basit bir sinir ağı modeli.

MLP, birden fazla algılayıcı katmanından oluşur, geriye yayılma öğrenimi gerçekleştirir ve doğrusal olmayan bir aktivasyon fonksiyonu kullanır.31 3) Lojistik Regresyon (LR), mevcut geri kabul tahminleri literatüründe sıklıkla kullanılan ve tıbbi verilere uygulanan yorumlanabilir bir model; ve 4) Giriş parametreleri ortak olarak optimize edilmediğinden aşırı uyum sağlamaya daha az eğilimli olan AdaBoost.

help with memory


DL modelleri, "TensorFlow"un üst düzey bir API'si olan "Keras" Python kitaplıkları kullanılarak uygulandı. Python'da geleneksel modellerin uygulanması için "Scikit-learn" kütüphanesinden yararlanıldı.

Önerilen model olan LSTM'nin mimarisi, 128 nöron, sıralı bir katman, girişi 3- boyutlu bir tensöre yeniden şekillendirmek için kullanılan bir yeniden şekillendirme katmanı ve 0 maske değerine sahip bir maskeleme katmanından oluşur. Verilerin eksik olduğu zaman adımlarını atlamak için kullanılır.

Boyutları birleştirmek için 0'lerle doldurma yapıldığından, maskeleme katmanını takip eden tüm katmanlarda eksik değerlerle herhangi bir hesaplama yapılmasını önlemek için maskeleme katmanı kullanıldı, dolayısıyla öğrenme sırasında eksik değerler hesaba katılmadı.

Ek olarak, gizli ve çıktı katmanları arasına bir bırakma eklendi. Düşürülecek belirli bir yüzdeyi rastgele seçmek için bu tekniğin kullanılması, modelin verilerdeki genel kalıpları öğrenmesine yardımcı olan yaygın bir düzenleme tekniğidir.

RNN, zamansal EHR verilerini analiz edebilen gizli nöronlardan oluşan sinir ağlarının bir çeşididir.32 RNN, temel sinir ağıyla aynı yapıyı içerir, ancak aynı katmandaki nöronlar birbirine bağlıdır ve bir nöronun aynı kaynaktan öğrenmesine olanak tanır. önceki katmanların çıktılarından ve girdi verilerinden öğrenmeye ek olarak komşu katmanlar. Dolayısıyla RNN nöronları, şimdiki zaman ve yakın geçmiş olmak üzere iki girdi kaynağı içerir. Öğrenme süreci şu şekilde tanımlanır:

increase memory power

Gizli bir nöronun �" değerini hesaplamak için, doğrusal olmayan bir dönüşüm fonksiyonu olan ReLU, sol gizli nöronunun �"#$ ağırlıklı �değerine ve girişinin �" ağırlıklı � değerine uygulanır.

Tahminler, ağırlıklı "tüm gizli nöronların ek önyargılı toplamı"nın asigmoid fonksiyonu kullanılarak hesaplanır. RNN'nin dezavantajı, yok olan gradyan probleminden muzdarip olmasıdır; bu, ağırlıkların değişmeden kalması anlamına gelir, bu da modelin yakınsamasını zorlaştırır, dolayısıyla model öğrenmekte zorlanır.

Bunu çözmek için, RNN'nin sigmoid nöronlarının daha karmaşık bir kısa süreli bellek yapısıyla değiştirildiği bir LSTM katmanı tanıtıldı. LSTM, katmanlar arasında aynı ağırlıkları paylaşır, bu da ağın hesapladığı parametre sayısını azaltır.

supplements to improve memory

GRU, eğim problemini ortadan kaldırmak için alternatif bir çözümdür. Basit nöronu, çıkış kapısı bulunmadığı için LSTM nöronlarından daha az parametreye sahip olan kapılı bir üniteyle değiştirir.33


For more information:1950477648nn@gmail.com

Bunları da sevebilirsiniz