FinGPT, finansal görevler için optimize edilmiş dil modellerine erişimi kolaylaştırmak için tasarlanmış bir AI çerçevesidir. Açık kaynak kodludur ve ticari olarak kullanılabilir.
Columbia Üniversitesi ve New York Üniversitesi’nden (Shanghai) araştırma ekibi FinGPT ile finansal piyasalar için optimize edilmiş dil modellerine erişimi demokratikleştirmeyi hedefliyor.
Araştırmacılar, BloombergGPT gibi tescilli modellerin özel finansal verilere erişimden fayda sağlayacağını yazıyor. Buna ek olarak, BloombergGPT’nin çok pahalı olduğunu, eğitim için tahminen beş milyon ABD doları olduğunu ve çok esnek olmadığını söylüyorlar.
Bunun yerine FinGPT, önceden eğitilmiş dil modellerini ve verimli düşük düzey uyarlama (LoRA) yöntemini kullanarak ince ayar kullanır. Ekibe göre, LoRA yöntemi eğitilebilir parametre sayısını 6,17 milyardan sadece 3,67 milyona düşürebilir. Bu, ince ayar sürecini çok daha hızlı ve hesaplama açısından daha az yoğun hale getirirken, modelin finansal metni verimli bir şekilde anlamasına ve üretmesine izin verir.
reklam
Yüksek kaliteli veri hattına odaklanın
Araştırmacılar, bir finansal dil modelinin başarısının, verilerin kalitesi kadar dil modelinin yeteneklerine de bağlı olduğunu savunuyorlar. FinGPT’yi BloombergGPT’ye doğrudan bir yanıt olarak görüyorlar ve bu nedenle veri kalitesine ve hazırlığına güçlü bir vurgu yapıyorlar.
Ekip ilk olarak bir küratörlüğünde, yüksek kaliteli finansal verilerin otomatik boru hattı. Yahoo Finance ve Bloomberg gibi yerleşik kaynakların yanı sıra Twitter, Reddit ve SEC dosyalarındaki içeriklerden yararlanırlar. Ayrıca Google Trends gibi trend barometrelerinden ve AShare ve Stocknet gibi yerleşik veri kümelerinden bilgi alırlar.

Ekibe göre, bu veriler, kalitesini ve kullanılabilirliğini sağlamak için kapsamlı bir temizleme ve biçimlendirme sürecinden geçiyor.
Veriler daha sonra FinGPT çerçevesi kullanılarak dil modelleriyle işlenir. Uygulamaya bağlı olarak, tanınmış şirketlerin LLM’leri kullanılabilir veya eğitilebilir veya ince ayar yapılabilir modeller, özel verilerle zenginleştirilebilir. İnce ayar, bir modeli tam olarak eğitmekten daha hızlı olduğu için FinGPT’nin BloombergGPT’den daha güncel ve dinamik olduğu söyleniyor.
Bir servis yolu aracılığıyla otomatikleştirilmiş insan geri bildirimi
Bir modelde ince ayar yapmak genellikle büyük miktarda yüksek kaliteli, etiketlenmiş veri gerektirir. Etiketli veriler, verilerin, bir haberin iyi mi kötü mü olduğu gibi modelin öğrenebileceği ek bilgiler içerdiği anlamına gelir. Bu tür verilerin elde edilmesi, özellikle finans gibi özel alanlarda zor ve pahalı olabilir.
Öneri

Bu nedenle FinGPT ekibi şık bir çözüm buldu: Verileri manuel olarak etiketlemek yerine borsanın haberlere verdiği tepkileri etiket olarak kullanıyor. Örneğin, bir haberden sonra hisse senedi fiyatı yükselirse, bu “pozitif” olarak sınıflandırılabilir.
Araştırmacılar üç duygu için eşikler kullandılar: pozitif, negatif ve nötr. Model ince ayarlandığında, haber etiketi olarak üç duygudan birini – olumlu, olumsuz veya nötr – seçmesi talimatı verilir.
Araştırmacılar, OpenAI’nin RLHF’sini (İnsan Geri Bildirimiyle Takviyeli Öğrenim) takiben, ilkelerini şöyle adlandırıyor: RLSP: Hisse Senedi Fiyatları Üzerine Güçlendirme Öğrenimibu da dolaylı bir insan geri bildirimi biçimi olarak görülebilir. Sistemin finansal piyasaları daha iyi anlamak ve tahmin etmek için “piyasanın bilgeliğinden” ders alması gerekiyor.
Finans sektöründe yapay zeka için açık kaynaklı bir çerçeve
Ekip, robo-danışmanlık, kantitatif ticaret, çeşitli faktörlere dayalı portföy optimizasyonu, finansal piyasalarda duyarlılık analizi, risk yönetimi, dolandırıcılık tespiti, kredi puanlama, iflas veya potansiyel satın alma tahminleri, kamuya açık raporlara dayalı ESG profillerinin analizi ve FinGPT çerçevesi için potansiyel uygulamalar olarak haberler, düşük kod geliştirme ve finansal eğitim.
Araştırmacılar yayınlıyor Github’da MIT lisansı altında açık kaynak olarak FinGPT. Ticari kullanıma izin verilir. Geliştiriciler, modele dayalı mali kararlar için garanti vermez veya sorumluluk almaz.