Stability AI releases Stable Diffusion XL 0.9, a “leap forward” in AI image generation



özet
Özet

Stability AI, önceki modele göre önemli ölçüde iyileştirilmiş görüntü ve kompozisyon ayrıntıları oluşturan gelişmiş görüntü oluşturma modeli SDXL 0.9’u piyasaya sürdü. Şirket, bu iyileştirmenin, birden çok sektörde yapay zeka tarafından oluşturulan görüntüler için pratik uygulamalar sağlayacak kadar önemli olduğunu öne sürüyor.

SDXL 0.9’un piyasaya sürülmesiyle Stability AI, çeşitli yaratıcı ve endüstriyel uygulamalar için hipergerçekçi görüntüler oluşturmada bir “ileriye sıçradı”. Şirkete göre, önceki modelle karşılaştırıldığında, yeni model önemli ölçüde geliştirilmiş görüntü ve kompozisyon ayrıntılarına sahip.

ClipDrop aracılığıyla erişilebilir ve API yakında kullanıma sunulacaktır. Kullanıcılar, model 1.0 sürümüne doğru ilerlerken, Temmuz ortasında araştırma ağırlıklarının açık bir şekilde yayınlanmasını bekleyebilirler.

SDXL 0.9, endüstriyel uygulamaların yanı sıra film, televizyon, müzik, eğitim videoları ve tasarım için hipergerçekçi kreasyonlar da dahil olmak üzere üretken AI görüntüleri için çok çeşitli yaratıcı kullanım durumları sunar. Stability AI’ye göre bu yetenekler, en son modelini AI görüntüleri için gerçek dünya uygulamalarının ön saflarına yerleştiriyor.

reklam

Uzaylılar! Neyse ki (?) yalnızca yapay zeka tarafından üretilirler. | Bild: Stability AI tarafından yönlendirilen SDXL 0.9

Görüntü oluşturmanın ötesinde özellikler

SDXL 0.9, temel metin istemine ek olarak, görüntüden görüntüye yönlendirme (varyasyonlar elde etmek için bir görüntü girin), iç boyama (bir görüntüdeki eksik parçaları yeniden oluşturma) ve dış boyama (mevcut görüntüleri sorunsuz bir şekilde genişletme) dahil olmak üzere birçok özellik sunar.

SDXL 0.9’daki kompozisyon geliştirmeleri, önceki beta sürümüne kıyasla parametre sayısındaki önemli artıştan kaynaklanmaktadır. Parametreler, bir sinir ağındaki tüm ağırlıkların ve önyargıların toplamını temsil eder ve bu model, 3.5B parametre temel modeline ve 6.6B parametre modeli topluluk boru hattına sahiptir. Buna karşılık, beta sürümü yalnızca tek bir 3.1B parametre modeli kullanıyordu.

Daha fazla derinliğe ve 1024×1024 daha yüksek çözünürlüğe sahip daha gerçekçi görüntüler oluşturmak için SDXL 0.9 iki CLIP modeli kullanırbugüne kadarki en büyük OpenCLIP modeli dahil (OpenCLIP ViT-G/14).

Tüketici donanımında erişilebilirlik ve performans

SDXL 0.9, gelişmiş özelliklerine ve model mimarisine rağmen, yalnızca Windows 10 veya 11 veya Linux işletim sistemi, 16 GB RAM ve en yüksek hıza sahip bir Nvidia GeForce RTX 20 (eşdeğer veya daha yüksek) grafik kartı gerektiren modern bir tüketici GPU’sunda çalışabilir. en az 8 GB VRAM. Linux kullanıcıları, 16 GB VRAM ile uyumlu bir AMD kartı kullanabilir.

13 Nisan’daki beta lansmanından bu yana, SDXL 700.000’den fazla görüntü oluşturdu ve “yaklaşık 7.000” Discord topluluğu kullanıcısından “harika yanıtlar” aldı. Platform, gönderilen 54.000 görsel ve kazanan ilan edilen 3.521 SDXL görseliyle düzenli olarak “Showdowns”a ev sahipliği yapıyor.

Öneri

Kararlılık Yapay Zekası ClipDrop 26 Haziran’da API ve DreamStudio kullanıcıları için erişime sahip platform. Açık kaynak sürümünü çalıştırma kodu daha sonra kullanıma sunulacaktır. GitHub aracılığıyla. Açık kaynak sürümü tam SDXL 1.0 modeli Temmuz ortası hedefleniyor.

Şu anda, SDXL 0.9 ticari olmayan, yalnızca araştırmaya yönelik bir lisans altında yayınlanıyor ve araştırmacılar modellere erişim talep edebilir.

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top