Bilmeniz Gereken Yeni Metinden Görüntüye Modeli: DeepFloyd IF – TechCult
Çeşitli / / May 06, 2023
Eğer Adobe ve DALL-E zaten grafik tasarımcıların işini zorlaştırmamıştı, şehirde yeni bir yapay zeka var. Bilmeniz gereken yeni metinden görüntüye model, DeepFloyd IF'dir. tarafından desteklenen araştırma grubu DeepFloyd tarafından yayınlanan en son metinden resme model olan DeepFloyd IF ile tanışın. Kararlılık AI. Görüntü üreten AI için işleri daha da sarsacağı kesin.
Derin FloydStability AI tarafından desteklenen bir araştırma grubu olan yeni metinden görüntüye modeli DeepFloyd IF'in piyasaya sürüldüğünü duyurdu. Bu model, metin bilgi istemlerinden görüntüler oluşturmak için güçlü bir ardışık piksel difüzyon yöntemi kullanır. Ticari olmayan, araştırmaya izin verilen lisansı ile DeepFloyd IF, araştırma laboratuvarlarına gelişmiş metinden görüntüye oluşturma yaklaşımlarını incelemeleri ve denemeleri için benzersiz bir fırsat sağlar.
DeepFloyd IF modeli, T5-XXL-1.1 büyük dil modelinin zekasını içerir; önemli miktarda metin-görüntü çapraz dikkat katmanı için, daha iyi bilgi istemi ve görüntü ittifakı sağlar. Bu, çeşitli uzamsal ilişkilerde görünen farklı özelliklere sahip nesnelerin yanında tutarlı ve net bir metinle sonuçlanır.
- DeepFloyd IF, metin bilgi istemlerinden görüntüler oluşturmak için kademeli bir piksel difüzyon yöntemi kullanan bir metinden görüntüye modelidir.
- Model, T5-XXL-1.1 büyük dil modelinin zekasını birleştirerek daha iyi komut istemi ve görüntü ittifakı sağlar.
- DeepFloyd IF, çeşitli uzamsal ilişkilerde görünen farklı özelliklere sahip nesnelerin yanında tutarlı ve net metinler üretir.
- Model, COCO veri kümesindeki 6.66'lık etkileyici sıfır atış FID puanına yansıyan yüksek derecede fotogerçekçiliğe sahiptir.
- DeepFloyd IF, standart olmayan en boy oranlarına sahip görüntüler üretebilir ve sıfır çekimli görüntüden görüntüye çevirilere izin verir.
- Model, isteğe bağlı olarak çeşitli stillerde "'Deep Floyd' yazan bir gömlek giyen bir oyuncak ayı" gibi bir bilgi isteminden bir görüntü oluşturabilir.
- DeepFloyd IF, birkaç kez difüzyon gerçekleştirerek 64x64 piksellik bir görüntü oluşturur ve ardından onu 256x256 piksele ve son olarak da 1024x1024 piksele yükseltir.
- DeepFloyd IF, istemleri bir vektör olarak anlamak ve temsil etmek için geniş bir dil modeli kullanır, bu da onu özellikle karmaşık istemleri ve bilgi istemlerinde açıklanan uzamsal ilişkileri anlamada başarılı kılar.
- Model açık kaynak olarak mevcuttur ve ticari kullanımı yasaklayacak şekilde lisanslanmıştır.
DeepFloyd IF ile Stable Diffusion ve DALL-E 2 gibi diğer modeller arasındaki temel farklardan biri, DeepFloyd IF'in bir büyük dil modeli bilgi istemlerini bir vektör olarak anlamak ve temsil etmek. DeepFloyd IF mimarisine gömülü büyük dil modelinin boyutu nedeniyle model, özellikle karmaşık istemleri ve hatta uzamsal ilişkileri anlamada iyidir. ister.
DeepFloyd IF, açık kaynak olarak mevcuttur ve şimdilik ticari kullanımı yasaklayacak şekilde lisanslanmıştır. Kısıtlama, büyük olasılıkla üretken yapay zeka sanat modellerinin mevcut zayıf yasal durumundan kaynaklanıyordu. Ticari kullanıma sunulana kadar DeepFloyd IF'i şu şekilde kullanabilirsiniz:
1. ziyaret edin DeepFloyd IF tanıtım sayfası.
2. Görüntü almak istediğiniz istemi yazın.
3. Tıklamak oluştur.
Bu sizin için bir görüntü oluşturacaktır. Bunun bir demo olduğunu ve DeepFloyd'un tamamen yapabilecekleriyle aynı seviyede olmayabileceğini unutmayın.
DeepFloyd IF ile Stability AI ve DeepFloyd, güçlü ve gelecek vaat eden yeni bir metinden görüntüye model yarattı. T5 modelinin zekasını birleştiren ve kademeli bir piksel difüzyon yöntemi kullanan model, yüksek derecede doğrulukla fotogerçekçi görüntüler üretir. Üretken yapay zeka gelişmeye devam ederken, DeepFloyd IF gibi modellerin bu alanda giderek daha önemli bir rol oynayacağı açıktır.
Kaynak: Stability AI Blogu
Alex Craig
Alex, teknoloji ve oyun içeriği tutkusuyla hareket ediyor. En yeni video oyunlarını oynayarak, en son teknoloji haberlerini takip ederek veya ilgi çekici Çevrimiçi ortamda benzer düşünen kişilerle birlikte, Alex'in teknolojiye ve oyunlara olan sevgisi, yaptığı her şeyde belirgindir. yapmak.
Alex, teknoloji ve oyun içeriği tutkusuyla hareket ediyor. En yeni video oyunlarını oynayarak, en son teknoloji haberlerini takip ederek veya ilgi çekici Çevrimiçi ortamda benzer düşünen kişilerle birlikte, Alex'in teknolojiye ve oyunlara olan sevgisi, yaptığı her şeyde belirgindir. yapmak.