Uusi tekstistä kuvaksi -malli, josta sinun on tiedettävä: DeepFloyd IF – TechCult
Sekalaista / / May 06, 2023
Jos Adobe ja DALL-E ei ollut jo tehnyt siitä vaikeaa graafisille suunnittelijoille, kaupungissa on uusi tekoäly. Uusi tekstistä kuvaksi -malli, josta sinun on tiedettävä, on DeepFloyd IF. Tutustu DeepFloyd IF: ään, viimeisimpään tekstistä kuvaksi -malliin, jonka on julkaissut tutkimusryhmä DeepFloyd. Vakaus AI. Se ravistaa varmasti asioita entisestään kuvan luovan tekoälyn kannalta.
DeepFloydStability AI: n tukema tutkimusryhmä on ilmoittanut julkaisevansa uuden tekstistä kuvaksi -mallin, DeepFloyd IF: n. Tämä malli käyttää tehokasta kaskadoitua pikselien diffuusiomenetelmää kuvien luomiseen tekstikehotteista. Ei-kaupallisen, tutkimuksen sallivan lisenssinsä ansiosta DeepFloyd IF tarjoaa tutkimuslaboratorioille ainutlaatuisen mahdollisuuden tutkia ja kokeilla edistyneitä tekstistä kuvaksi -luontimenetelmiä.
DeepFloyd IF -mallissa on T5-XXL-1.1 ison kielimallin älykkyys, mikä mahdollistaa suurelle määrälle teksti-kuvan ristiin huomioivia kerroksia, mikä tarjoaa paremman kehotteen ja kuvan liiton. Tämä johtaa johdonmukaiseen ja selkeään tekstiin eri ominaisuuksilla olevien objektien rinnalla, jotka esiintyvät erilaisissa tilasuhteissa.
- DeepFloyd IF on tekstistä kuvaksi -malli, joka käyttää kaskadoitua pikselien diffuusiomenetelmää kuvien luomiseen tekstikehotteista.
- Malli sisältää T5-XXL-1.1-suuren kielimallin älykkyyden, mikä mahdollistaa paremman viitteen ja kuvaliiton.
- DeepFloyd IF luo yhtenäistä ja selkeää tekstiä eri ominaisuuksilla olevien objektien rinnalle, jotka esiintyvät erilaisissa tilasuhteissa.
- Mallissa on korkea fotorealismi, mikä näkyy sen vaikuttavassa nollakuvassa FID-pisteessä 6,66 COCO-tietojoukossa.
- DeepFloyd IF voi luoda kuvia epästandardeilla kuvasuhteilla ja mahdollistaa nollakuvan käännöksen kuvasta kuvaksi.
- Malli voi luoda kuvan kehotteesta, kuten "nallekarhu, jolla on paita, jossa lukee "Deep Floyd" - valinnaisesti useissa eri tyyleissä.
- DeepFloyd IF suorittaa diffuusion useita kertoja luoden 64 x 64 pikselin kuvan ja skaalaamalla sen sitten 256 x 256 pikseliin ja lopuksi 1 024 x 1 024 pikseliin.
- DeepFloyd IF käyttää suurta kielimallia ymmärtääkseen ja esittääkseen kehotteita vektorina, mikä tekee siitä erityisen hyvän ymmärtämään monimutkaisia kehotteita ja kehotteissa kuvattuja tilasuhteita.
- Malli on saatavana avoimena lähdekoodina ja lisensoitu tavalla, joka kieltää kaupallisen käytön.
Yksi tärkeimmistä eroista DeepFloyd IF: n ja muiden mallien, kuten Stable Diffusion ja DALL-E 2, välillä on se, että DeepFloyd IF käyttää suuri kielimalli ymmärtää ja esittää kehotteet vektorina. DeepFloyd IF: n arkkitehtuuriin upotetun suuren kielimallin koon vuoksi malli on erityisen hyvä ymmärtämään monimutkaisia kehotteita ja jopa paikkasuhteita, jotka kuvataan kohdassa kehotteita.
DeepFloyd IF on saatavilla avoimena lähdekoodina ja lisensoitu tavalla, joka kieltää kaupallisen käytön toistaiseksi. Rajoitus johtui todennäköisesti generatiivisten tekoälymallien nykyisestä heikosta oikeudellisesta asemasta. Voit käyttää DeepFloyd IF: ää seuraavasti, kunnes se tulee saataville kaupalliseen käyttöön:
1. Vieraile DeepFloyd IF -demosivu.
2. Kirjoita kehote, jolle haluat kuvan.
3. Klikkaa Tuottaa.
Tämä luo sinulle kuvan. Muista, että tämä on demo, eikä se välttämättä vastaa sitä, mihin DeepFloyd pystyy täysin.
DeepFloyd IF: n avulla Stability AI ja DeepFloyd ovat luoneet tehokkaan ja lupaavan uuden tekstistä kuvaksi -mallin. Hyödyntämällä T5-mallin älykkyyttä ja käyttämällä kaskadoitua pikselidiffuusiomenetelmää malli luo fotorealistisia kuvia suurella tarkkuudella. Generatiivisen tekoälyn kehittyessä on selvää, että DeepFloyd IF: n kaltaisilla malleilla tulee olemaan yhä tärkeämpi rooli alalla.
Lähde: Stability AI: n blogi
Alex Craig
Alexia ohjaa intohimo tekniikkaa ja pelisisältöä kohtaan. Olipa kyse sitten uusimpien videopelien pelaamisesta, viimeisimmistä teknisistä uutisista seuraamisesta tai mukaansatempaamisesta muiden samanmielisten ihmisten kanssa verkossa, Alexin rakkaus tekniikkaa ja pelaamista kohtaan näkyy kaikessa, mitä hän tekee.
Alexia ohjaa intohimo tekniikkaa ja pelisisältöä kohtaan. Olipa kyse sitten uusimpien videopelien pelaamisesta, viimeisimmistä teknisistä uutisista seuraamisesta tai mukaansatempaamisesta muiden samanmielisten ihmisten kanssa verkossa, Alexin rakkaus tekniikkaa ja pelaamista kohtaan näkyy kaikessa, mitä hän tekee.