ტექსტის გამოსახულების ახალი მოდელი, რომლის შესახებაც უნდა იცოდეთ: DeepFloyd IF – TechCult
Miscellanea / / May 06, 2023
თუ Adobe და DALL-E-ს უკვე არ გაუჭირვებია გრაფიკული დიზაინერებისთვის, ქალაქში არის ახალი AI. ტექსტის გამოსახულების ახალი მოდელი, რომლის შესახებაც უნდა იცოდეთ არის DeepFloyd IF. გაიცანით DeepFloyd IF, ტექსტის გამოსახულების უახლესი მოდელი, გამოშვებული კვლევითი ჯგუფის DeepFloyd-ის მიერ, მხარდაჭერილი სტაბილურობა AI. რა თქმა უნდა, ეს კიდევ უფრო შეარყევს ყველაფერს გამოსახულების გენერატორი AI.
DeepFloyd, მკვლევარმა ჯგუფმა, რომელსაც მხარს უჭერს Stability AI, გამოაცხადა მათი ახალი ტექსტიდან გამოსახულების მოდელის, DeepFloyd IF-ის გამოშვება. ეს მოდელი იყენებს კასკადური პიქსელის დიფუზიის მძლავრ მეთოდს ტექსტური მოთხოვნიდან სურათების შესაქმნელად. თავისი არაკომერციული, კვლევისთვის დასაშვები ლიცენზიით, DeepFloyd IF უნიკალურ შესაძლებლობას აძლევს კვლევით ლაბორატორიებს, გამოიკვლიონ და ექსპერიმენტი გაუკეთონ ტექსტის გამოსახულების წარმოქმნის მოწინავე მიდგომებს.
DeepFloyd IF მოდელი აერთიანებს T5-XXL-1.1 დიდი ენის მოდელის ინტელექტს, რაც საშუალებას იძლევა ტექსტ-გამოსახულების ჯვარედინი ყურადღების ფენების მნიშვნელოვანი რაოდენობით, რაც უზრუნველყოფს უკეთესი სწრაფი და გამოსახულების ალიანსს. ეს იწვევს თანმიმდევრულ და მკაფიო ტექსტს სხვადასხვა თვისებების ობიექტებთან ერთად, რომლებიც ჩნდებიან სხვადასხვა სივრცულ ურთიერთობებში.
- DeepFloyd IF არის ტექსტური გამოსახულების მოდელი, რომელიც იყენებს კასკადური პიქსელის დიფუზიის მეთოდს ტექსტური მოთხოვნიდან სურათების შესაქმნელად.
- მოდელი აერთიანებს T5-XXL-1.1 დიდი ენის მოდელის ინტელექტს, რაც საშუალებას იძლევა უკეთესი სწრაფი და გამოსახულების ალიანსი.
- DeepFloyd IF წარმოქმნის თანმიმდევრულ და მკაფიო ტექსტს სხვადასხვა თვისებების ობიექტებთან ერთად, რომლებიც ჩნდებიან სხვადასხვა სივრცით ურთიერთობებში.
- მოდელს აქვს ფოტორეალიზმის მაღალი ხარისხი, რაც აისახება მის შთამბეჭდავ ნულოვანი დარტყმის FID ქულაში 6.66 COCO მონაცემთა ბაზაში.
- DeepFloyd IF-ს შეუძლია გამოსახულებების გენერირება არასტანდარტული ასპექტის თანაფარდობით და იძლევა ნულოვანი კადრის გამოსახულება-სურათის თარგმნას.
- მოდელს შეუძლია შექმნას გამოსახულება მოთხოვნიდან, როგორიცაა „ტედი დათვი, რომელსაც აცვია პერანგი, რომელზეც წერია „Deep Floyd“ — სურვილისამებრ სხვადასხვა სტილში.
- DeepFloyd IF ახორციელებს დიფუზიას რამდენჯერმე, წარმოქმნის 64x64px სურათს და შემდეგ ამაღლებს მას 256x256px-მდე და ბოლოს 1024x1024px-მდე.
- DeepFloyd IF იყენებს მსხვილ ენობრივ მოდელს, რათა გაიგოს და წარმოაჩინოს მოთხოვნა ვექტორად, რაც მას განსაკუთრებით კარგად აქცევს მოთხოვნებში აღწერილი რთული მოთხოვნებისა და სივრცითი ურთიერთობების გაგებაში.
- მოდელი ხელმისაწვდომია ღია კოდით და ლიცენზირებულია ისე, რომ კრძალავს კომერციულ გამოყენებას.
ერთ-ერთი მთავარი განსხვავება DeepFloyd IF-სა და სხვა მოდელებს შორის, როგორიცაა Stable Diffusion და DALL-E 2, არის ის, რომ DeepFloyd IF იყენებს დიდი ენის მოდელი მოთხოვნის გაგება და წარმოდგენა ვექტორად. DeepFloyd IF-ის არქიტექტურაში ჩართული დიდი ენის მოდელის ზომის გამო, მოდელი არის განსაკუთრებით კარგად ესმის რთული მოთხოვნილებების და თუნდაც სივრცითი ურთიერთობების გაგებაში, რომლებიც აღწერილია მოთხოვნებს.
DeepFloyd IF ხელმისაწვდომია ღია კოდით და ლიცენზირებულია ისე, რომ კრძალავს კომერციულ გამოყენებას, ამჟამად. შეზღუდვა სავარაუდოდ მოტივირებული იყო გენერაციული AI ხელოვნების მოდელების ამჟამინდელი სუსტი იურიდიული სტატუსით. სანამ ის ხელმისაწვდომი გახდება კომერციული გამოყენებისთვის, ასე შეგიძლიათ გამოიყენოთ DeepFloyd IF:
1. Ესტუმრეთ DeepFloyd IF დემო გვერდი.
2. ჩაწერეთ მოთხოვნა, რომლისთვისაც გსურთ სურათი.
3. Დააკლიკეთ Გენერირება.
ეს შექმნის სურათს თქვენთვის. გაითვალისწინეთ, რომ ეს არის დემო ვერსია და შესაძლოა არ იყოს ისეთივე, რაც DeepFloyd-ს სრულად შეუძლია.
DeepFloyd IF-ით, Stability AI-მ და DeepFloyd-მა შექმნეს ძლიერი და პერსპექტიული ახალი ტექსტი გამოსახულების მოდელი. T5 მოდელის ინტელექტის ჩართვით და კასკადური პიქსელის დიფუზიის მეთოდის გამოყენებით, მოდელი ქმნის ფოტორეალისტურ სურათებს მაღალი სიზუსტით. გენერაციული AI აგრძელებს განვითარებას, ცხადია, რომ მოდელები, როგორიცაა DeepFloyd IF, უფრო მნიშვნელოვან როლს შეასრულებენ ამ სფეროში.
წყარო: Stability AI-ს ბლოგი
ალექს კრეიგი
ალექსს ამოძრავებს გატაცება ტექნოლოგიით და სათამაშო შინაარსით. იქნება ეს უახლესი ვიდეო თამაშების თამაშით, უახლესი ტექნოლოგიური სიახლეების გათვალისწინებით თუ ჩართვით სხვა თანამოაზრე ადამიანებთან ერთად, ალექსის სიყვარული ტექნოლოგიებისა და თამაშების მიმართ აშკარაა ყველაფერში, რაც მას აკეთებს.
ალექსს ამოძრავებს გატაცება ტექნოლოგიით და სათამაშო შინაარსით. იქნება ეს უახლესი ვიდეო თამაშების თამაშით, უახლესი ტექნოლოგიური სიახლეების გათვალისწინებით თუ ჩართვით სხვა თანამოაზრე ადამიანებთან ერთად, ალექსის სიყვარული ტექნოლოგიებისა და თამაშების მიმართ აშკარაა ყველაფერში, რაც მას აკეთებს.