Black Forest Labs از هوش مصنوعی Flux رونمایی کرده که با ۱۲ میلیارد پارامتر بزرگترین مدل متنباز تبدیل متن به تصویر تا امروز است. Flux میتواند تصاویری ارائه دهد که با نمونههای میدجرنی قابل رقابت هستند و احتمالاً بتواند هر مدل دیگری را که تاکنون در دسترس قرار گرفته، اعم از متنباز یا بسته، شکست دهد.
به گزارش سرویس اخبار هوش مصنوعی سایت شات ایکس و به نقل از باشگاه خبرنگاران جوان Black Forest Labs از هوش مصنوعی Flux رونمایی کرده که با ۱۲ میلیارد پارامتر بزرگترین مدل متنبازتبدیل متن به تصویر تا امروز است.
Flux میتواند تصاویری ارائه دهد که با نمونههای میدجرنی قابل رقابت هستند و احتمالاً بتواند هر مدل دیگری را که تاکنون در دسترس قرار گرفته، اعم از متنباز یا بسته، شکست دهد.
مقایسه هوش مصنوعی Flux با میدجرنی
یکی از تفاوتهای اصلی Flux با میدجرنی در این است که Flux متن باز است و میتوان آن را روی یک سیستم نسبتاً خوب اجرا کرد. دو نسخه Flux Dev و Flux Schnell اکنون برای دانلود در Hugging Face در دسترس هستند.
مقایسه خروجی Flux با میدجرنی
ازندگان Flux میگویند که در تستهای بنچمارک، این مدل ۱۲ میلیارد پارامتری در تولید تصویر از مدلهایی مانند Dall-E 3 (HD)، میدجرنی v6.0 و SD3 Ultra در بخش کیفیت بصری، وفاداری به پرامپت کاربر، تایپوگرافی و تنوع خروجی، بهتر عمل میکند.
بااینحال، اگر بخواهید روی سیستم خود از مدل متنباز Flux استفاده کنید، نیاز به پردازشگر گرافیکی قدرتمندی دارید. این مدل حدود ۲۳ گیگابایت حجم دارد؛ یعنی به حدود ۲۴ گیگابایت VRAM نیاز خواهید داشت. البته شما میتوانید از پلتفرمهای آنلاین مانند NightCafe و Based Labs نیز برای تولید تصاویر از Flux استفاده کنید.
بهطورکلی، نسخه پرو Flux میتواند رقیب خوبی برای میدجرنی و سایر مدلهای پولی باشد. بااینحال، با توجه به اینکه مدلهای جدید مانند Auraflow یا Flux بسیار سنگین هستند، افرادی که پردازشگرهای گرافیکی متوسطی دارند، میتوانند به سراغ SD3 یا حتی نسخههای سبکتر SDXL بروند.