شرکت اوپن ایآی ، پنجشنبه گذشته ابزار جدید تبدیل متن به ویدیو سورا - Sora - را معرفی کرد. Sora یک سرویس مجهز به هوش مصنوعی مولد است که میتواند ویدیوهای کوتاه واقعگرایانهای تولید کند. بر اساس گفته این شرکت، ویدیوهایی کوتاهی که سورا بر اساس دستور متنی میسازد، هم میتوانند فضایی واقع گرایانه داشته و هم تخیلی باشند. اوپن ایآی برای معرفی این سرویس، ویدیویی در وبسایت خود منتشر کرده و مدعی است که تصاویر اصلی تولید شده هستند و تغییری روی آنها اعمال نشده است. سورا در زبان ژاپنی به معنی «آسمان» است و از آنجاییکه در واقع آسمان حد و مرزی ندارد، « سورا » انتخاب هوشمندانهای برای این سرویس هوش مصنوعی محسوب میشود.
به گزارش سرویس اخبار سینما سایت شات ایکس و به نقل از آی تی ایران ابزار سورا فعلا برای عموم عرضه نشده است. اوپن ایآی اعلام کرده که این سرویس هوش مصنوعی مولد فعلا فقط در دسترس متخصصان امنیت سایبری که اصطلاحا به آنها red teamers اطلاق میشود، قرار میگیرد. این متخصصان باید ابتدا نقاط ضعف و قابل رسوخ امنیتی و همینطور ریسکهای احتمالی این سرویس را شناسایی کنند. اوپن ایآی همچنین به تعدادی هنرمند بصری، طراحان و فیلم سازان نیز اجازه استفاده از سورا را داده تا از نظرات و بازخوردهای آنها برای توسعه این مدل هوش مصنوعی استفاده کند.
شکی نیست که قابلیتهای این سرویس هوشمند تولید ویدیو میتواند بی حد و مرز باشد. به گفته پروفسور دانشگاه Carnegie Mellon و محقق هوش مصنوعی مولد، جون-یان زو، کوتاه بودن زمان ویدیوها میتواند ساخت ویدیو در پلتفرمهایی مانند تیک تاک و یوتوب را بسیار ساده کند.
هوش مصنوعی قابلیت این را دارد که به زودی در صنعت فیلم سازی هالیوود تغییرات زیادی ایجاد کند. فیلمسازان ترجیح میدهند سیستمی را انتخاب کنند تا کنترل بیشتری روی مواردی همچون انیمیشنها و احساسات داشته باشند. این تکنولوژی جدید، که متن را به ویدیو تبدیل میکند، میتواند بهانه خوبی شود تا نویسندگان و بازیگران، تقاضای دستمزدهای بیشتری کنند زیرا با قدرت یافتن هوش مصنوعی، شغلهای این دسته افراد به خطر میافتد.
سورا همچنین میتواند در صنایع دیگر نیز کارایی زیادی داشته باشد مثلا خلق مدلهای سه بعدی و تولید فضای شبیه سازی برای آموزش رباتها یا خودروهای خودران. با پیشرفت این تکنولوژی زمانی خواهد رسید که چشمهای انسان قادر به تفریق ویدیوهای ساخته شده از واقعیت نخواهد بود و این کار تنها از طریق الگوریتمهای به خصوص امکان پذیر میشود.
مسئولیت شرکتهای تکنولوژی در عصر جدید هوش مصنوعی
جای تعجبی نخواهد داشت اگر گوگل و مایکروسافت هم ابزارهای مشابهی برای تولید ویدیو از روی متن توسعه دهند. هوش مصنوعی روز به روز گسترش مییابد و شرکتهای حوزه تکنولوژی اطلاعات زیادی درباره نحوه لیبل زدن روی محتوای ساخته شده توسط هوش مصنوعی منتشر میکنند. محققان این شرکتها نیز در حال توسعه ابزارهایی برای تشخیص ویدیوهای ساخته شده توسط این تکنولوژی هستند.
دستاورد جدید اوپن ایآی باعث نگرانی دیگر شرکتهای فعال در زمینه تولید ویدیوهای هوش مصنوعی میشود. رقبای اوپن ایآی از جمله Runway که توسط گوگل و انویدیا پشتیبانی مالی میشود و Andreessen Horowitz که حامی آن Irreverant Labs است، به احتمال زیاد با چالشهایی روبرو خواهند شد.
چرا ویدیوهای ساختگی اوپن ایآی اینقدر خوب هستند؟
سورا از مدل زبانی وسیع انحصاری اوپن ایآی برای تولید محتواهای جدید خود استفاده میکند، مدلی که از طریق حجم گستردهای از دادههای اینترنت آموزش دیده است. بحث مهم دیگری که وجود دارد این است که آیا شرکتها باید ملزم به پرداخت دستمزد به افرادی باشند که این ویدیوها، فیلمها و تصاویر را با استفاده از ابزارهای آموزش دیده توسط هوش مصنوعی میسازند؟
نکته اینجاست که شرکتی مانند اوپن ایآی هرگز جزئیات زیادی از نحوه دقیق عملکرد مدلهای انحصاری خود منتشر نمیکند و مدعی است که چنین کاری به فضای رقابتی این حوزه صدمه میزند.
آیا این سیستم جدید، تولید ویدیوهای فیک را گسترش میدهد؟
به زبان ساده پاسخ این سوال «بله» است. اما به عقیده زو، نگرانی اصلی زمانی ایجاد خواهد شد که این ابزار جدید اوپن ایآی در دسترس مردم عادی قرار بگیرد. در این شرایط تولید ویدیوهای دیپ فیک و محتواهای نامربوط و توهین آمیز افزایش خواهد یافت.