با هوش مصنوعی محبوب این روزها و توانایی هایش بیشتر آشنا شوید

میدجرنی متخصص تبدیل ذهنیات شما به تصویر!

میدجرنی متخصص تبدیل ذهنیات شما به تصویر!

بی بی سرور: «میدجرنی» یک برنامه هوش مصنوعی مولد تصویر است که رقبای بسیاری دارد. اگر تمایل دارید با نحوه کارکرد این برنامه، خاصیت ها و هزینه آن آشنا شوید، این گزارش را مطالعه کنید.


به گزارش بی بی سرور به نقل از ایسنا و به نقل از اندروید اتوریتی، به لطف برنامه های هوش مصنوعی مولد تصویر مانند «میدجرنی»(Midjourney) هم اکنون می توانید تصویری را در عرض چند دقیقه مستقیما از تصورات خود تداعی کنید. مهم نیست که مهارت های هنری ندارید یا در زندگی خود حتی یک قلم مو به دست نگرفته اید برای اینکه هوش مصنوعی می تواند هنر دیجیتال را در عرض چند ثانیه بوجود آورد. تنها چیزی که نیاز دارید، کمی متن است تا تصویر نقش بسته در ذهن شما را توصیف کند.
این گزارش به نکاتی می پردازد که باید در مورد هوش مصنوعی میدجرنی بدانید.

میدجرنی چیست؟
میدجرنی یک نمونه از هوش مصنوعی مولد است که می تواند گفته های زبان طبیعی را به تصاویر تبدیل کند. این تنها یکی از انواع گوناگون مولدهای تصویر مبتنی بر یادگیری ماشینی است که بتازگی ظهور کرده اند. به رغم وجود داشتن مدلهای یادگیری ماشینی مانند «دال-ئی»(DALL-E) شرکت «OpenAI» و «استیبل دیفیوژن»(Stable Diffusion) متعلق به «استبیلیتی ای آی»(Stability AI)، میدجرنی به یکی از بزرگ ترین اسامی هوش مصنوعی تبدیل گشته است.
با میدجرنی می توانید تصاویر باکیفیت بالا را از اعلان های ساده مبتنی بر متن ایجاد کنید. جهت استفاده کردن از میدجرنی، به سخت افزار یا نرم افزار تخصصی نیاز ندارید برای اینکه این برنامه کاملا بوسیله اپلیکیشن چت «دیسکورد»(Discord) کار می کند. تنها نقطه ضعف میدجرنی این است که قبل از شروع کردن تولید تصاویر باید کمی هزینه بپردازید. این برخلاف روند کاری خیلی از رقباست که بطور معمول حداقل چند تصویر را بصورت رایگان ارائه می دهند.
میدجرنی می تواند تصاویر خیره کننده ای را از یک توضیح متنی ساده بوجود آورد. با این وجود، موانع ورود به میدجرنی خیلی کم هستند و هر کسی می تواند از آن برای تولید تصاویر واقعی در عرض چند دقیقه استفاده نماید. بسته به درخواست کاربر، نتایج می توانند غیرعادی یا خیره کننده باشند.
در بعضی موارد، تصاویر میدجرنی حتی کارشناسان عکاسی و سایر حوزه ها را فریب داده اند. بنابراین، ممکنست تصاویر بسیار قانع کننده ای را که توسط هوش مصنوعی میدجرنی تولید شده اند، در رسانه های اجتماعی دیده باشید.
نمونه هایی از این تصاویر، «پاپ فرانسیس»(Pope Francis) پوشیده در کاپشن پف دار یا «دونالد ترامپ»(Donald Trump) دستگیرشده قبل از رویداد واقعی هستند. تعدادی از این تصاویر، صحنه های خلاقانه ای مانند صحنه های فیلم «جنگ ستارگان»(Star Wars) را به نمایش می گذارند.






برخلاف دال-ئی که توسط شرکت OpenAI خالق چت بات «ChatGPT» پشتیبانی می شود، میدجرنی خودرا به عنوان یک پروژه مستقل و با سرمایه خود معرفی می کند. علاوه بر این، میدجرنی تا به امروز هیچ بودجه ای را از بیرون دریافت نکرده است. در مقابل، OpenAI بیش از ۱۰ میلیارد دلار از شرکت «مایکروسافت»(Microsoft) و تعدادی سرمایه گذار دیگر جمع آوری کرده است. بنابراین، باتوجه به این موضوعات، نتایج میدجرنی کاملا چشم گیر هستند.

میدجرنی چطور کار می کند؟
ما همه چیز را در مورد عملکرد داخلی میدجرنی نمی دانیم برای اینکه این یک برنامه منبع بسته است و با کد اختصاصی اجرا می شود. با این وجود، ما به اندازه کافی در مورد فناوری زیربنای آن می دانیم تا یک توضیح کلی را ارائه دهیم.
میدجرنی بر دو فناوری نسبتا جدید یادگیری ماشینی، یعنی مدلهای زبانی بزرگ و مدلهای انتشاری متکی است. اگر از چت بات های هوش مصنوعی مانند ChatGPT بهره برده اید، ممکنست با حالت اول آشنا باشید. ابتدا یک مدل زبانی بزرگ به میدجرنی کمک می نماید تا معنای کلماتی را که شما در دستورات خود تایپ کرده اید، درک کند. سپس، این به یک گرافیک برداری تبدیل می شود که می توانید آنرا به عنوان یک نسخه عددی از دستور خود تصور کنید. در نهایت، این گرافیک برداری به هدایت کردن پروسه پیچیده دیگری به نام انتشار کمک می نماید.
میدجرنی از یک مدل انتشاری برای تبدیل کردن نویز تصادفی به هنر زیبا استفاده می نماید. مدل انتشاری که فقط در حدود یک دهه گذشته رایج شده است، موج ناگهانی تولیدکنندگان تصویر هوش مصنوعی را توضیح می دهد. در یک مدل انتشاری، شما یک کامپیوتر دارید که نویز تصادفی را به تدریج به مجموعه داده آموزشی خود اضافه می کند. با گذشت زمان، کامپیوتر یاد می گیرد که چگونه با معکوس کردن نویز، تصویر اصلی را به دست بیاورد. ایده این است که چنین مدلی با آموزش کافی می تواند یاد بگیرد چگونه تصاویر کاملا جدید را تولید نماید.
بنابراین، باید دید که این از نظر یک هوش مصنوعی مولد تصویر چگونه به نظر می آید. وقتی یک پیام متنی را به برنامه وارد می کنید، کار آن با میدانی از نویز بصری شروع می شود. می توانید گام اول را معادل تلویزیون ثابت در نظر بگیرید. تصویر در این مرحله شبیه به چیزی نیست که شما خواسته اید. سپس یک مدل هوش مصنوعی آموزش دیده، از مدل انتشاری پنهان برای کم کردن نویز در مراحل استفاده می نماید. در نهایت، تصویری شبیه به اشیاء و ایده ها در دنیای واقعی به دست می آید.
بنا بر این است که بطور معمول باید یک یا دو دقیقه منتظر بمانید تا تصویر تولیدشده توسط هوش مصنوعی کامل شود. اگر این پروسه را زودتر متوقف کنید، یک تصویر پر از نویز را دریافت خواهید کرد که مراحل حذف نویز را به اندازه کافی طی نکرده است.

هزینه میدجرنی چقدر است؟
بااینکه پیش تر شاهد بودیم که چت بات هایی مانند ChatGPT و «بینگ چت»(Bing Chat)، استفاده تقریباً نامحدود را بصورت رایگان ارائه می دهند اما این مساله در مورد تولیدکنندگان تصویر صدق نمی نماید. تقریباً همه آنها محدودیت هایی دارند و میدجرنی حتی یک آزمایش رایگان ارائه نمی دهد. دلیل این است که تولید تصویر به قدرت محاسباتی و خصوصاً «واحدهای پردازش گرافیکی»(GPU) زیادی نیاز دارد. علاوه بر این، هر پردازنده گرافیکی دارای حافظه ویدئویی محدودی است که مقدار زیادی از آن برای پروسه حذف نویز استفاده می شود. بدین سبب با در نظر گرفتن این موضوع، جای تعجب نیست که یک هوش مصنوعی مولد تصویر پیشرفته، مقداری هزینه برای کاربر داشته باشد.
میدجرنی حداقل ۱۰ دلار در ماه هزینه دارد اما ارزش بیشتری را در برنامه های سطح بالاتر فراهم می آورد.یک راهنمای اختصاصی در مورد سطوح قیمت گذاری و اکانت اشتراک میدجرنی وجود دارد اما کاربران باید ماهانه حداقل ۱۰ دلار بصورت ثابت بپردازند. این مبلغ، ۳.۳ ساعت زمان پردازش گرافیکی را فراهم می آورد که برای تقریباً ۲۰۰ تصویر خوب است. گران ترین طرح، ۶۰ ساعت زمان پردازش گرافیکی سریع را با ۱۲۰ دلار در ماه فراهم می آورد.
برنامه های پیشرفته میدجرنی، تصاویر نامحدودی را در «حالت آرام»(Relaxed mode) به شما می دهد اما باید تا ۱۰ دقیقه صبر کنید. اگر به بهترین کیفیت نیاز ندارید، سفارش می شود جایگزین های گوناگون میدجرنی را بررسی کنید. تقریباً همه شرکت های فناوری، از «گوگل» گرفته تا «متا» حالا دارای مولدهای تصویر رقیب هستند که خیلی از آنها یک سکه هم هزینه ندارند.




منبع:

1402/10/05
09:31:54
0.0 / 5
293
مطلب را می پسندید؟
(0)
(0)

تازه ترین مطالب مرتبط
نظرات بینندگان در مورد این مطلب
لطفا شما هم نظر دهید
= ۲ بعلاوه ۳
BBServer بی بی سرور

bbserver.ir - مالکیت معنوی سایت بی بی سرور متعلق به مالکین آن می باشد