Openai Dall-E 3 را نشان می دهد ، یک ژنراتور تصویر بر اساس Chatgpt ، Dall-E 3: Fusion بین Chatgpt و تولید تصاویر که Midjourney را لرزاند

Dall-E 3: همجوشی بین چتگپت و تولید تصاویر که Midjourney را لرزاند

Openai با ادغام دال در چتگپ ، موقعیت خود را به عنوان یک رهبر در جهان تولیدی هوش مصنوعی تقویت می کند. Chatgpt و Dall-E 3 ، با هم ، قول می دهند مرزهای هوش مصنوعی را دفع کنند.

Openai Dall-E 3 را نشان می دهد ، یک ژنراتور تصویر بر اساس chatgpt

آخرین نسخه این مدل بر اساس GPT برای تسهیل در ایجاد تصاویر پیچیده و منسجم است.

Openai ، شرکت پشت GPT Essential ، به تازگی آخرین مدل تولیدی خود را تا به امروز فاش کرده است. و این بار ، دوباره تصویری است که در کانون توجه قرار دارد. سربازان سام آلتمن نسخه سوم ژنراتور تصویر Dall-E را فاش کردند. او قول می دهد سایه ها ، جزئیات و پیچیدگی های بیشتر.

اولین نکته برجسته شده توسط Openai ، صحت آن است سریع. حتی بهترین ژنراتورهای آن لحظه ، مانند Midjourney یا Dreamstudio ، از یک مشکل مشترک رنج می برند: آنها تمایل به نادیده گرفتن کلمات خاص درخواست متنی.

برای به دست آوردن بهترین نتیجه ، بنابراین لازم است به صورت تجربی یاد بگیرید که با الگوریتم ارتباط برقرار کنید. این به معنای انجام آزمایشات زیادی بر روی واژگان است و به نوبه خود برای یافتن کسانی که به احتمال زیاد به درستی تفسیر می شوند ، پیدا می کند. این یک تمرین است که می تواند ظریف باشد وقتی کاربر در انتظار نتیجه بسیار خاص است ، از این رو اصطلاح ” مهندسی سریع »».

chatgpt برای ترکیب سریع

با Dall-E 3 ، Openai می خواهد این وضعیت را به پایان برساند. “” سیستم های مدرن متن به تصویر تمایل به نادیده گرفتن کلمات یا توضیحات دارند ، که کاربر را برای یادگیری سریع تبلیغی تشکیل می دهد. Dall-E 3 نشان دهنده یک قدم بزرگ در توانایی ما در تولید تصاویری است که دقیقاً به متن ارائه شده پایبند هستند “شرکت را نشان می دهد.

و برای انجام این کار ، شرکت از قبل ابزار مناسبی دارد: گودال. نسخه جدید مدل Diffusion 3 “است بومی ساخته شده است »در اطراف چت بابات. اکنون به عنوان یک واسطه برای هر جزئیات درخواست را تفسیر کنید. مدل زبان همچنین می تواند به کاربر در تولید کمک کند سریع بسیار مفصل به طوری که دال-ای دقیقاً آنچه را که از او انتظار می رود بدون استفاده از تکنیک های مهندسی سریع پیشرفته.

و اگر نتیجه اولیه مناسب نباشد ، اینگونه نیست. کافی است که دوباره توسط Chatgpt بروید تا از نظر رنگ ، شکل ، سبک ، جزئیات خاص تغییرات دقیقی داشته باشیم … به عبارت دیگر ، Openai غذاهای کوچک را در موارد بزرگ قرار داده است تا حداکثر درجه کنترل با حداقل تلاش و تخصص فنی.

در مثالهای ارائه شده توسط OpenAI ، همچنین توجه داشته باشید که Dall-E 3 قادر به تولید متون منسجم است. این چیزی است که ژنراتورهای تصویر تاکنون در انجام آن مشکل زیادی داشتند. به عنوان مثال ، آخرین نسخه Midjourney همیشه به اندازه کافی تولید می کند … نتایج عجیب و غریب وقتی از آنها خواسته می شود در این تمرین شرکت کنند.

از چهره های عمومی محافظت کنید

این شرکت هنوز هم در این نسخه سوم محدودیت های زیادی را تحمیل کرده است. به عنوان مثال ، مهندسان حفاظت های موجود در Dall-E و Dall-E 2 را تثبیت کرده اند که مانع از تولید محتوا کاربر می شود ” خشن ، بزرگسال یا نفرت انگیز »».

علاوه بر این ، Dall-E 3 برای امتناع از درخواست هایی که صریحاً از یک چهره عمومی استفاده می کند ، طراحی شده است. هدف این است که از استفاده از آن برای تبلیغات یا اهداف ضد اطلاعات جلوگیری شود.

به مالکیت معنوی احترام بگذارید

نکته مهم دیگر این به روزرسانی این است که به نظر می رسد Optai انتقادات زیادی را که به ژنراتورهای مختلف تصویر در مورد مالکیت معنوی پرداخته شده است ، توجه کرده است. دال می رود از درخواست هایی که از او می خواهد تقلید از سبک یک هنرمند زنده را رد کنید. این باید در را به تلاش های تقلبی متعدد ببندد.

از طرف دیگر ، این سیستم حفاظت مطمئناً ناقص خواهد بود. دقت این نسخه سوم شمشیر دو برابر است. از نظر تئوری ، یک کاربر به اندازه کافی ادراکی همیشه می تواند نتیجه نسبتاً نزدیک کسب کند. شما فقط باید بتوانید سبک هنرمند هدفمند را دقیقاً بدون نام صریح توصیف کنید.

Openai همچنین دو راه حل ارائه می دهد که به یک هنرمند اجازه می دهد امتناع کنید که از کار او برای آموزش دال استفاده می شود. اولین مورد پر کردن فرم در این آدرس است. اما اگر به دنبال محافظت از تعداد زیادی هستید ، مانند مواردی که در سبد آنلاین خود نگه دارید ، ایده آل ممنوعیت دسترسی به خزنده GPTBOT است. برای انجام این کار ، فقط دستورالعمل های موجود در این آدرس را دنبال کنید.

این امر به طور قابل توجهی توانایی Dall-E 3 را برای تقلید از آثار مورد نظر محدود می کند. حداقل ، اگر آنها قبلاً به قرقره منتقل نشده اند. و متأسفانه تعیین در عمل غیرممکن است ، زیرا داده های منبع پس از ادغام در مدل نگهداری نمی شوند.

DALL-E3 به طور رسمی اکتبر آینده برای مشتریان Chatgpt Plus و Chatgpt Exprise پیشنهادات راه اندازی می شود.

Dall-E 3: همجوشی بین چتگپت و تولید تصاویر که Midjourney را لرزاند

Openai ، شرکت مادر مادر ، دیگر ارائه نمی شود. او پس از ارائه به ما چتپپ ، او اکنون به لطف همجوشی دال و چتپ در دال ، توانایی دوم در تولید تصاویر دقیق را اعلام می کند.

ازار, برای کسانی که دنبال می کنند ، از یک ابزار تولید تصویر استفاده کنید: Midjourney. اگر این ساز در دنیای تولید تصویر قدرتمند و نوآورانه باشد ، دال-ای از Openai نیز در این مسیر قرار داشت ، با یک دوره به همان اندازه چشمگیر. و اوپوس جدید DALL-E 3 خطر خوب برای تغییر وضعیت.

با توجه به تظاهرات به اشتراک گذاشته شده توسط OpenAi ، مشخص است که Dall-E 3 از پیشینیان و رقبا متمایز است. جایی که Midjourney در بازگرداندن عکسبرداری ، اما هنوز هم به دستکاری های زیادی نیاز دارد ، Dall-E 3 نوید تولید تصویر بسیار کارآمدتر و کمتر اشتباه است. یک شاهکار قابل توجه ، به ویژه با توجه به این واقعیت که این یک پیشرفت بزرگ در مقایسه با Dall-E است.

علاوه بر این ، به نظر می رسد این ابزار جدید صلاحیت خاصی را برای مدیریت متن در تصاویر ایجاد کرده است ، و از ظرفیت برخی از رقبای خود مانند انتشار پایدار XL و DeepFloyd فراتر رفته است. به طور خاص ، Openai توانایی خود را در تولید تصاویر قانع کننده از حروف ، چهره ها و حتی دست های انسان برجسته می کند (یک مشکل واقعی برای این ابزارها).

Dall-E 3 // منبع: OpenAi

Openai با ادغام دال در چتگپ ، موقعیت خود را به عنوان یک رهبر در جهان تولیدی هوش مصنوعی تقویت می کند. Chatgpt و Dall-E 3 ، با هم ، قول می دهند مرزهای هوش مصنوعی را دفع کنند.

Chatbots نه تنها قادر به مکالمه به روشی تقریبا انسانی بلکه تصور و ایجاد تصاویر از توضیحات ساده خواهد بود. ما نمی توانیم صبر کنیم تا آزمایش کنیم.

اگر می خواهید Dall-E 3 را آزمایش کنید ، برای کاربران Chatgpt Plus و Enterprise در دسترس خواهد بود. استفاده از Midjourney بسیار ساده تر است … جایی که به مشتری Discord نیاز دارید.

گودال

تصاویر برای آنها ایجاد شده است ?

سوال حق چاپ مربوط به تصاویر ایجاد شده توسط هوش مصنوعی در حال حاضر یک موضوع داغ است. مقررات فعلی حاکی از آن است که تصاویر IA وارد حوزه عمومی می شوند. با این حال ، Openai به وضوح اعلام می کند که خاصیت تصاویر تولید شده توسط Dall-E 3 به سازندگان آنها باز می گردد. و این بحث دیگری در بخش است.

Bing Cat نیز حق دارد Dall-E 3

این پنجشنبه ، 21 سپتامبر ، مایکروسافت کنفرانسی را برای اعلام ورود بعدی کپیلوت برگزار کرد ، اما همچنین محدوده سطح جدید. به طور موازی ، این شرکت با ورود مدل Dall-E 3 در Bing Image Creator ارتباط برقرار کرد. به عنوان یک یادآوری ، این ابزار ایجاد تصاویر بینگ چت است. به گفته مایکروسافت ، Bing Image Creator ” همچنین آنچه را که می خواهید درک می کند ، که به شما امکان می دهد تصاویر دقیق تری بدست آورید. »»

مایکروسافت همچنین می گوید با اضافه کردن “فراتر بروید” یک علامت دیجیتالی نامرئی برای تمام تصاویر ایجاد شده توسط هوش مصنوعی در بینگ ، از جمله زمان و تاریخ ایجاد آنها. “دشوار است بدانید که این علامت چقدر قدرتمند خواهد بود ، و نه چگونه می توانیم حضور آن را بررسی کنیم یا نه ، اما این اولین قدم است.

برای دنبال کردن ما ، ما از شما دعوت می کنیم تا برنامه Android و iOS خود را بارگیری کنید. می توانید مقالات ، پرونده های ما را بخوانید و آخرین فیلم های YouTube ما را تماشا کنید.