مقایسه هوش مصنوعی: چتجیپیتی در برابر جمینی! کدام بهتر تصویر میسازد؟
البته، در ادامه یک بازنویسی کامل، دقیق و با لحن رسانهای رسمی ایرانی از مطلب ارائه شده آمده است که به جزئیات، اسامی و اعداد توجه ویژهای شده و در بخشهایی نیز برای وضوح بیشتر، کاملتر شده است: مقایسه جامع دو غول هوش مصنوعی: Google Gemini 2.5 در برابر ChatGPT-5؛ نبرد بیامان تولید تصویر به
البته، در ادامه یک بازنویسی کامل، دقیق و با لحن رسانهای رسمی ایرانی از مطلب ارائه شده آمده است که به جزئیات، اسامی و اعداد توجه ویژهای شده و در بخشهایی نیز برای وضوح بیشتر، کاملتر شده است:
مقایسه جامع دو غول هوش مصنوعی: Google Gemini 2.5 در برابر ChatGPT-5؛ نبرد بیامان تولید تصویر
به گزارش پایگاه فناوری «تامزگاید» (Tom’s Guide)، رقابت در عرصه تولید تصویر توسط هوش مصنوعی به اوج خود رسیده است. با معرفی رسمی و گسترده مدل Gemini 2.5 (با نام رمز داخلی Nano Banana) توسط غول جستوجوی جهان، گوگل، اینترنت با سیل تصاویر خیرهکننده، فوقواقعگرا و پرسرعت این مدل جدید مواجه شده است. از سوی دیگر، ChatGPT-5 محصول شرکت OpenAI، با قابلیتهای مثالزدنی در حفظ یکپارچگی سبک، تولید نتایج منطقی و پایدار، همچنان به عنوان یک قدرت برتر در این زمینه شناخته میشود.
برای تعیین برنده نهایی این نبرد، متخصصان این پایگاه، این دو مدل را در ۹ راند مجزا در دستهبندیهای مناظر و محیطها، حیوانات و طبیعت، و صحنههای خلاقانه به صورت رو در رو آزمایش کردند. نتایج این مقایسه جالبتوجه بود.
۱. مناظر و محیطها
راند اول: صحنهای روستیک از یک مزرعه
- پِرامپت (دستور متنی): «یک کلبه روستایی محصور شده با تپههای سرسبز rolling، یک انبار قرمز رنگ، نردههای چوبی و راهی که با گلهای آفتابگردان مُشخص شده، در نور طلایی غروب آفتاب — به سبک فوتورئالیسم (واقعگرایی عکاسی) با نورپردازی سینمایی و گرم.»
- نتایج:
- ChatGPT-5: صحنهای با غروب آفتاب در دوردست را به تصویر کشید و جزئیات را بدون افراط و زیادهروی لحاظ کرد.
- Gemini 2.5: اگرچه به خوبی دستور را اجرا کرد، اما غروب آفتاب کمرنگتر بود. گلهای آفتابگردان از «کنار راه» فراتر رفته و به یک مزرعه کامل تبدیل شده بودند و انبار نیز بسیار نزدیکتر از حد انتظار به نظر میرسید.
- برنده این راند: ChatGPT-5 برای خلق تصویری واقعگراتر که به دستورالعمل پایبند بود و با جزئیات اضافی آن را شلوغ نکرد.
راند دوم: یک بیابان آرام پس از باران
- پرامپت: «یک بیابان آرام در طلوع آفتاب، پس از بارندگی، با گلهای وحشی شکوفه کرده، نور ملایمی که از روی شنهای خیس منعکس میشود و یک کاروان شتر در دوردست — به سبک فوتورئالیسم.»
- نتایج:
- ChatGPT-5: به شکل غیرمنتظرهای گلهای آفتابگردان را به این صحنه اضافه کرد! تصویر از نظر ترکیببندی و موقعیت خورشید شبیه به تصویر قبلی بود و احساس «عجیبی» را منتقل میکرد.
- Gemini 2.5: به درستی دستور را اجرا کرد و تصویری حیرتانگیز و تقریباً نفسگیر خلق نمود.
- برنده این راند: Gemini 2.5 برای ارائه تصویری برتر که به طور حقیقی فوتورئالیسم بود.
راند سوم: یک جنگل زیرآبی اسرارآمیز
- پرامپت: «یک جنگل زیرآبی مرموز پر از گیاهان نورانی، ماهیهایی که از بین درختان رد میشوند و پرتوهای نور خورشید که از بالا به پایین میتابند — به سبک تصویرسازی فانتزی.»
- نتایج:
- ChatGPT-5: ماهیها ایستا و بیجان به نظر میرسیدند. رنگها muted (کمرنگ) و کل صحنه flat (تخت) بود.
- Gemini 2.5: صحنهی زندهتر و پرانرژیتری با پرتوهای نور خورشید ارائه داد. تنوع ماهیها و اضافه شدن موجودات دریایی دیگر، عمق بیشتری به اثر بخشید.
- برنده این راند: Gemini 2.5 برای خلق صحنهای پویا و رنگارنگ که دستور را بهتر اجرا کرد.
۲. حیوانات و طبیعت
راند چهارم: یک روباه سایبرپانک
- پرامپت: «یک روباه که یک کیف چرمی کوچک به همراه دارد، در حال کاوش در یک خیابان شهری با نورنئون در شب — به سبک سایبرپانک.»
- نتایج:
- ChatGPT-5: صحنهای غمانگیز و تخت از یک شهر تقریباً خالی ارائه داد. کیف چرمی نیز غیرطبیعی به نظر میرسید.
- Gemini 2.5: تصویری پرانرژی از یک شهر زنده در شب خلق کرد. روباه با چشمان نورانی، حال و هوای سایبرپانک را به خوبی منتقل میکرد.
- برنده این راند: Gemini 2.5 برای تفسیر هنری بهتر و روایت یک داستان جذاب.
راند پنجم: پنگوئنهای سادهلوح در صحرا
- پرامپت: «پنگوئنهایی که از روی تپههای شنی صحرای Sahara راه میروند، بعضی از آنها کلاه آفتابگیر بر سر دارند، با آسمانی آبی روشن در بالا — به سبک ویترینی (Whimsical) و فوتورئالیسم.»
- نتایج:
- ChatGPT-5: دستور را اجرا کرد، اما همه پنگوئنها یکسان بودند و حس «ویترینی» کمرنگتر بود.
- Gemini 2.5: تصویری خندهدار و فوقالعاده فوتورئال خلق کرد. کلاهها و عینکهای آفتابی، کاریکاتوری و دوستداشتنی بودند و به هر پنگوئن شخصیت جداگانهای بخشیده بود.
- برنده این راند: Gemini 2.5 برای روایتگری واقعگرایانه و ثبت بهتر حس شوخطبعی و شخصیت.
راند ششم: یک حیوان افسانهای
- پرامپت: «یک حیوان افسانهای که نیمی عقاب و نیمی دلفین است، در حال پرواز بر فراز امواج اقیانوس و شیرجه زدن برای شکار ماهی — به سبک هنر فانتزی.»
- نتایج:
- ChatGPT-5: تصویری با جزئیات خوب اما شبیه به یک نقاشی با رنگهای مات ارائه داد که فاقد انرژی بود.
- Gemini 2.5: پس از یک درخواست مجدد، تصویری شگفتانگیز و واقعگرا از این موجود خیالی خلق کرد. انرژی حرکت حیوان و برخورد امواج کاملاً محسوس بود.
- برنده این راند: Gemini 2.5 برای اجرای بینقص دستور و ارائه تصویری زنده.
۳. صحنههای خلاقانه
راند هفتم: یک مسافر زمان در مصر باستان
- پرامپت: «یک بازار باستانی مصر پر از بازرگانان، شترها و سفالها، اما با یک مسافر زمان آیندهنگر در یک کت و شلوار اسلیم (sleek) که از میان آنها راه میرود — به سبک سینمایی.»
- نتایج:
- ChatGPT-5: اگرچه پسزمینهای طلایی و تکراری داشت، اما بازار را با جزئیات بیشتر و بازرگانان متنوعتر نشان داد و روایتگری بهتری داشت.
- Gemini 2.5: در تعداد بازرگانان افراط کرد و صحنه را بیش از حد شلوغ و غیرطبیعی نشان داد.
- برنده این راند: ChatGPT-5 برای توجه به جزئیات و روایتگری بهتر.
راند هشتم: یک کتابخانه جادویی
- پرامپت: «یک کتابخانه جادویی در شب، با کتابهای نورانی که از قفسهها پرواز میکنند، فانوسهای افسونشده در هوا شناورند و یک راهپله مارپیچ به سوی ستارهها میرود — به سبک concept art فانتزی.»
- نتایج:
- ChatGPT-5: حداقلها را انجام داد. کتابهای نورانی ایستا و بیحالت به نظر میرسیدند.
- Gemini 2.5: صحنهای بهواقع جادویی و شبیه به فیلمهای کودکان خلق کرد. کتابها در حال پرواز بودند و فضای کتابخانه بسیار افسونشدهتر بود.
- برنده این راند: Gemini 2.5 برای ارائه جادوییترین صحنه.
راند نهم: رباتهای عجیب و غریب
- پرامپت: «دو ربات عجیب و غریب ساخته شده از ضایعات خرابه، که روی تودهای از قطعات ماشینهای قدیمی نشستهاند و مانند انسانها در حال جر و بحث هستند — به سبک انیمیشن پیکسار (Pixar).»
- نتایج:
- ChatGPT-5: رباتهایی بامزه اما نه کاملاً در سبک پیکسار خلق کرد.
- Gemini 2.5: عملکردی خارقالعاده داشت. رباتهایی بسیار شبیه به سبک پیکسار ساخت که گویی صحنهای مستقیم از یک فیلم انیمیشن است.
- برنده این راند: Gemini 2.5 برای تولید تصویری باکیفیت در سبک درست.
برنده نهایی: Gemini 2.5 (Nano Banana) گوگل
پس از این ۹ راند سخت، نتیجه نهایی مشخص شد: گوگل Gemini 2.5 (Nano Banana) در حال حاضر برنده میدان نبرد تولید تصویر هوش مصنوعی است. این مدل در درخواستهایی که نیازمند انرژی، روایتگری، شخصیت پردازی و نابازیگری محض هستند، میدرخشد. با این حال، ChatGPT-5 اغلب با ارائه نتایجی بیخطر، زمینی و گاهی تخت، در عین حال در بسیاری موارد در واقعگرایی عالی عمل میکند.
اگرچه هیچکدام از این ابزارها بینقص نیستند، اما با هم، امکانهای بیپایان تولید تصویر توسط هوش مصنوعی و مسیری که برای متعادل کردن دقت و هنر پیمودهایم را نشان میدهند. پیشنهاد میشود از هر دو مدل به صورت ترکیبی برای افزودن جلوههای سینمایی به هر داستانی که میخواهید روایت کنید، استفاده نمایید.
- پینوشت: این آزمون توسط编辑 (سردبیر) پایگاه تامزگاید انجام شده و نظرات بیانشده متعلق به این نویسنده است.
- منبع: Tom’s Guide
- تاریخ بازنویسی: مهر ۱۴۰۳
توجه کن که کل متن
برچسب ها :
ناموجود- نظرات ارسال شده توسط شما، پس از تایید توسط مدیران سایت منتشر خواهد شد.
- نظراتی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
- نظراتی که به غیر از زبان فارسی یا غیر مرتبط با خبر باشد منتشر نخواهد شد.


ارسال نظر شما
مجموع نظرات : 0 در انتظار بررسی : 0 انتشار یافته : 0