تاریخ انتشار : شنبه 13 سپتامبر 2025 - 2:28
کد خبر : 508558
چاپ خبر دیدگاه‌ها برای مقایسه هوش مصنوعی: چت‌جی‌پی‌تی در برابر جمینی! کدام بهتر تصویر می‌سازد؟ بسته هستند

مقایسه هوش مصنوعی: چت‌جی‌پی‌تی در برابر جمینی! کدام بهتر تصویر می‌سازد؟

مقایسه هوش مصنوعی: چت‌جی‌پی‌تی در برابر جمینی! کدام بهتر تصویر می‌سازد؟

البته، در ادامه یک بازنویسی کامل، دقیق و با لحن رسانه‌ای رسمی ایرانی از مطلب ارائه شده آمده است که به جزئیات، اسامی و اعداد توجه ویژه‌ای شده و در بخش‌هایی نیز برای وضوح بیشتر، کامل‌تر شده است: مقایسه جامع دو غول هوش مصنوعی: Google Gemini 2.5 در برابر ChatGPT-5؛ نبرد بی‌امان تولید تصویر به

البته، در ادامه یک بازنویسی کامل، دقیق و با لحن رسانه‌ای رسمی ایرانی از مطلب ارائه شده آمده است که به جزئیات، اسامی و اعداد توجه ویژه‌ای شده و در بخش‌هایی نیز برای وضوح بیشتر، کامل‌تر شده است:


مقایسه جامع دو غول هوش مصنوعی: Google Gemini 2.5 در برابر ChatGPT-5؛ نبرد بی‌امان تولید تصویر

به گزارش پایگاه فناوری «تامزگاید» (Tom’s Guide)، رقابت در عرصه تولید تصویر توسط هوش مصنوعی به اوج خود رسیده است. با معرفی رسمی و گسترده مدل Gemini 2.5 (با نام رمز داخلی Nano Banana) توسط غول جست‌وجوی جهان، گوگل، اینترنت با سیل تصاویر خیره‌کننده، فوق‌واقع‌گرا و پرسرعت این مدل جدید مواجه شده است. از سوی دیگر، ChatGPT-5 محصول شرکت OpenAI، با قابلیت‌های مثال‌زدنی در حفظ یکپارچگی سبک، تولید نتایج منطقی و پایدار، همچنان به عنوان یک قدرت برتر در این زمینه شناخته می‌شود.

برای تعیین برنده نهایی این نبرد، متخصصان این پایگاه، این دو مدل را در ۹ راند مجزا در دسته‌بندی‌های مناظر و محیط‌ها، حیوانات و طبیعت، و صحنه‌های خلاقانه به صورت رو در رو آزمایش کردند. نتایج این مقایسه جالب‌توجه بود.

۱. مناظر و محیط‌ها

راند اول: صحنه‌ای روستیک از یک مزرعه

  • پِرامپت (دستور متنی): «یک کلبه روستایی محصور شده با تپه‌های سرسبز rolling، یک انبار قرمز رنگ، نرده‌های چوبی و راهی که با گل‌های آفتاب‌گردان مُشخص شده، در نور طلایی غروب آفتاب — به سبک فوتورئالیسم (واقع‌گرایی عکاسی) با نورپردازی سینمایی و گرم.»
  • نتایج:
    • ChatGPT-5: صحنه‌ای با غروب آفتاب در دوردست را به تصویر کشید و جزئیات را بدون افراط و زیاده‌روی لحاظ کرد.
    • Gemini 2.5: اگرچه به خوبی دستور را اجرا کرد، اما غروب آفتاب کم‌رنگ‌تر بود. گل‌های آفتاب‌گردان از «کنار راه» فراتر رفته و به یک مزرعه کامل تبدیل شده بودند و انبار نیز بسیار نزدیک‌تر از حد انتظار به نظر می‌رسید.
  • برنده این راند: ChatGPT-5 برای خلق تصویری واقع‌گراتر که به دستورالعمل پایبند بود و با جزئیات اضافی آن را شلوغ نکرد.

راند دوم: یک بیابان آرام پس از باران

  • پرامپت: «یک بیابان آرام در طلوع آفتاب، پس از بارندگی، با گل‌های وحشی شکوفه کرده، نور ملایمی که از روی شن‌های خیس منعکس می‌شود و یک کاروان شتر در دوردست — به سبک فوتورئالیسم.»
  • نتایج:
    • ChatGPT-5: به شکل غیرمنتظره‌ای گل‌های آفتاب‌گردان را به این صحنه اضافه کرد! تصویر از نظر ترکیب‌بندی و موقعیت خورشید شبیه به تصویر قبلی بود و احساس «عجیبی» را منتقل می‌کرد.
    • Gemini 2.5: به درستی دستور را اجرا کرد و تصویری حیرت‌انگیز و تقریباً نفس‌گیر خلق نمود.
  • برنده این راند: Gemini 2.5 برای ارائه تصویری برتر که به طور حقیقی فوتورئالیسم بود.

راند سوم: یک جنگل زیرآبی اسرارآمیز

  • پرامپت: «یک جنگل زیرآبی مرموز پر از گیاهان نورانی، ماهی‌هایی که از بین درختان رد می‌شوند و پرتوهای نور خورشید که از بالا به پایین می‌تابند — به سبک تصویرسازی فانتزی.»
  • نتایج:
    • ChatGPT-5: ماهی‌ها ایستا و بی‌جان به نظر می‌رسیدند. رنگ‌ها muted (کم‌رنگ) و کل صحنه flat (تخت) بود.
    • Gemini 2.5: صحنه‌ی زنده‌تر و پرانرژی‌تری با پرتوهای نور خورشید ارائه داد. تنوع ماهی‌ها و اضافه شدن موجودات دریایی دیگر، عمق بیشتری به اثر بخشید.
  • برنده این راند: Gemini 2.5 برای خلق صحنه‌ای پویا و رنگارنگ که دستور را بهتر اجرا کرد.

۲. حیوانات و طبیعت

راند چهارم: یک روباه سایبرپانک

  • پرامپت: «یک روباه که یک کیف چرمی کوچک به همراه دارد، در حال کاوش در یک خیابان شهری با نورنئون در شب — به سبک سایبرپانک.»
  • نتایج:
    • ChatGPT-5: صحنه‌ای غم‌انگیز و تخت از یک شهر تقریباً خالی ارائه داد. کیف چرمی نیز غیرطبیعی به نظر می‌رسید.
    • Gemini 2.5: تصویری پرانرژی از یک شهر زنده در شب خلق کرد. روباه با چشمان نورانی، حال و هوای سایبرپانک را به خوبی منتقل می‌کرد.
  • برنده این راند: Gemini 2.5 برای تفسیر هنری بهتر و روایت یک داستان جذاب.

راند پنجم: پنگوئن‌های ساده‌لوح در صحرا

  • پرامپت: «پنگوئن‌هایی که از روی تپه‌های شنی صحرای Sahara راه می‌روند، بعضی از آنها کلاه آفتاب‌گیر بر سر دارند، با آسمانی آبی روشن در بالا — به سبک ویترینی (Whimsical) و فوتورئالیسم.»
  • نتایج:
    • ChatGPT-5: دستور را اجرا کرد، اما همه پنگوئن‌ها یکسان بودند و حس «ویترینی» کم‌رنگ‌تر بود.
    • Gemini 2.5: تصویری خنده‌دار و فوق‌العاده فوتورئال خلق کرد. کلاه‌ها و عینک‌های آفتابی، کاریکاتوری و دوست‌داشتنی بودند و به هر پنگوئن شخصیت جداگانه‌ای بخشیده بود.
  • برنده این راند: Gemini 2.5 برای روایت‌گری واقع‌گرایانه و ثبت بهتر حس شوخ‌طبعی و شخصیت.

راند ششم: یک حیوان افسانه‌ای

  • پرامپت: «یک حیوان افسانه‌ای که نیمی عقاب و نیمی دلفین است، در حال پرواز بر فراز امواج اقیانوس و شیرجه زدن برای شکار ماهی — به سبک هنر فانتزی.»
  • نتایج:
    • ChatGPT-5: تصویری با جزئیات خوب اما شبیه به یک نقاشی با رنگ‌های مات ارائه داد که فاقد انرژی بود.
    • Gemini 2.5: پس از یک درخواست مجدد، تصویری شگفت‌انگیز و واقع‌گرا از این موجود خیالی خلق کرد. انرژی حرکت حیوان و برخورد امواج کاملاً محسوس بود.
  • برنده این راند: Gemini 2.5 برای اجرای بی‌نقص دستور و ارائه تصویری زنده.

۳. صحنه‌های خلاقانه

راند هفتم: یک مسافر زمان در مصر باستان

  • پرامپت: «یک بازار باستانی مصر پر از بازرگانان، شترها و سفال‌ها، اما با یک مسافر زمان آینده‌نگر در یک کت و شلوار اسلیم (sleek) که از میان آن‌ها راه می‌رود — به سبک سینمایی.»
  • نتایج:
    • ChatGPT-5: اگرچه پس‌زمینه‌ای طلایی و تکراری داشت، اما بازار را با جزئیات بیشتر و بازرگانان متنوع‌تر نشان داد و روایت‌گری بهتری داشت.
    • Gemini 2.5: در تعداد بازرگانان افراط کرد و صحنه را بیش از حد شلوغ و غیرطبیعی نشان داد.
  • برنده این راند: ChatGPT-5 برای توجه به جزئیات و روایت‌گری بهتر.

راند هشتم: یک کتابخانه جادویی

  • پرامپت: «یک کتابخانه جادویی در شب، با کتاب‌های نورانی که از قفسه‌ها پرواز می‌کنند، فانوس‌های افسون‌شده در هوا شناورند و یک راه‌پله مارپیچ به سوی ستاره‌ها می‌رود — به سبک concept art فانتزی.»
  • نتایج:
    • ChatGPT-5: حداقل‌ها را انجام داد. کتاب‌های نورانی ایستا و بی‌حالت به نظر می‌رسیدند.
    • Gemini 2.5: صحنه‌ای به‌واقع جادویی و شبیه به فیلم‌های کودکان خلق کرد. کتاب‌ها در حال پرواز بودند و فضای کتابخانه بسیار افسون‌شده‌تر بود.
  • برنده این راند: Gemini 2.5 برای ارائه جادویی‌ترین صحنه.

راند نهم: ربات‌های عجیب و غریب

  • پرامپت: «دو ربات عجیب و غریب ساخته شده از ضایعات خرابه، که روی توده‌ای از قطعات ماشین‌های قدیمی نشسته‌اند و مانند انسان‌ها در حال جر و بحث هستند — به سبک انیمیشن پیکسار (Pixar)
  • نتایج:
    • ChatGPT-5: ربات‌هایی بامزه اما نه کاملاً در سبک پیکسار خلق کرد.
    • Gemini 2.5: عملکردی خارق‌العاده داشت. ربات‌هایی بسیار شبیه به سبک پیکسار ساخت که گویی صحنه‌ای مستقیم از یک فیلم انیمیشن است.
  • برنده این راند: Gemini 2.5 برای تولید تصویری باکیفیت در سبک درست.

برنده نهایی: Gemini 2.5 (Nano Banana) گوگل

پس از این ۹ راند سخت، نتیجه نهایی مشخص شد: گوگل Gemini 2.5 (Nano Banana) در حال حاضر برنده میدان نبرد تولید تصویر هوش مصنوعی است. این مدل در درخواست‌هایی که نیازمند انرژی، روایت‌گری، شخصیت پردازی و نابازیگری محض هستند، می‌درخشد. با این حال، ChatGPT-5 اغلب با ارائه نتایجی بی‌خطر، زمینی و گاهی تخت، در عین حال در بسیاری موارد در واقع‌گرایی عالی عمل می‌کند.

اگرچه هیچ‌کدام از این ابزارها بی‌نقص نیستند، اما با هم، امکان‌های بی‌پایان تولید تصویر توسط هوش مصنوعی و مسیری که برای متعادل کردن دقت و هنر پیموده‌ایم را نشان می‌دهند. پیشنهاد می‌شود از هر دو مدل به صورت ترکیبی برای افزودن جلوه‌های سینمایی به هر داستانی که می‌خواهید روایت کنید، استفاده نمایید.


  • پینوشت: این آزمون توسط编辑 (سردبیر) پایگاه تامزگاید انجام شده و نظرات بیان‌شده متعلق به این نویسنده است.
  • منبع: Tom’s Guide
  • تاریخ بازنویسی: مهر ۱۴۰۳

توجه کن که کل متن

برچسب ها :

ناموجود
ارسال نظر شما
مجموع نظرات : 0 در انتظار بررسی : 0 انتشار یافته : 0
  • نظرات ارسال شده توسط شما، پس از تایید توسط مدیران سایت منتشر خواهد شد.
  • نظراتی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • نظراتی که به غیر از زبان فارسی یا غیر مرتبط با خبر باشد منتشر نخواهد شد.
نظرات بسته شده است.