تاریخ انتشار : شنبه 13 سپتامبر 2025 - 2:28

کد خبر : 508558

چاپ خبر دیدگاه‌ها بسته هستند

مقایسه هوش مصنوعی: چت‌جی‌پی‌تی در برابر جمینی! کدام بهتر تصویر می‌سازد؟

البته، در ادامه یک بازنویسی کامل، دقیق و با لحن رسانه‌ای رسمی ایرانی از مطلب ارائه شده آمده است که به جزئیات، اسامی و اعداد توجه ویژه‌ای شده و در بخش‌هایی نیز برای وضوح بیشتر، کامل‌تر شده است: مقایسه جامع دو غول هوش مصنوعی: Google Gemini 2.5 در برابر ChatGPT-5؛ نبرد بی‌امان تولید تصویر به

مقایسه جامع دو غول هوش مصنوعی: Google Gemini 2.5 در برابر ChatGPT-5؛ نبرد بی‌امان تولید تصویر

به گزارش پایگاه فناوری «تامزگاید» (Tom’s Guide)، رقابت در عرصه تولید تصویر توسط هوش مصنوعی به اوج خود رسیده است. با معرفی رسمی و گسترده مدل Gemini 2.5 (با نام رمز داخلی Nano Banana) توسط غول جست‌وجوی جهان، گوگل، اینترنت با سیل تصاویر خیره‌کننده، فوق‌واقع‌گرا و پرسرعت این مدل جدید مواجه شده است. از سوی دیگر، ChatGPT-5 محصول شرکت OpenAI، با قابلیت‌های مثال‌زدنی در حفظ یکپارچگی سبک، تولید نتایج منطقی و پایدار، همچنان به عنوان یک قدرت برتر در این زمینه شناخته می‌شود.

برای تعیین برنده نهایی این نبرد، متخصصان این پایگاه، این دو مدل را در ۹ راند مجزا در دسته‌بندی‌های مناظر و محیط‌ها، حیوانات و طبیعت، و صحنه‌های خلاقانه به صورت رو در رو آزمایش کردند. نتایج این مقایسه جالب‌توجه بود.

۱. مناظر و محیط‌ها

راند اول: صحنه‌ای روستیک از یک مزرعه

پِرامپت (دستور متنی): «یک کلبه روستایی محصور شده با تپه‌های سرسبز rolling، یک انبار قرمز رنگ، نرده‌های چوبی و راهی که با گل‌های آفتاب‌گردان مُشخص شده، در نور طلایی غروب آفتاب — به سبک فوتورئالیسم (واقع‌گرایی عکاسی) با نورپردازی سینمایی و گرم.»
نتایج:
- ChatGPT-5: صحنه‌ای با غروب آفتاب در دوردست را به تصویر کشید و جزئیات را بدون افراط و زیاده‌روی لحاظ کرد.
- Gemini 2.5: اگرچه به خوبی دستور را اجرا کرد، اما غروب آفتاب کم‌رنگ‌تر بود. گل‌های آفتاب‌گردان از «کنار راه» فراتر رفته و به یک مزرعه کامل تبدیل شده بودند و انبار نیز بسیار نزدیک‌تر از حد انتظار به نظر می‌رسید.
برنده این راند: ChatGPT-5 برای خلق تصویری واقع‌گراتر که به دستورالعمل پایبند بود و با جزئیات اضافی آن را شلوغ نکرد.

راند دوم: یک بیابان آرام پس از باران

پرامپت: «یک بیابان آرام در طلوع آفتاب، پس از بارندگی، با گل‌های وحشی شکوفه کرده، نور ملایمی که از روی شن‌های خیس منعکس می‌شود و یک کاروان شتر در دوردست — به سبک فوتورئالیسم.»
نتایج:
- ChatGPT-5: به شکل غیرمنتظره‌ای گل‌های آفتاب‌گردان را به این صحنه اضافه کرد! تصویر از نظر ترکیب‌بندی و موقعیت خورشید شبیه به تصویر قبلی بود و احساس «عجیبی» را منتقل می‌کرد.
- Gemini 2.5: به درستی دستور را اجرا کرد و تصویری حیرت‌انگیز و تقریباً نفس‌گیر خلق نمود.
برنده این راند: Gemini 2.5 برای ارائه تصویری برتر که به طور حقیقی فوتورئالیسم بود.

راند سوم: یک جنگل زیرآبی اسرارآمیز

پرامپت: «یک جنگل زیرآبی مرموز پر از گیاهان نورانی، ماهی‌هایی که از بین درختان رد می‌شوند و پرتوهای نور خورشید که از بالا به پایین می‌تابند — به سبک تصویرسازی فانتزی.»
نتایج:
- ChatGPT-5: ماهی‌ها ایستا و بی‌جان به نظر می‌رسیدند. رنگ‌ها muted (کم‌رنگ) و کل صحنه flat (تخت) بود.
- Gemini 2.5: صحنه‌ی زنده‌تر و پرانرژی‌تری با پرتوهای نور خورشید ارائه داد. تنوع ماهی‌ها و اضافه شدن موجودات دریایی دیگر، عمق بیشتری به اثر بخشید.
برنده این راند: Gemini 2.5 برای خلق صحنه‌ای پویا و رنگارنگ که دستور را بهتر اجرا کرد.

۲. حیوانات و طبیعت

راند چهارم: یک روباه سایبرپانک

پرامپت: «یک روباه که یک کیف چرمی کوچک به همراه دارد، در حال کاوش در یک خیابان شهری با نورنئون در شب — به سبک سایبرپانک.»
نتایج:
- ChatGPT-5: صحنه‌ای غم‌انگیز و تخت از یک شهر تقریباً خالی ارائه داد. کیف چرمی نیز غیرطبیعی به نظر می‌رسید.
- Gemini 2.5: تصویری پرانرژی از یک شهر زنده در شب خلق کرد. روباه با چشمان نورانی، حال و هوای سایبرپانک را به خوبی منتقل می‌کرد.
برنده این راند: Gemini 2.5 برای تفسیر هنری بهتر و روایت یک داستان جذاب.

راند پنجم: پنگوئن‌های ساده‌لوح در صحرا

پرامپت: «پنگوئن‌هایی که از روی تپه‌های شنی صحرای Sahara راه می‌روند، بعضی از آنها کلاه آفتاب‌گیر بر سر دارند، با آسمانی آبی روشن در بالا — به سبک ویترینی (Whimsical) و فوتورئالیسم.»
نتایج:
- ChatGPT-5: دستور را اجرا کرد، اما همه پنگوئن‌ها یکسان بودند و حس «ویترینی» کم‌رنگ‌تر بود.
- Gemini 2.5: تصویری خنده‌دار و فوق‌العاده فوتورئال خلق کرد. کلاه‌ها و عینک‌های آفتابی، کاریکاتوری و دوست‌داشتنی بودند و به هر پنگوئن شخصیت جداگانه‌ای بخشیده بود.
برنده این راند: Gemini 2.5 برای روایت‌گری واقع‌گرایانه و ثبت بهتر حس شوخ‌طبعی و شخصیت.

راند ششم: یک حیوان افسانه‌ای

پرامپت: «یک حیوان افسانه‌ای که نیمی عقاب و نیمی دلفین است، در حال پرواز بر فراز امواج اقیانوس و شیرجه زدن برای شکار ماهی — به سبک هنر فانتزی.»
نتایج:
- ChatGPT-5: تصویری با جزئیات خوب اما شبیه به یک نقاشی با رنگ‌های مات ارائه داد که فاقد انرژی بود.
- Gemini 2.5: پس از یک درخواست مجدد، تصویری شگفت‌انگیز و واقع‌گرا از این موجود خیالی خلق کرد. انرژی حرکت حیوان و برخورد امواج کاملاً محسوس بود.
برنده این راند: Gemini 2.5 برای اجرای بی‌نقص دستور و ارائه تصویری زنده.

۳. صحنه‌های خلاقانه

راند هفتم: یک مسافر زمان در مصر باستان

پرامپت: «یک بازار باستانی مصر پر از بازرگانان، شترها و سفال‌ها، اما با یک مسافر زمان آینده‌نگر در یک کت و شلوار اسلیم (sleek) که از میان آن‌ها راه می‌رود — به سبک سینمایی.»
نتایج:
- ChatGPT-5: اگرچه پس‌زمینه‌ای طلایی و تکراری داشت، اما بازار را با جزئیات بیشتر و بازرگانان متنوع‌تر نشان داد و روایت‌گری بهتری داشت.
- Gemini 2.5: در تعداد بازرگانان افراط کرد و صحنه را بیش از حد شلوغ و غیرطبیعی نشان داد.
برنده این راند: ChatGPT-5 برای توجه به جزئیات و روایت‌گری بهتر.

راند هشتم: یک کتابخانه جادویی

پرامپت: «یک کتابخانه جادویی در شب، با کتاب‌های نورانی که از قفسه‌ها پرواز می‌کنند، فانوس‌های افسون‌شده در هوا شناورند و یک راه‌پله مارپیچ به سوی ستاره‌ها می‌رود — به سبک concept art فانتزی.»
نتایج:
- ChatGPT-5: حداقل‌ها را انجام داد. کتاب‌های نورانی ایستا و بی‌حالت به نظر می‌رسیدند.
- Gemini 2.5: صحنه‌ای به‌واقع جادویی و شبیه به فیلم‌های کودکان خلق کرد. کتاب‌ها در حال پرواز بودند و فضای کتابخانه بسیار افسون‌شده‌تر بود.
برنده این راند: Gemini 2.5 برای ارائه جادویی‌ترین صحنه.

راند نهم: ربات‌های عجیب و غریب

پرامپت: «دو ربات عجیب و غریب ساخته شده از ضایعات خرابه، که روی توده‌ای از قطعات ماشین‌های قدیمی نشسته‌اند و مانند انسان‌ها در حال جر و بحث هستند — به سبک انیمیشن پیکسار (Pixar).»
نتایج:
- ChatGPT-5: ربات‌هایی بامزه اما نه کاملاً در سبک پیکسار خلق کرد.
- Gemini 2.5: عملکردی خارق‌العاده داشت. ربات‌هایی بسیار شبیه به سبک پیکسار ساخت که گویی صحنه‌ای مستقیم از یک فیلم انیمیشن است.
برنده این راند: Gemini 2.5 برای تولید تصویری باکیفیت در سبک درست.

برنده نهایی: Gemini 2.5 (Nano Banana) گوگل

پس از این ۹ راند سخت، نتیجه نهایی مشخص شد: گوگل Gemini 2.5 (Nano Banana) در حال حاضر برنده میدان نبرد تولید تصویر هوش مصنوعی است. این مدل در درخواست‌هایی که نیازمند انرژی، روایت‌گری، شخصیت پردازی و نابازیگری محض هستند، می‌درخشد. با این حال، ChatGPT-5 اغلب با ارائه نتایجی بی‌خطر، زمینی و گاهی تخت، در عین حال در بسیاری موارد در واقع‌گرایی عالی عمل می‌کند.

اگرچه هیچ‌کدام از این ابزارها بی‌نقص نیستند، اما با هم، امکان‌های بی‌پایان تولید تصویر توسط هوش مصنوعی و مسیری که برای متعادل کردن دقت و هنر پیموده‌ایم را نشان می‌دهند. پیشنهاد می‌شود از هر دو مدل به صورت ترکیبی برای افزودن جلوه‌های سینمایی به هر داستانی که می‌خواهید روایت کنید، استفاده نمایید.

پینوشت: این آزمون توسط编辑 (سردبیر) پایگاه تامزگاید انجام شده و نظرات بیان‌شده متعلق به این نویسنده است.
منبع: Tom’s Guide
تاریخ بازنویسی: مهر ۱۴۰۳

توجه کن که کل متن

لینک کوتاه

برچسب ها :

ناموجود

ارسال نظر شما

مجموع نظرات : 0 در انتظار بررسی : 0 انتشار یافته : 0

نظرات ارسال شده توسط شما، پس از تایید توسط مدیران سایت منتشر خواهد شد.
نظراتی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
نظراتی که به غیر از زبان فارسی یا غیر مرتبط با خبر باشد منتشر نخواهد شد.

نظرات بسته شده است.