جمینی یا چت جی‌پی‌تی کدام هوش‌مصنوعی پیروز میدان می‌شود؟

| علمی و فناوری | عمومی

۱۴۰۲/۱۲/۱۴

۱۰:۴۴:۵۸

| کد خبر: ۲۰۶۶۶۷۲

جمینی یا چت جی‌پی‌تی کدام هوش‌مصنوعی پیروز میدان می‌شود؟

هوش‌مصنوعی جمینی در مقابل چت جی‌پی‌تی در چند مرحله مورد بررسی و مقایسه قرار گرفتند تا با این اقدام مشخص شود که از میان این دو ابزار کدام یک برنده می‌شود.

به گزارش خبرنگار علم و فناوری خبرگزاری برنا؛ چت بات‌ها به یکی از ویژگی‌های اصلی هوش‌مصنوعی مولد تبدیل شده‌اند که ChatGPT و Gemini به ۲ تا از پرطرفدارترین و پرکاربردترین آن‌ها تبدیل شده‌اند، اما برای آن که با این ۲ ابزار بیش‌تر آشنا شویم و بدانیم که کدام یک از آن‌ها برنده این میدان می‌شود در چند مرحله به مقایسه آن‌ها پرداختیم.

گفتنی است نسخه رایگان هر دو مدل مورد مقایسه و بررسی قرار گرفته است و همچنین در این آزمایش به هیچ یک از قابلیت‌های تولید تصویر به عنوان خارج از محدوده نسخه‌های رایگان مدل‌ها توجه نخواهد شد.

جمینی در مقابل چت جی‌پی‌تی

برای اینکه این یک آزمایش و مقایسه عادلانه باشد هر قابلیتی که بین هر دو چت بات به اشتراک گذاشته نشود حذف شده است؛ به همین دلیل است که تولید تصویر مورد آزمایش قرار نمی‌گیرد چون نسخه رایگان ChatGPT در دسترس نیست و مورد آزمایش این است که این چت بات‌های هوش‌مصنوعی تا چه حد به پرسش‌های مختلف، کدگذاری آن و برخی پاسخ‌های خلاقانه پاسخ می‌دهند.

۱. مهارت کدنویسی

یکی از اولین موارد استفاده برای مدل‌های زبان بزرگ کدنویسی است، به ویژه در مورد تغییر، به‌روزرسانی و آزمایش زبان‌های کدگذاری متفاوت؛ بنابراین از هر کدام از ربات‌ها خواسته شد تا یک برنامه ساده بنویسند.

از این دستور برای کدنویسی استفاده شد: "یک اسکریپت پایتون توسعه دهید که به عنوان یک ردیاب هزینه شخصی عمل می‌کند. این برنامه باید به کاربران اجازه دهد تا هزینه‌های خود را همراه با دسته‌بندی‌ها (مانند خواربار، خدمات رفاهی، سرگرمی)و تاریخ هزینه وارد کنند، سپس اسکریپت باید خلاصه‌ای از هزینه‌ها را به صورت دسته‌بندی شده و کل هزینه‌ها را در یک دوره زمانی مشخص ارائه دهد. نظرات مربوط به توضیح هر مرحله از کد خود را وارد کنید."

این برنامه برای آزمایش میزان تولید کدهای کاملا کاربردی، نحوه تعامل با آن، خوانایی و پایبندی به استانداردهای کدنویسی طراحی شده است.

هر دو یک ردیاب هزینه کاملا کاربردی در پایتون ایجاد کردند؛ جمینی قابلیت‌های بیش‌تری مانند اضافه کردن برچسب‌های بیش‎‌تر در یک دست و همچنین گزینه‌های گزارش‌دهی جداگانه بیش‌تری ارائه داد.

برنده مرحله ۱: جمینی

۲. درک زبان طبیعی (NLU)

در مرحله بعدی فرصتی فراهم شد تا بدانیم ChatGPT و Gemini تا چه اندازه به درک زبان طبیعی می‌پردازند. چیزی که انسان‌ها گاهی مجبور می‌شوند برای درک آن نگاهی دوباره به آن بیندازند یا با دقت بخوانند. برای این کار با یک سؤال متداول تست بازتاب شناختی (CRT)در مورد قیمت یک خفاش و یک توپ انجام شد.

گل: "یک خفاش و یک توپ در مجموع ۱٫۱۰ دلار قیمت دارند. قیمت خفاش ۱٫۰۰ دلار بیش‌تر از توپ است. قیمت توپ چقدر است؟ پاسخ صحیح باید این باشد که قیمت توپ ۵ سنت و قیمت خفاش ۱٫۰۵ دلار است.

هر دو کار را درست انجام دادند اما ChatGPT کار خود را واضح‌تر نشان داد.

برنده مرحله ۲: چت جی‌پی‌تی

۳. استدلال اخلاقی برای تصمیم‌‌گیری

برای این مرحله از این عبارت استفاده شد: "سناریویی را در نظر بگیرید که در آن یک خودروی خودران باید بین ضربه زدن به عابر پیاده یا انحراف و به خطر انداختن جان سرنشینان خود یکی را انتخاب کند. هوش‌مصنوعی چگونه باید این تصمیم را بگیرد؟ "

با در نظر گرفتن چارچوب‌های اخلاقی متعدد، چگونگی وزن دادن به دیدگاه‌های مختلف و آگاهی از تعصب در تصمیم گیری، از یک برنامه دقیق استفاده کرد.

با این حال هیچ کدام نظری ارائه ندادند و هر دو نکات مختلفی را برای بررسی و پیشنهاد راه‌هایی برای تصمیم‌گیری در آینده مطرح کردند و به طور مؤثر آن را به عنوان یک مشکل شخص ثالث برای ارزیابی و گزارش برای شخص دیگری برای برقراری تماس در نظر گرفتند.

درمرحله سوم جمینی با دقت بیش‌تر پاسخ‌های دقیق‌تری ارائه داد.

برنده مرحله ۳: جمینی

۴. ترجمه/ آگاهی فرهنگی

ترجمه بین دو زبان یک مهارت مهم برای هر هوش‌مصنوعی است و قابلیتی است که در مجموعه رو به رشد ابزارهای سخت‌افزاری هوش‌مصنوعی ساخته شده است. هر دو گوشی هوشمند Oppo R۱ و Oppo R۱ مانند هر گوشی هوشمند مدرن دیگری قابلیت ترجمه را ارائه می‌دهند، اما مقصود فراتر از ترجمه ساده بود تا بتوان درک آن از تفاوت‌های فرهنگی را آزمایش کرد.

به همین منظور برای انجام این مرحله از این متن دستوری استنفاده شد: "یک پاراگراف کوتاه از انگلیسی به فرانسوی در مورد جشن شکرگزاری در ایالات متحده با تاکید بر تفاوت‌های فرهنگی ترجمه کنید."

پاراگراف این است: "شکرگزاری در ایالات متحده از جشن صرف فراتر می‌رود و بیان عمیق قدردانی را نشان می‌دهد. این جشن که ریشه در رویدادهای تاریخی دارد، جشن برداشت محصول مشترک زائران و بومیان ومپانواگ را گرامی می‌دارد که نمادی از صلح و قدردانی است. خانواده‌ها در سراسر کشور در این روز برای به اشتراک گذاشتن یک وعده غذایی گرد هم می‌آیند که معمولا شامل بوقلمون، سس زغال آخته، پفک و پای کدو حلوایی است که نشان‌دهنده نعمت برداشت محصول است. آن سوی این جشن، روز تامل در نعمت‌های الهی، بازگشت به جامعه از طریق اعمال محبت و نیکوکاری و در آغوش گرفتن ارزش‌های با هم بودن و قدردانی است. شکرگزاری به عنوان یادآور روحیه پایدار قدردانی است که افراد مختلف را متحد می‌کند و اهمیت تاریخی همکاری و احترام متقابل را ارج می‌نهد."

این ترجمه خیلی نزدیک و دقیق بود اما در پایان جمینی نکات ظریف‌تری را در ترجمه و توضیح چگونگی نزدیک شدن آن به ترجمه ارائه کرد.

برنده مرحله ۴: جمینی

۵. روان بودن مکالمه، جابجایی خطا، بازیابی

تست نهایی یک مکالمه ساده در مورد پیتزا بود، اما فرصتی بود تا ببینیم هوش‌مصنوعی تا چه انداره اطلاعات غلط، طعنه و کنایه را مدیریت کرده و از یک سوتفاهم رهایی یافته است.

برای این مرحله این عبارت استفاده شد: "در طول یک مکالمه در مورد غذاهای مورد علاقه، هوش‌مصنوعی نظر طعنه‌آمیز کاربر در مورد دوست نداشتن پیتزا را اشتباه متوجه می‌شود. کاربر سو تفاهم را اصلاح می‌کند. هوش‌مصنوعی چگونه بهبود پیدا می کند و مکالمه را ادامه می‌دهد؟ "

هر دوی آن‌ها خوب کار کردند اما با این حال، ChatGPT این طعنه را در اولین واکنش تشخیص داد و بنابراین نیازی به بازیابی نداشت. هر دو به خوبی متن را حفظ کردند و به روشی مشابه پاسخ دادند. من این موضوع را به ChatGPT می‌دهم چون متوجه شد که من از این کار عصبانی شده ام.