به گزارش خبرنگار علم و فناوری خبرگزاری برنا؛ چت باتها به یکی از ویژگیهای اصلی هوشمصنوعی مولد تبدیل شدهاند که ChatGPT و Gemini به ۲ تا از پرطرفدارترین و پرکاربردترین آنها تبدیل شدهاند، اما برای آن که با این ۲ ابزار بیشتر آشنا شویم و بدانیم که کدام یک از آنها برنده این میدان میشود در چند مرحله به مقایسه آنها پرداختیم.
گفتنی است نسخه رایگان هر دو مدل مورد مقایسه و بررسی قرار گرفته است و همچنین در این آزمایش به هیچ یک از قابلیتهای تولید تصویر به عنوان خارج از محدوده نسخههای رایگان مدلها توجه نخواهد شد.
جمینی در مقابل چت جیپیتی
برای اینکه این یک آزمایش و مقایسه عادلانه باشد هر قابلیتی که بین هر دو چت بات به اشتراک گذاشته نشود حذف شده است؛ به همین دلیل است که تولید تصویر مورد آزمایش قرار نمیگیرد چون نسخه رایگان ChatGPT در دسترس نیست و مورد آزمایش این است که این چت باتهای هوشمصنوعی تا چه حد به پرسشهای مختلف، کدگذاری آن و برخی پاسخهای خلاقانه پاسخ میدهند.
۱. مهارت کدنویسی
یکی از اولین موارد استفاده برای مدلهای زبان بزرگ کدنویسی است، به ویژه در مورد تغییر، بهروزرسانی و آزمایش زبانهای کدگذاری متفاوت؛ بنابراین از هر کدام از رباتها خواسته شد تا یک برنامه ساده بنویسند.
از این دستور برای کدنویسی استفاده شد: "یک اسکریپت پایتون توسعه دهید که به عنوان یک ردیاب هزینه شخصی عمل میکند. این برنامه باید به کاربران اجازه دهد تا هزینههای خود را همراه با دستهبندیها (مانند خواربار، خدمات رفاهی، سرگرمی)و تاریخ هزینه وارد کنند، سپس اسکریپت باید خلاصهای از هزینهها را به صورت دستهبندی شده و کل هزینهها را در یک دوره زمانی مشخص ارائه دهد. نظرات مربوط به توضیح هر مرحله از کد خود را وارد کنید."
این برنامه برای آزمایش میزان تولید کدهای کاملا کاربردی، نحوه تعامل با آن، خوانایی و پایبندی به استانداردهای کدنویسی طراحی شده است.
هر دو یک ردیاب هزینه کاملا کاربردی در پایتون ایجاد کردند؛ جمینی قابلیتهای بیشتری مانند اضافه کردن برچسبهای بیشتر در یک دست و همچنین گزینههای گزارشدهی جداگانه بیشتری ارائه داد.
برنده مرحله ۱: جمینی
۲. درک زبان طبیعی (NLU)
در مرحله بعدی فرصتی فراهم شد تا بدانیم ChatGPT و Gemini تا چه اندازه به درک زبان طبیعی میپردازند. چیزی که انسانها گاهی مجبور میشوند برای درک آن نگاهی دوباره به آن بیندازند یا با دقت بخوانند. برای این کار با یک سؤال متداول تست بازتاب شناختی (CRT)در مورد قیمت یک خفاش و یک توپ انجام شد.
گل: "یک خفاش و یک توپ در مجموع ۱٫۱۰ دلار قیمت دارند. قیمت خفاش ۱٫۰۰ دلار بیشتر از توپ است. قیمت توپ چقدر است؟ پاسخ صحیح باید این باشد که قیمت توپ ۵ سنت و قیمت خفاش ۱٫۰۵ دلار است.
هر دو کار را درست انجام دادند اما ChatGPT کار خود را واضحتر نشان داد.
برنده مرحله ۲: چت جیپیتی
۳. استدلال اخلاقی برای تصمیمگیری
برای این مرحله از این عبارت استفاده شد: "سناریویی را در نظر بگیرید که در آن یک خودروی خودران باید بین ضربه زدن به عابر پیاده یا انحراف و به خطر انداختن جان سرنشینان خود یکی را انتخاب کند. هوشمصنوعی چگونه باید این تصمیم را بگیرد؟ "
با در نظر گرفتن چارچوبهای اخلاقی متعدد، چگونگی وزن دادن به دیدگاههای مختلف و آگاهی از تعصب در تصمیم گیری، از یک برنامه دقیق استفاده کرد.
با این حال هیچ کدام نظری ارائه ندادند و هر دو نکات مختلفی را برای بررسی و پیشنهاد راههایی برای تصمیمگیری در آینده مطرح کردند و به طور مؤثر آن را به عنوان یک مشکل شخص ثالث برای ارزیابی و گزارش برای شخص دیگری برای برقراری تماس در نظر گرفتند.
درمرحله سوم جمینی با دقت بیشتر پاسخهای دقیقتری ارائه داد.
برنده مرحله ۳: جمینی
۴. ترجمه/ آگاهی فرهنگی
ترجمه بین دو زبان یک مهارت مهم برای هر هوشمصنوعی است و قابلیتی است که در مجموعه رو به رشد ابزارهای سختافزاری هوشمصنوعی ساخته شده است. هر دو گوشی هوشمند Oppo R۱ و Oppo R۱ مانند هر گوشی هوشمند مدرن دیگری قابلیت ترجمه را ارائه میدهند، اما مقصود فراتر از ترجمه ساده بود تا بتوان درک آن از تفاوتهای فرهنگی را آزمایش کرد.
به همین منظور برای انجام این مرحله از این متن دستوری استنفاده شد: "یک پاراگراف کوتاه از انگلیسی به فرانسوی در مورد جشن شکرگزاری در ایالات متحده با تاکید بر تفاوتهای فرهنگی ترجمه کنید."
پاراگراف این است: "شکرگزاری در ایالات متحده از جشن صرف فراتر میرود و بیان عمیق قدردانی را نشان میدهد. این جشن که ریشه در رویدادهای تاریخی دارد، جشن برداشت محصول مشترک زائران و بومیان ومپانواگ را گرامی میدارد که نمادی از صلح و قدردانی است. خانوادهها در سراسر کشور در این روز برای به اشتراک گذاشتن یک وعده غذایی گرد هم میآیند که معمولا شامل بوقلمون، سس زغال آخته، پفک و پای کدو حلوایی است که نشاندهنده نعمت برداشت محصول است. آن سوی این جشن، روز تامل در نعمتهای الهی، بازگشت به جامعه از طریق اعمال محبت و نیکوکاری و در آغوش گرفتن ارزشهای با هم بودن و قدردانی است. شکرگزاری به عنوان یادآور روحیه پایدار قدردانی است که افراد مختلف را متحد میکند و اهمیت تاریخی همکاری و احترام متقابل را ارج مینهد."
این ترجمه خیلی نزدیک و دقیق بود اما در پایان جمینی نکات ظریفتری را در ترجمه و توضیح چگونگی نزدیک شدن آن به ترجمه ارائه کرد.
برنده مرحله ۴: جمینی
۵. روان بودن مکالمه، جابجایی خطا، بازیابی
تست نهایی یک مکالمه ساده در مورد پیتزا بود، اما فرصتی بود تا ببینیم هوشمصنوعی تا چه انداره اطلاعات غلط، طعنه و کنایه را مدیریت کرده و از یک سوتفاهم رهایی یافته است.
برای این مرحله این عبارت استفاده شد: "در طول یک مکالمه در مورد غذاهای مورد علاقه، هوشمصنوعی نظر طعنهآمیز کاربر در مورد دوست نداشتن پیتزا را اشتباه متوجه میشود. کاربر سو تفاهم را اصلاح میکند. هوشمصنوعی چگونه بهبود پیدا می کند و مکالمه را ادامه میدهد؟ "
هر دوی آنها خوب کار کردند اما با این حال، ChatGPT این طعنه را در اولین واکنش تشخیص داد و بنابراین نیازی به بازیابی نداشت. هر دو به خوبی متن را حفظ کردند و به روشی مشابه پاسخ دادند. من این موضوع را به ChatGPT میدهم چون متوجه شد که من از این کار عصبانی شده ام.
برنده مرحله آخر: چت جیبیتی
انتهای پیام/