
دانشمند ارشد داده در پلتفرمهای فیلیمو و آپارات، صبح امروز در ایستگاه آینده رویداد اینوتکس ۲۰۲۵ به تبیین نحوه عملکرد مدلهای زبانی بزرگ (LLM) بهویژه مدلهای چندوجهی (Multi-modal LLM) پرداخت و با تشریح الگوبرداری این مدلها از ساختار ادراکی مغز انسان، توضیحاتی علمی و کاربردی درباره نحوه درک و تحلیل دادهها توسط این سامانهها ارائه داد.
مغز انسان مفاهیم را به وکتورهای عددی تبدیل میکند
به گفته مسعود کاویانی، مغز انسان هنگام درک مفاهیم، آنها را به بردارهایی عددی (وکتورها) تبدیل میکند. این بردارها در واقع شامل ۵ تا ۶ عدد هستند که بهصورت مقدار الکتریسیته در نورونهای مغزی فعال میشوند. وی با ذکر مثالی افزود: «زمانی که تصویر یک خودرو، مانند بیامو را مشاهده میکنیم، مغز ما این تصویر را به مجموعهای از اعداد مانند ۶۴، ۱۷ و ۲۳ تبدیل میکند. این اعداد یک وکتور تشکیل میدهند که در ذهن ما به عنوان مفهوم "خودروی بیامو" رمزگذاری شده است.»
درک چندرسانهای در مدلهای زبانی الهامگرفته از مغز
به گزارش برنا، وی در ادامه گفت: مدلهای زبانی چندوجهی (Multi-modal LLM) نیز بر همین اساس طراحی شدهاند. این مدلها که نسخههای پیشرفتهتری از سیستمهایی مانند ChatGPT محسوب میشوند، قابلیت دریافت ورودیهایی شامل متن، صوت و تصویر را دارند و با درک مفاهیم موجود، میتوانند خروجیهایی متناسب با هر نوع داده تولید کنند.
جمعآوری داده از کل وب برای آموزش مدلهای هوشمند
کاویانی درباره شیوه آموزش این مدلها توضیح داد: «الگوریتمها بهگونهای طراحی میشوند که بتوانند کل وب را در بازهای از زمان تحلیل کنند و بهتدریج حجم عظیمی از اطلاعات را به بردارهای عددی قابل فهم برای ماشین تبدیل کنند.»
شناسایی هوشمند محتوای خشونتآمیز در آپارات
وی با اشاره به یکی از پروژههای اجرایی در آپارات بیان کرد: «در این پلتفرم با استفاده از الگوریتمهای هوشمند، ویدئوهایی که دارای محتوای جنایات داعش بودند بهصورت خودکار شناسایی و دستهبندی شدند. الگوریتمها با استخراج بردارهای عددی مختص این ویدئوها، توانستند محتوای مشابه را تشخیص دهند و برای کاربران بالای ۱۸ سال برچسبگذاری کنند.»
افزایش نرخ تبلیغات هدفمند در صباویژن با کمک الگوریتمهای هوشمند
کاویانی همچنین به کاربرد الگوریتمها در صباویژن اشاره کرد و گفت: «در صباویژن، با استفاده از الگوریتمی مبتنی بر تشخیص نزدیکترین موسیقی، فیلم و گروه سنی، اپلیکیشنی طراحی شد که توانست نرخ اثربخشی تبلیغات را بین ۷ تا ۱۲ درصد افزایش دهد.»
ترکیب هوش مصنوعی و علوم اعصاب برای ارتقای پلتفرمهای دیجیتال
اظهارات کاویانی در ایستگاه آینده اینوتکس ۲۰۲۵، بازتابدهنده پیوند عمیق میان علوم اعصاب، دادهکاوی و هوش مصنوعی است؛ پیوندی که نهتنها در درک بهتر از انسان الهام میگیرد، بلکه توانسته به ارتقای سطح عملکرد پلتفرمهای دیجیتال ایرانی کمک مؤثری کند.
انتهای پیام/