مدل‌های زبانی و شبیه‌سازی رفتار مصرف‌کننده: معرفی روش Semantic Similarity Rating (SSR)

یک پژوهش تازه از تیم بین‌المللی به رهبری Benjamin F. Maier در تاریخ ۹ اکتبر ۲۰۲۵، روی سرور علمی arXiv منتشر شده که نشان می‌دهد هوش مصنوعی می‌تواند واکنش انسان‌ها در نظرسنجی‌های مصرف‌کننده را با دقت ۹۰٪ مشابه انسان‌ها بازتولید کند.

عنوان کامل مقاله :

“Large Language Models Reproduce Human Purchase Intent via Semantic Similarity in Likert Rating Inference”

این پژوهش روش جدیدی معرفی می‌کند به نام SSR یا Semantic Similarity Rating؛ روشی که مشکل قدیمی امتیازدهی عددی را در مدل‌های زبانی بزرگ (LLMها) مثل ChatGPT، Claude یا Gemini برطرف می‌کند.

 

مسئله قدیمی: LLMها نمی‌توانستند مثل انسان امتیاز بدهند

در نظرسنجی‌های معمول، وقتی از مدل خواسته می‌شد به یک محصول امتیاز ۱ تا ۵ بدهد (به سبک «لیکرت»)، پاسخ‌ها مصنوعی، فشرده و غیرواقعی بودند.

پژوهش Maier نشان می‌دهد دلیلش این است که مدل‌ها عدد را نمی‌فهمند، معنا را می‌فهمند.

راه‌حل آن‌ها ساده ولی مؤثر است:

به‌جای درخواست عدد، از مدل خواسته می‌شود نظر متنی درباره‌ی محصول بنویسد — مثلاً:

«به نظرم عالیه، دقیقاً همون چیزیه که دنبالش بودم.»

سپس این متن به یک بردار عددی (embedding) تبدیل می‌شود. مدل از طریق شباهت بین این بردار و جملات معیار مربوط به امتیازهای مختلف (۱ تا ۵) مشخص می‌کند که نظر به کدام امتیاز نزدیک‌تر است.

مثلاً اگر جمله از نظر معنا به جمله‌ی معیار امتیاز ۵ شبیه‌تر باشد، همان عدد را به‌طور خودکار انتخاب می‌کند.

 

یافته اصلی: هوش مصنوعی مثل انسان امتیاز می‌دهد و توضیح هم می‌نویسد

این روش روی داده‌های واقعی یک شرکت محصولات مراقبت شخصی آزمایش شد — شامل ۵۷ نظرسنجی و ۹۳۰۰ پاسخ انسانی.

نتیجه؟ توزیع امتیازها و پایداری پاسخ‌ها تقریباً همسان رفتار انسان‌ها بود، با ۹۰٪ شباهت در قابلیت اطمینان تست-تست (test-retest reliability).

نویسندگان در مقاله نوشتند:

«این چارچوب به مدل‌های زبانی اجازه می‌دهد نظرسنجی‌های مصرف‌کننده را در مقیاس بزرگ بازتولید کنند، در حالی که معیارهای سنتی نظرسنجی و قابلیت تفسیر حفظ می‌شود.»

 

چرا مهم است

صنعت نظرسنجی در سال‌های اخیر دچار مشکل شده، چون خیلی از پاسخ‌دهندگان انسانی از ChatGPT یا ربات‌ها برای پر کردن فرم‌ها استفاده می‌کنند، و داده‌ها غیرواقعی و بیش از حد “مودب” شده‌اند.

تیم Maier به‌جای مبارزه با این آلودگی داده، پیشنهاد می‌دهد داده‌های مصنوعی را در محیط کنترل‌شده و قابل‌اطمینان توسط خود مدل تولید کنیم.

این یعنی شرکت‌ها می‌توانند به‌جای پنل‌های پرهزینه انسانی، از LLMها برای ساخت گروه‌های مصرف‌کننده‌ی مصنوعی استفاده کنند — چیزی که پژوهش آن را digital consumer twins می‌نامد.

 

کاربردهای واقعی

با SSR، شرکت‌ها می‌توانند طراحی محصول، بسته‌بندی یا متن تبلیغاتی را روی این دوقلوهای دیجیتالی امتحان کنند و ظرف چند ساعت بفهمند «اگر محصول را عرضه کنند، مردم چه خواهند گفت».

پژوهشگران تخمین زده‌اند این روش در مقیاس صنعتی می‌تواند هزینه و زمان تحقیقات سنتی را به کسری از مقدار معمول کاهش دهد، در حالی که کیفیت داده همان سطح انسانی را حفظ می‌کند.

البته مقاله تأکید می‌کند:

  • روش روی محصولات مراقبت شخصی معتبرسنجی شده، نه کالاهای پیچیده‌تر.
  • فقط رفتار جمعی را مدل می‌کند، نه تصمیم فردی خاص.

 

جمع‌بندی

پژوهش Maier و همکاران نشان می‌دهد مدل‌های زبانی بزرگ، اگر با روش SSR هدایت شوند، می‌توانند قصد خرید و ترجیحات انسانی را بازسازی کنند.

در عمل یعنی هوش مصنوعی می‌فهمد چرا مردم چیزی را دوست دارند، نه فقط این‌که چه چیزی را انتخاب می‌کنند.

با این روش، تحقیق مصرف‌کننده از مرحله‌ی «جمع‌آوری پاسخ» به مرحله‌ی «شبیه‌سازی هوشمند رفتار بازار» رسیده است؛ مرحله‌ای که سرعت، مقیاس و دقت به‌طور بی‌سابقه‌ای با هم ترکیب شده‌اند.

در همین مسیر، صنعت نظرسنجی سنتی احتمالاً وارد دوره‌ی بازآفرینی یا پایان خود می‌شود — چون حالا مدل‌های زبانی می‌توانند همان کار را انجام دهند، فقط سریع‌تر و ارزان‌تر.

 

این پژوهش نقطه‌ی آغاز بازارهای شبیه‌سازی‌شده است.

اکنون داده دیگر فقط ثبت رفتار گذشته نیست — خود مدل، رفتار آینده را بازسازی می‌کند.

هر برند که زودتر از SSR برای شناخت احساس خرید و واکنش مصرف‌کننده استفاده کند، در واقع آینده‌ی بازار را قبل از وقوع دیده است.

عصر نظرسنجی سنتی دارد تمام می‌شود؛ عصر هوش مصرف‌کننده آغاز شده.

 

پیمایش به بالا