یک پژوهش تازه از تیم بینالمللی به رهبری Benjamin F. Maier در تاریخ ۹ اکتبر ۲۰۲۵، روی سرور علمی arXiv منتشر شده که نشان میدهد هوش مصنوعی میتواند واکنش انسانها در نظرسنجیهای مصرفکننده را با دقت ۹۰٪ مشابه انسانها بازتولید کند.
عنوان کامل مقاله :
“Large Language Models Reproduce Human Purchase Intent via Semantic Similarity in Likert Rating Inference”
این پژوهش روش جدیدی معرفی میکند به نام SSR یا Semantic Similarity Rating؛ روشی که مشکل قدیمی امتیازدهی عددی را در مدلهای زبانی بزرگ (LLMها) مثل ChatGPT، Claude یا Gemini برطرف میکند.
مسئله قدیمی: LLMها نمیتوانستند مثل انسان امتیاز بدهند
در نظرسنجیهای معمول، وقتی از مدل خواسته میشد به یک محصول امتیاز ۱ تا ۵ بدهد (به سبک «لیکرت»)، پاسخها مصنوعی، فشرده و غیرواقعی بودند.
پژوهش Maier نشان میدهد دلیلش این است که مدلها عدد را نمیفهمند، معنا را میفهمند.
راهحل آنها ساده ولی مؤثر است:
بهجای درخواست عدد، از مدل خواسته میشود نظر متنی دربارهی محصول بنویسد — مثلاً:
«به نظرم عالیه، دقیقاً همون چیزیه که دنبالش بودم.»
سپس این متن به یک بردار عددی (embedding) تبدیل میشود. مدل از طریق شباهت بین این بردار و جملات معیار مربوط به امتیازهای مختلف (۱ تا ۵) مشخص میکند که نظر به کدام امتیاز نزدیکتر است.
مثلاً اگر جمله از نظر معنا به جملهی معیار امتیاز ۵ شبیهتر باشد، همان عدد را بهطور خودکار انتخاب میکند.
یافته اصلی: هوش مصنوعی مثل انسان امتیاز میدهد و توضیح هم مینویسد
این روش روی دادههای واقعی یک شرکت محصولات مراقبت شخصی آزمایش شد — شامل ۵۷ نظرسنجی و ۹۳۰۰ پاسخ انسانی.
نتیجه؟ توزیع امتیازها و پایداری پاسخها تقریباً همسان رفتار انسانها بود، با ۹۰٪ شباهت در قابلیت اطمینان تست-تست (test-retest reliability).
نویسندگان در مقاله نوشتند:
«این چارچوب به مدلهای زبانی اجازه میدهد نظرسنجیهای مصرفکننده را در مقیاس بزرگ بازتولید کنند، در حالی که معیارهای سنتی نظرسنجی و قابلیت تفسیر حفظ میشود.»
چرا مهم است
صنعت نظرسنجی در سالهای اخیر دچار مشکل شده، چون خیلی از پاسخدهندگان انسانی از ChatGPT یا رباتها برای پر کردن فرمها استفاده میکنند، و دادهها غیرواقعی و بیش از حد “مودب” شدهاند.
تیم Maier بهجای مبارزه با این آلودگی داده، پیشنهاد میدهد دادههای مصنوعی را در محیط کنترلشده و قابلاطمینان توسط خود مدل تولید کنیم.
این یعنی شرکتها میتوانند بهجای پنلهای پرهزینه انسانی، از LLMها برای ساخت گروههای مصرفکنندهی مصنوعی استفاده کنند — چیزی که پژوهش آن را “digital consumer twins” مینامد.
کاربردهای واقعی
با SSR، شرکتها میتوانند طراحی محصول، بستهبندی یا متن تبلیغاتی را روی این دوقلوهای دیجیتالی امتحان کنند و ظرف چند ساعت بفهمند «اگر محصول را عرضه کنند، مردم چه خواهند گفت».
پژوهشگران تخمین زدهاند این روش در مقیاس صنعتی میتواند هزینه و زمان تحقیقات سنتی را به کسری از مقدار معمول کاهش دهد، در حالی که کیفیت داده همان سطح انسانی را حفظ میکند.
البته مقاله تأکید میکند:
- روش روی محصولات مراقبت شخصی معتبرسنجی شده، نه کالاهای پیچیدهتر.
- فقط رفتار جمعی را مدل میکند، نه تصمیم فردی خاص.
جمعبندی
پژوهش Maier و همکاران نشان میدهد مدلهای زبانی بزرگ، اگر با روش SSR هدایت شوند، میتوانند قصد خرید و ترجیحات انسانی را بازسازی کنند.
در عمل یعنی هوش مصنوعی میفهمد چرا مردم چیزی را دوست دارند، نه فقط اینکه چه چیزی را انتخاب میکنند.
با این روش، تحقیق مصرفکننده از مرحلهی «جمعآوری پاسخ» به مرحلهی «شبیهسازی هوشمند رفتار بازار» رسیده است؛ مرحلهای که سرعت، مقیاس و دقت بهطور بیسابقهای با هم ترکیب شدهاند.
در همین مسیر، صنعت نظرسنجی سنتی احتمالاً وارد دورهی بازآفرینی یا پایان خود میشود — چون حالا مدلهای زبانی میتوانند همان کار را انجام دهند، فقط سریعتر و ارزانتر.
این پژوهش نقطهی آغاز بازارهای شبیهسازیشده است.
اکنون داده دیگر فقط ثبت رفتار گذشته نیست — خود مدل، رفتار آینده را بازسازی میکند.
هر برند که زودتر از SSR برای شناخت احساس خرید و واکنش مصرفکننده استفاده کند، در واقع آیندهی بازار را قبل از وقوع دیده است.
عصر نظرسنجی سنتی دارد تمام میشود؛ عصر هوش مصرفکننده آغاز شده.




