연구2026년 3월 13일

Mind the Sim2Real Gap in User Simulation for Agentic Tasks

arXiv:2603.11245v1 Announce Type: new Abstract: As NLP evaluation shifts from static benchmarks to multiturn interactive settings, LLMbased simulators have become widely used as user proxies, serving two roles: generating user turns and providing evaluation signals.

이 콘텐츠는 ArXiv AI 원본 기사의 요약입니다. 전문은 원본 사이트에서 확인해주세요.

원문 기사 보기 →