چکیده ارائه یک روش یافتن سوالات مشابه در زمینه سیستم های پاسخ دهی خودکار به پرسش های مطرح شده زبان طبیعی در متون فارسی توسط محمد رضا رجبی دهنوی در پردازش زبان های طبیعی و بازیابی اطلاعات متنی ، یافتن متون مشابه از اهمیت بالایی برخوردار بوده و دارای کاربردهای فراوانی است. یافتن متون مشابه جزء دسته ی سیستم های پیچیده می باشد و معادل دستی ندارد. هدف از انجام این طرح ، ارائه روشی جدید است که بتواند سوالات مشابه با سوال کاربران در مسائل شرعی و بخش احکام نماز را تشخیص دهد و پاسخ صحیح را به کار بر پیشنهاد دهد. رهیافت های متفاوتی برای یافتن متون مشابه وجود دارد که در این طرح از روش نزدیکترین همسایگی استفاده شده است. ویژگی در نظر گرفته شده برای این سیستم N-gram می باشد و از معیار مشابهت Dice جهت اندازه گیری شباهت متون استفاده کردیده است. برای ساخت این سیستم نیاز به یک پیکره عظیم از متون است؛اما با توجه به اینکه این پیکره برای احکام نماز هنوز تهیه نشده است ، از یک خزنده وب جهت جمع آوری سوالات استفاده گردید . با توجه به اینکه مجموعه سوالات موجود برای آموزش سیستم مورد نظر کافی نبود ، پیشنهاد جدید استفاده از یک فرهنگ طیفی (گنج واژه – تزاروس) جهت توسعه بردار ویژگی ها می باشد. جهت ارزیابی نتایج از معیار های دقت ، بازخوانی و معیار F استفاده شده است . نتایج آزمایشات قبل از استفاده از تزاروس و همچنین ریشه یابی در بهترین حالت برابر 61% و با استفاده از تزاروس و عملیات ریشه یابی برابر 74% می باشدکه نشان از بهبود دقت دارد.