بیماری های تنفسی که عموماً در ارتباط با بیماری ریوی است، شامل گروهی از بیماری ها هستند که از طریق درگیر کردن بخش یا قسمت هایی از دستگاه تنفس باعث اختلال در عملکرد ریه ها می گردند. این بیماری ها، یکی از عوامل مهم مرگ ومیر افراد در سراسر جهان هستند. لذا تشخیص سریع، صحیح و زودهنگام این بیماری ها از اهمیت زیادی برخوردار است. تکنیک های داده کاوی می توانند دانش نهفته در پایگاه های داده را استخراج و در پیش گیری، تشخیص و معالجه ی این بیماری ها به پزشک و بیمار کمک کنند. در این تحقیق، با مقایسه ی سیستم های رده بندی متفاوت و مقایسه ی روش های یادگیری داده های نامتوازن با الگوریتم پایه (درخت تصمیم،ID3، ماشین بردار پشتیبان و ...)، یک سیستم رده بندی ارائه شده است که می تواند منجر به کاهش خطایی که ممکن است توسط کارشناسان کم تجربه اتفاق بیفتد، شود. همچنین این روش، امکان بررسی داده های پزشکی را در زمان کوتاه تر و با جزئیات بیش تر فراهم می کند و در تشخیص انواع بیماری های تنفسی به پزشکان کمک می کند. ضمناً در این تحقیق به بررسی ارتباطات موجود در مجموعه داده و برخی از عوامل مؤثر در بروز این بیماری ها پرداخته شده است که با شناسایی عوامل مؤثر در بروز بیماری های تنفسی، می توان با اطلاع رسانی صحیح به افراد جامعه تا حدود زیادی از ابتلا به این بیماری ها پیش گیری کرد.