بهبود دقت پیش‌بینی مکانی کلاس‌های خاک بر اساس رویکرد متعادل‌سازی داده

پذیرفته شده برای پوستر
کد مقاله : 1122-FWMC5
نویسندگان
1موسسه تحقیقات خاک و آب
2استاد گروه علوم خاک دانشکده کشاورزی، دانشگاه زنجان، ایران
3استادیار پژوهش موسسه تحقیقات خاک و آب، سازمان تحقیقات، آموزش و ترویج کشاورزی، کرج، ایران
چکیده
دستیابی به اطلاعات دقیق در مورد وضعیت و طبقه‌بندی خاک‌ها و پیش‌بینی پراکنش مکانی آن‌ها از اهمیت بالایی برخوردار است اما محدویت های مربوط به عدم تعادل داده‌ها به عنوان موضوع تحقیقاتی مهمی در زمینه داده‌کاوی است که اخیراً توجه محققان زیادی را برای رفع این چالش به خود جلب کرده است. این پژوهش با هدف رفع چالش‌ نامتعادل بودن داده‌ها و بهبود دقت طبقه بندی کلاس‌های خاک در بخشی از اراضی جنوب غربی استان زنجان انجام گرفت. در این ارتباط تعداد 148 خاک‌رخ طبق الگوی طبقه‌بندی تصادفی و با میانگین فاصله 500 متر حفر و تشریح و طبقه‌بندی آنها بر اساس سیستم جامع رده‌بندی خاک آمریکایی انجام شد. خاک‌ها در پنج کلاس با توزیع نامتعادل تیپیک کلسی‌زرپتز، تیپیک هاپلوزرپتز، جیپسیک هاپلوزرپتز، تیپیک زراورتنتز و لیتیک زراورتنتز قرار گرفتند. مدل‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌سازی رابطه خاک - زمین‌نما با استفاده از الگوریتم جنگل تصادفی و رویکرد نمونه‌گیری مجدد در نرم‌افزار "Rstudio" انجام شد. مقادیر صحت کلی و ضریب کاپا برای ارزیابی نقشه خاک در مدل جنگل تصادفی قبل از متعادل سازی داده ها به ترتیب برابر با 65 درصد و 32/0 و پس از متعادل سازی داده ها با رویکرد نمونه گیری مجدد به ترتیب 71 درصد و 54/0به دست آمد. نتایج صحت کاربر و صحت تولیدکننده نیز نشان داد دو کلاس جیپسیک هاپلوزرپتز و لیتیک زراورتنز که هنگام آموزش با استفاده از مجموعه داده نامتعادل حذف شده بودند، پس از متعادل سازی با دقت کاربر 100 و 78 درصد و دقت تولیدکننده 75 و 88 درصد در الگوریتم جنگل تصادفی به‌خوبی پیش‌بینی شدند.
کلیدواژه ها
موضوعات