التحقق من الصحة وأفكار التحسين
التحقق من الصحة – تصنيف الانحدار الشجري وتصنيف الغابة العشوائي
للتحقق من صحة تصنيفاتنا، سنحتاج إلى جمع بيانات التحقق من الصحة.
تمامًا مثل بيانات التدريب، يمكن القيام بذلك باستخدام أدوات الرسم الهندسي!
اجمع بيانات التحقق من الصحة لنفس الفئات التي استخدمتها للتصنيف، وتأكد من استخدام نفس أسماء وقيم الخصائص.
عندما ننتهي من تحديد فئات التحقق من الصحة، سنحتاج مرة أخرى إلى دمجها في مجموعة المظاهر الهندسية واحدة.
بعد ذلك، يمكننا التحقق من صحة التصنيفات عن طريق حساب مصفوفة الخطأ بالإضافة إلى الدقة الكلية.
//Now that we defined our validation classes, we will once again need to merge them into one FeatureCollection.
//Merge into one FeatureCollection
var valMerge = vwater.merge(vvegetation).merge(vurban).merge(vbaresoil);
print(valMerge, 'Merged Validation data');
//Validation for the CART-Classifier
var cartvalidation = cartclassified.sampleRegions({
collection: valMerge,
properties: ['landcover'],
scale: 30,
});
print(cartvalidation.limit(5000), 'Cart Validation');
//Error Matrix and Overall Accuracy for the CART-Classifier
var cartTestAccuracy = cartvalidation.errorMatrix('landcover', 'classification');
print(cartTestAccuracy, 'Validation of the CART Error Matrix');
//We can also use the error matrix to show the overall accuracy by calling .accuracy
print(cartTestAccuracy.accuracy(), 'CART Overall Accuracy');
//This rough CART classification map has an overall validation accuracy of 88.91%, which seems pretty nice.
//Validation for the Random Forest-Classifier
var rfvalidation = rfclassified.sampleRegions({
collection: valMerge,
properties: ['landcover'],
scale: 30,
});
print(rfvalidation.limit(5000), 'Random Forest Validation');
//Error Matrix and Overall Accuracy for the Random Forest-Classifier
var rfTestAccuracy = rfvalidation.errorMatrix('landcover', 'classification');
print(rfTestAccuracy, 'Validation of the Random Forest Error Matrix');
//We can also use the error matrix to show the overall accuracy by calling .accuracy
print(rfTestAccuracy.accuracy(), 'Random Forest Overall Accuracy');
//This rough Random Forest classification map has an overall validation accuracy of 85.68%, which seems pretty nice.
قارن كل من الصور المصنفة!
هل تعتقد أنهم قاموا بعمل جيد في تصنيف مشهدنا؟
ضع في اعتبارك العوامل التالية:
كم عدد الفئات التي اخترناها؟
كم عدد نقاط العينة التي أخذناها في الفصل؟
هل تعد بيانات النقطة مصدرًا مناسبًا للبيانات لمهمتنا؟
هل ستكون المضلعات أكثر ملاءمة، ولماذا؟
ما هي استراتيجية أخذ العينات التي اخترناها؟
هل هي مناسبة، أم أن نهجًا آخر، مثل النهج الطبقي، يكون أكثر ملاءمة؟
والأهم من ذلك: كيف يمكننا تحسين تصنيفنا؟
الاعتبارات:
مع الأخذ في الاعتبار الجهد المنخفض حقًا، تظهر التصنيفات نتائج جيدة بشكل مدهش.
بالطبع، يجب أن يؤخذ هذا في الاعتبار الجهود المنخفضة التي نبذلها، وفقط لغرض الحصول على نظرة عامة تقريبية للتوزيع المكاني للطبقات.
تبدو مناطق المياه والنباتات صلبة جدًا، في حين واجهت الخوارزمية صعوبات في التمييز بين المناطق الحضرية ومناطق التربة الجافة.
يشار إلى المناطق العارية بشكل خاص ذات قيم انعكاس عالية حقًا كمناطق حضرية.
من ناحية أخرى، فإن جميع المناطق الحضرية الفعلية موضحة بشكل صحيح.
لتقييم كيف يمكننا تحسين هذا التصنيف، دعنا نستعرض النقاط التي أثيرت من قبل.
كم عدد فئات التصنيف التي اخترناها؟
4 عينات للتصنيف.
بالنسبة لمثل هذا المجال البحثي الضخم، يمكن أن تؤدي إضافة فئات قليلة إلى تحسين النتائج.
يمكن أن تكون الفئات الإضافية المفيدة على سبيل المثال الحقول المزروعة وغير المزروعة.
كم عدد نقاط العينة التي أخذناها في الفئة؟
20 نقطة لكل فئة.
هذا بأي حال من الأحوال غير كافٍ لتصنيف تمثيلي للغطاء الأرضي، خاصةً إذا كانت منطقة البحث ضخمة جدًا.
كلما زاد العدد كان ذلك أفضل، ولكن يجب أن يكون على الأقل حوالي 100 عينة لكل فصل.
هل البيانات النقطية مصدر مناسب للبيانات؟
إنه يعمل، ولكن استخدام المضلعات سيوفر نتائج أفضل بكثير، حيث يتم أخذ تباين أكبر في قيمة البيكسل في الاعتبار.
إذا أمكن، يجب استخدام المضلعات دائمًا.
ما هي استراتيجية أخذ العينات التي اخترناها؟
أخذ عينات متساوية، بحيث يتم تمثيل كل فئة بالتساوي.
قد يكون النهج الطبقي أفضل، حيث أثبتت مناطق المياه والغطاء النباتي أنها مصنفة جيدًا بالفعل بفضل جهودنا المنخفضة.
هذا يعني أنه قد يكون من المنطقي بذل المزيد من الجهد في فصول التربة الحضرية والعارية، مما يعني إنشاء المزيد من عينات التدريب لتلك الفئات.