Penelitian ini bertujuan untuk (1) mengetahui kelayakan instrumen yang dikembangkan sesuai dengan spesifikasi standar tes; (2) mengetahui karakteristik instrumen penilaian yang dikembangkan Penelitian ini merupakan Research and Development dengan mengadaptasi model Borg & Gall yang, yaitu pengumpulan informasi, perencanaan produk, pengembangan draf  produk, uji coba lapangan awal, dan revisi I, uji coba lapangan, revisi II, uji pelaksanaan lapangan, dan diseminasi. Hasil penelitian adalah (1) Instrumen penilaian problem solving layak sesuai dengan spesifikasi standar tes; (2) bahwa instrumen penilaian yang dikembangkan valid dan reliabel baik secara teori maupun empiris.