Risiko Dasar

Sekadar menyusun sekumpulan pertanyaan tidak akan menghasilkan tes psikologi. Sebuah tes mungkin paling baik didefinisikan sebagai mengukur sampel standar dari perilaku manusia. Karena itu, ia harus memenuhi persyaratan dasar tertentu. Pertama, sampel perilaku harus cukup besar dan cukup mewakili kelas perilaku yang kita ukur untuk memungkinkan kita menggeneralisasi dan memprediksi dari hasil pengujian.

Kedua, dengan mensyaratkan tes untuk dibakukan, maksud kami adalah serangkaian pertanyaan atau tugas harus diberikan secara seragam setiap kali subjek diberikan tes. Akhirnya, semua tes psikologi harus memiliki karakteristik prasyarat validitas, reliabilitas, dan norma.

Menyatukan serangkaian pertanyaan terlepas dari apakah itu menyangkut topik psikologis tidak mengangkatnya ke tingkat pengujian psikologis. Misalnya, banyak kolom surat kabar dan buku-buku populer dari berbagai permainan ruang tamu 88 menyajikan serangkaian pertanyaan; orang tersebut menilai jawaban dan menilai dirinya sebagai “luar biasa”, “baik”, “buruk”, atau “mengerikan”. Ini bukan tes psikologis; mereka hanyalah sekumpulan pertanyaan.

Tentu saja, seseorang sering memiliki rasa ingin tahu yang luar biasa untuk menemukan sesuatu secara diam-diam, sehingga rencana pengujian mandiri sangat populer. Pokok bahasan tes ini biasanya memiliki daya tarik yang luas. Misalnya, sebuah kolom mungkin meminta Anda untuk menentukan apakah Anda seorang suami yang luar biasa dengan menjawab beberapa pertanyaan. Seseorang mungkin memiliki kebijaksanaan yang tidak dapat dipahami, tetapi satu-satunya cara dia dapat mengembangkan tes untuk mengukur kualitas tersebut adalah dengan memiliki serangkaian pertanyaan yang telah dijawab dengan satu cara oleh suami yang sukses (siapa pun mereka) dan dengan cara yang berbeda secara signifikan oleh suami yang tidak berhasil. suami.

Norma Tes:

Topik norma tes adalah salah satu topik yang cukup penting dan membutuhkan klarifikasi tambahan . Norma harus dikembangkan sebagai sumber acuan pada semua tes yang digunakan dalam seleksi. Norma adalah standar acuan; itu memungkinkan seseorang untuk memahami arti dari skor tes. Bergantung pada tesnya, skor mentah dapat dilaporkan dengan berbagai cara: Total waktu untuk menyelesaikan tes, jumlah item yang benar, atau jumlah item yang dicoba adalah beberapa skor mentah yang diperoleh dalam tes.

Sebenarnya, skor mentah dengan sendirinya pada tes psikologi biasanya merupakan angka yang tidak berarti. Misalnya, pada satu tes skor 240 detik mungkin buruk, sedangkan pada tes lain skor 75 detik mungkin luar biasa. Masalah semakin rumit ketika skor 180 detik harus dibandingkan dengan skor 95 item yang benar. Tanpa menggunakan norma, perbandingan seperti itu tidak mungkin; paling-paling, mereka akan menyerupai upaya untuk membandingkan apel dan buah persik.

Dua sistem norma yang paling banyak digunakan adalah persentil dan skor standar. Kedua ukuran secara tidak langsung memberikan informasi tentang kinerja tes individu relatif terhadap populasi yang diketahui. Mereka juga menunjukkan posisi relatif satu orang dalam kelompok terhadap kelompok secara keseluruhan.

Pada tes untuk mengukur kemampuan stenografi, skor mentah seseorang mungkin 105 kata per menit dengan satu kesalahan dalam transkripsi . Kecuali kami memiliki informasi tentang kisaran kecepatan berdasarkan banyak orang, kami tidak dapat mengetahui apakah tingkat kecepatan ini baik atau buruk. Namun, jika tes ini telah diberikan kepada 155 stenografer yang bekerja dengan baik dan skor individu ini menempatkannya pada persentil ke-90, kami akan berada dalam posisi untuk memperkirakan kemampuannya untuk mengambil steno sebagai “luar biasa” karena dia melebihi 9 dari 10 anak perempuan di kecepatan singkatan.

Jika individu yang sama ini mengetik dengan kecepatan 45 kata per menit, dan jika skor ini “setara dengan persentil ke-20, kita dapat menyimpulkan bahwa 8 dari 10 stenografer yang dipekerjakan adalah juru ketik yang lebih cepat. Sebenarnya, kecepatan steno dan kecepatan mengetik bisa dibandingkan. Berdasarkan norma-norma yang tersedia, kami dapat membuat perbandingan langsung dari kinerja gadis ini pada dua tes ini, dan kesimpulan kami bahwa dia sangat baik dalam mendikte tetapi buruk dalam mengetik dibenarkan. Apakah dia dipekerjakan tergantung pada kebutuhan pekerjaan itu; kemungkinan besar dia harus meningkatkan kecepatan mengetiknya sebelum penempatan kerja dimungkinkan.

Untuk beberapa pekerjaan klerikal, kecepatan sangat penting, tetapi untuk beberapa pekerjaan lainnya, akurasi lebih penting. Misalnya, kecepatan daripada akurasi mungkin dicari untuk menangani surat edaran. Di sisi lain, akurasi ekstrim akan diperlukan untuk mengajukan surat-surat penting. Kadang-kadang diperlukan norma yang terpisah tentang kecepatan dan ketepatan, serta norma yang didasarkan pada kombinasi kedua ukuran tersebut.

Dalam pembentukan norma, informasi spesifik harus tersedia tidak hanya tentang ukuran kelompok yang diukur, tetapi juga tentang fakta seperti tingkat usia, apakah kelompok itu bekerja dengan baik, apakah itu populasi perguruan tinggi, dan apakah itu terdiri dari pengambilan sampel normal yang tidak dipilih.

Misalnya, seseorang yang menguji pada persentil ke-70 populasi normal pada tes kecerdasan dapat dianggap memiliki kecerdasan di atas rata-rata. Namun, kemungkinan keberhasilannya di perguruan tinggi atau sekolah pascasarjana akan dipertanyakan. Dengan kata lain, suatu norma hanya bermakna ketika ciri-ciri populasi yang mendasarinya diketahui.

Jenis Tes:

Tes psikologi dapat dikategorikan ke dalam berbagai pengelompokan tergantung pada tujuan tertentu dari sistem klasifikasi. Sebelum melangkah lebih jauh, mungkin ada baiknya mempertimbangkan beberapa sistem klasifikasi ini.

Jenis Perilaku yang Diukur:

Mungkin sistem klasifikasi yang paling sering digunakan didasarkan pada jenis perilaku yang ingin diukur oleh tes. Jadi kami menemukan tes yang ditujukan sebagai tes kecerdasan, tes kepribadian, tes minat, tes penglihatan, tes musik, tes seni, tes mekanik, tes verbal, dll., Di mana setiap kelompok cukup spesifik perilakunya.

Tes Prestasi dan Bakat:

Sangat sering penulis akan membedakan antara tes bakat dan tes prestasi. Yang pertama dianggap sebagai ukuran potensi seseorang di area tertentu, sedangkan yang kedua adalah ukuran keterampilan atau kemampuan seseorang saat ini pada saat pengujian. Karena tes yang sama seringkali dapat dianggap sebagai tes prestasi dan tes bakat tergantung pada penggunaannya, sistem klasifikasi ini sering kali tidak jelas.

Jadi, dengan banyak tes seseorang dapat:

(1) Mengukur jumlah keterampilan saat ini, dan

(2) Gunakan skor saat ini untuk memprediksi kinerja masa depan.

Tes Kertas dan Pensil dan Tes Kinerja:

Banyak tes dari berbagai kertas dan pensil:

Testee hanya menerima kertas ujian atau buklet cetak yang berisi soal-soal ujian, dan dia mencatat tanggapannya secara tertulis pada lembar jawaban yang biasanya disediakan. Namun, banyak pengujian lain yang tidak memerlukan tanggapan tertulis—melainkan melibatkan semacam aktivitas manipulasi seperti menangani pasak atau balok, atau merakit objek mekanis. Tes terakhir ini disebut sebagai tes kinerja.

Tes Kecepatan dan Kekuatan:

Beberapa tes dibuat sedemikian rupa sehingga setiap item sangat mudahâ€”tugasnya adalah menyelesaikan item sebanyak mungkin dalam waktu singkat. Ketika kinerja tes didasarkan terutama pada kecepatan yang digunakan seseorang, tes tersebut disebut sebagai tes kecepatan. Ekstrem lainnya adalah tes di mana itemnya sulit dan orang tersebut diberikan waktu sebanyak yang diperlukan untuk menyelesaikan item tersebut. Dalam tes semacam itu, skor seseorang didasarkan secara eksklusif pada kemampuannya untuk menjawab pertanyaan dengan benar, tidak peduli berapa lama (tentu saja dengan alasan yang masuk akal). Jenis tes ini disebut tes kekuatan.

Tes Individu dan Grup:

Ada sejumlah tes yang dirancang untuk dilakukan secara individual; yaitu, mereka tidak dapat diberikan secara bersamaan kepada dua orang atau lebih oleh satu penguji. Contohnya adalah Skala Kecerdasan Stanford-Binet. Sangat sering tes individu digunakan untuk evaluasi klinis. Tes kelompok adalah tes yang dapat diambil oleh banyak orang pada waktu yang bersamaan. Untuk pengujian industri, pengujian kelompok umumnya lebih disukai karena lebih ekonomis untuk dilakukan.

Tes Bahasa dan Non-bahasa:

Kadang-kadang penting untuk membedakan antara tes-tes yang membutuhkan pengetahuan bahasa tertentu (seperti bahasa Inggris) untuk memahami instruksi tes atau item tes itu sendiri. Semua tes semacam itu disebut tes bahasa karena kinerjanya tergantung sebagian pada kemampuan bahasa peserta ujian, terlepas dari jenis kemampuan yang dirancang untuk diukur oleh tes tersebut.

Dalam beberapa kasus diinginkan atau perlu untuk menghindari bias bahasa dari suatu tes. Misalnya, untuk menguji kemampuan mekanik orang yang buta huruf menggunakan tes yang melibatkan instruksi tertulis akan sangat tidak tepat. Untuk mengatasi masalah ini, telah dibangun tes di area tertentu yang merupakan tes bebas bahasa. Mereka tidak memerlukan keterampilan bahasa pada bagian dari testee. Ini disebut sebagai tes non-bahasa.

Tes versus Perangkat Seleksi Lain:

Pada artikel ini perhatian kami dikhususkan secara eksklusif untuk memeriksa tes psikologi. Namun, tes bukanlah satu-satunya alat prediksi yang digunakan oleh psikolog dalam situasi seleksi. Alat bantu seleksi standar lainnya adalah surat rekomendasi, blanko lamaran, dan wawancara. Program seleksi komprehensif akan menggunakan ini selain tes sebagai bagian dari proses seleksi total.

Studi dalam Kontroversi:

Mungkin tidak ada tes yang lebih baik menggambarkan masalah kontroversial yang terlibat dalam uji coba industri daripada Analisis Vektor Aktivitas. Tinjauan singkat tentang kontroversi seputar perangkat penilaian ini harus berfungsi untuk mengilustrasikan beberapa kesulitan ini. Locke dan Hulin (1962) melakukan tinjauan komprehensif penggunaan tes ini sebagai perangkat seleksi industri. Mereka meninjau total 18 studi, 17 di antaranya relevan dengan nilai AVA di industri. Sebagian besar studi ini, bagaimanapun, adalah jenis validitas bersamaan di mana AVA diberikan kepada karyawan saat ini.

Locke dan Hulin melaporkan bahwa terdapat bukti yang dapat membedakan antara:

Manajer dan pekerja produksi
Eksekutif dan kelompok pekerja campuran
Tujuh kelompok pekerjaan berbeda mulai dari operator mesin hingga presiden perusahaan
Karyawan baik dan buruk dalam beberapa pekerjaan berbeda

Namun, dalam semua studi karyawan saat ini, validitas diperoleh dengan mengembangkan kunci berdasarkan sampel itu dan kemudian menerapkan kunci kembali ke sampel yang menjadi dasar pengembangan kunci—prosedur yang dikenal sebagai validasi “fold-back”. Jarang ada upaya yang dilakukan untuk melakukan proses validasi silang yang diperlukan pada kelompok karyawan yang berbeda. Locke dan Hulin percaya bahwa terlalu sering penulis studi AVA melampaui batas yang diterima dalam membahas nilai temuan mereka, sering meninggalkan pembaca dengan kesan bahwa validitas mereka menunjukkan kekuatan prediksi tes.

Hanya satu studi, menurut pendapat Locke dan Hulin, yang menggunakan prosedur validitas prediktif yang benar di mana kunci penilaian yang dikembangkan sebelumnya diberikan sebelum pekerjaan dan kemudian diperiksa validitasnya. Dalam hal ini tidak ada validitas yang diperoleh.

Tampaknya keputusan bahwa AVA memiliki nilai prediktif setidaknya harus ditunda sampai tersedia bukti yang lebih substansial. Akan tetapi, yang dipersoalkan di sini bukan hanya nilai sebenarnya dari tes tersebut, tetapi juga perbedaan antara klaim yang dibuat untuk nilainya dan temuan empiris yang sebenarnya. Locke dan Hulin tidak sendirian dalam mengambil tugas AVA atas dasar misrepresentasi temuan penelitian. Dunnette dan Kirchner (1962) memprotes keras pelaporan data AVA yang “diwarnai” oleh Meranda dan Clarke (1959).

Bennett, dalam ulasannya tentang Buku Tahunan Pengukuran Mental Kelima AVA untuk Euro (1959) juga agak tidak memuji, dengan menyatakan, “Omong kosong dari prosedur statistik yang diduga canggih bukanlah pengganti untuk validitas yang ditunjukkan.” Pembaca yang tertarik dapat menikmati artikel Dunnette dan Kirchner (1962) dan balasan yang sesuai oleh Meranda dan Clarke dalam edisi Journal of Applied Psychology yang sama.

Gambaran Umum Pengujian Kepribadian di Industri:

Ghiselli dan Barthol (1953) mengulas 113 studi yang berhubungan dengan validitas inventori kepribadian dalam pemilihan karyawan. Hasilnya dirangkum dalam Tabel 4.3. Mereka menyimpulkan bahwa dalam keadaan tertentu skor pada inventori kepribadian berkorelasi lebih baik dengan kecakapan pada berbagai pekerjaan yang lebih luas daripada yang mungkin diharapkan. Para penulis mengakui nilai potensial dari tes kepribadian dalam industri dan kebutuhan untuk peningkatan dan perbaikan yang besar dalam penelitian dan pengembangan .

Tes Psikologi Industri: Ciri. Jenis dan Norma