人機(jī)測試,又稱人機(jī)對(duì)話測試,指將編制開發(fā)好的標(biāo)準(zhǔn)化測驗(yàn)通過軟件技術(shù)加載在計(jì)算機(jī)上,并按照測驗(yàn)的規(guī)范要求設(shè)定操作程序。被評(píng)價(jià)者根據(jù)程序指引直接在計(jì)算機(jī)上答題,答題結(jié)束后,計(jì)算機(jī)自動(dòng)統(tǒng)計(jì)各測量內(nèi)容的得分,并對(duì)比事先設(shè)定的常模,得出測評(píng)結(jié)果。簡單點(diǎn)說,人機(jī)對(duì)話測試就是在計(jì)算機(jī)上完成的測試。

類型

目前,人機(jī)對(duì)話測試分單機(jī)版、局域網(wǎng)版、遠(yuǎn)程網(wǎng)絡(luò)版幾大類型。隨著經(jīng)濟(jì)高速發(fā)展,企業(yè)規(guī)模不斷擴(kuò)大,網(wǎng)絡(luò)技術(shù)日新月異,遠(yuǎn)程網(wǎng)絡(luò)版人機(jī)對(duì)話測試逐漸成為主流,它不僅避免了傳統(tǒng)紙筆測試在人力、物力、時(shí)間上的資源浪費(fèi),以及分?jǐn)?shù)統(tǒng)計(jì)誤差,還能解決不同地區(qū)同時(shí)測試統(tǒng)一管理的問題。

常識(shí)

標(biāo)準(zhǔn)化測驗(yàn)

標(biāo)準(zhǔn)化測驗(yàn)是通過嚴(yán)格完整的程序編制的,具有事先確定的測驗(yàn)題目、規(guī)范的施測流程、客觀的評(píng)分標(biāo)準(zhǔn)和標(biāo)準(zhǔn)的結(jié)果解釋系統(tǒng),此外還有測驗(yàn)的信度、效度和項(xiàng)目分析數(shù)據(jù)等相關(guān)資料用以說明測驗(yàn)的質(zhì)量。因此,一套好的標(biāo)準(zhǔn)化測驗(yàn)的編制成本比較高,但相應(yīng)地,它的科學(xué)性和價(jià)值也非常高,此外,一旦編制成功,它具有使用方便、經(jīng)濟(jì)、客觀等特點(diǎn)。

編制一套標(biāo)準(zhǔn)化測驗(yàn)時(shí),專業(yè)研究人員通常要經(jīng)過如下幾大步驟:確定與分析測量的目標(biāo)和內(nèi)容——題目的編寫與排列——預(yù)測與題目分析——題目修訂——規(guī)范測試程序和要求——樣本收集與建立常?!哦刃Ф鹊认嚓P(guān)分析——制定結(jié)果解釋

標(biāo)準(zhǔn)化測驗(yàn)?zāi)軌驅(qū)θ说脑S多方面進(jìn)行比較客觀的評(píng)價(jià),尤其在評(píng)價(jià)底層潛在的、不易從行為表現(xiàn)中直接觀察出來的素質(zhì)時(shí)。而且顯示出比較高的有效性,如個(gè)性特征、智力、能力傾向、價(jià)值觀、興趣等。

信度

信度表示測量數(shù)據(jù)和結(jié)論的可靠性程度,即評(píng)價(jià)工具穩(wěn)定地測評(píng)到它要測量的內(nèi)容的程度。一般來說,檢驗(yàn)信度有以下幾種方法:

重測信度:在恰當(dāng)?shù)臅r(shí)間間隔前后,重復(fù)同樣的測量,統(tǒng)計(jì)兩次測量結(jié)果的匹配程度。

復(fù)本信度:用原本和復(fù)本同時(shí)進(jìn)行測量,統(tǒng)計(jì)原本和復(fù)本測量結(jié)果的相關(guān)程度。

分半信度:在沒有復(fù)本且不能重測的情況下,將同一測量內(nèi)容的測驗(yàn)題目隨機(jī)分成兩組,統(tǒng)計(jì)兩組測量結(jié)果的相關(guān)程度。

評(píng)分者信度:用于測量工具的標(biāo)準(zhǔn)化程度較低的情況下,比較典型的是評(píng)委主觀評(píng)分的測量。不同評(píng)委的判分標(biāo)準(zhǔn)會(huì)影響測量的信度,因此需用計(jì)算兩位評(píng)委評(píng)分的相關(guān)程度。

效度

效度表示評(píng)價(jià)的正確性程度,即評(píng)價(jià)工具準(zhǔn)確地反映到它要測量的內(nèi)容的程度。一般來說,檢驗(yàn)效度有以下幾種方法:

內(nèi)容效度:系統(tǒng)地檢查測量內(nèi)容的適當(dāng)性,即根據(jù)對(duì)要測量內(nèi)容的了解去鑒別測驗(yàn)題目。

準(zhǔn)則效度:用已經(jīng)被假設(shè)或定義為測量某一內(nèi)容有效的工具作為效標(biāo),當(dāng)用新的測量工具對(duì)該內(nèi)容進(jìn)行測量時(shí),統(tǒng)計(jì)測量結(jié)果與效標(biāo)測量結(jié)果的一致性程度。

結(jié)構(gòu)效度:系統(tǒng)地檢查測量工具是否反映了要測量內(nèi)容的概念和命題結(jié)構(gòu),這種方法常常在理論的研究中使用,因此也被稱為理論效度。

從信度和效度的關(guān)系上來看,信度不高,效度必定不高;信度高,效度不一定高;效度不高,信度不一定不高;效度高,信度必定高。

常模

測量結(jié)果是否準(zhǔn)確,常模(Norm)的適合性是非常關(guān)鍵的因素。常模是一群人在同一測量工具中得分的分布情形,這群人就是獲得該常模的樣本。某人在某一測量工具中的得分,需要經(jīng)過常模的比較才具有意義和參考價(jià)值。例如,某人完成100題數(shù)學(xué)題,答對(duì)了70題,那么他的成績屬于優(yōu)秀、普通還是不及格,就需要和他同年齡、同教育水平的群體進(jìn)行比較。因此,為使測量結(jié)果更為準(zhǔn)確,常模需要依據(jù)性別、年齡、學(xué)歷,甚至所在區(qū)域、崗位性質(zhì)、職位高低、行業(yè)背景等進(jìn)行細(xì)分。

標(biāo)準(zhǔn)九分

它是一種標(biāo)準(zhǔn)分,將樣本的測驗(yàn)原始得分劃分為9部分,最高是9分,最低1分,除1和9的范圍略大以外,其余均是以5為中心向兩邊各包含0.5個(gè)標(biāo)準(zhǔn)差的分?jǐn)?shù)段。簡單理解,即9為最高分,1為最低分,5為中間分。

掩飾性

受到測評(píng)動(dòng)機(jī)的影響,被評(píng)價(jià)者在完成某些測驗(yàn)(如個(gè)性特征測驗(yàn))時(shí),有時(shí)會(huì)掩飾自身的真實(shí)情況,揣測測驗(yàn)編制者的出題用意,從社會(huì)贊許度較高的方向答題,容易導(dǎo)致測評(píng)結(jié)果不能準(zhǔn)確反映被評(píng)價(jià)者的實(shí)際,甚至與實(shí)際截然相反。為鑒別真實(shí)回答與虛假回答,測驗(yàn)編制者在非能力測評(píng)的測驗(yàn)中加入掩飾性分量表,通過分析被評(píng)價(jià)在掩飾性分量表上的得分高低,了解其在測驗(yàn)過程中是否存在掩飾性以及掩飾程度,從而推斷整個(gè)測驗(yàn)結(jié)果的準(zhǔn)確性和有效性。