前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇測驗考試總結范文,相信會為您的寫作帶來幫助,發現更多的寫作思路和靈感。
論文關鍵詞:項目反應理論,計算機自適應考試
1.引言
項目反應理論(IRT)又稱“潛在特質”理論,于20世紀50年代初正式成立,于20世紀60年代后期,伴隨著計算機的發展而快速發展。IRT較經典測量理論來講,樣本獨立,可反復測量,又因為理論框架科學,應用范圍廣泛,是我國測量領域的熱點。計算機自適應測量(CAT)是在項目反應理論基礎上發展起來的一種新的測驗形式。它不同于紙幣測驗,是以計算機為手段,測驗試題的呈現和被試的作答是通過計算機完成,它又不同于一般計算機化測量,而是因人而異選題,根據被試能力水平自動選擇試題,及時了解被試能力水平。
2.國內應用研究綜述
我國著名心理學家張厚粲老師是自適應考試的先驅,她首先把IRT引入國內。江西師大“題庫理論”組,編寫《考生智能水平的自適應測驗》時指出:自適應考試可以在不損害測驗的信效度前提下,減少試題題量,縮短測驗,提高測驗效率。國內最早關于編制自適應測驗的文獻是出自江西師大。他們編制的高中數學水平測驗,用于考察高中畢業生的數學智能水平。江西師大這個課題組還編制了參數估計程序和自適應考試程序。
在計算機適應測驗選題策略上,2011毛秀珍,辛濤撰了全面探討,選題策略是CAT重要組成部分,關系到策略信效度,效率等。有人在Science發表文章主張謹慎CAT高風險,原因是頻繁使用質量較好的項目,會因為被試“分享”而削弱了測驗的效率,針對傳統的選題策略不足,2012羅芬、丁樹良、王曉慶提出了利用區間估計思想,將兩級評分推廣到多級評分以改進最大信息量選題策略,可以有效降低測驗長度,極大降低項目曝光率。制定高效并且安全的選題策略是CAT追求的目標,2011程小揚、丁樹良、嚴深海、朱隆尹針對極大項信息量準則(MIC)和a分層法選題策略的優缺點,對0-1評分下的CAT引入曝光因子的選題策略。
在我國自適應測試的計算機軟件還是比較少,九十年代開始,全國英語四六級考試委員會,一直致力于項目反應理論的研究與開發。目前IRT已成功應用于CET分數等值處理過程了,基于計算機自適應測試題庫也在建設和完善中。
3.國外研究
國外對于計算機自適應考試研究較早,計算機自適應測驗是從比奈的智力測驗基礎上發展起來的。1971年,Lord在前人基礎上提出了“計算機自適應測驗”。美國軍方在80年代開始應用計算機自適應系統CAST(TheComputerizedAdaptiveScreenTest)。如今在美國,CAT己經用于教育測試、職業測量、人事評測等領域:GRE(GraduateRecordExamination)考試、TOFEL測試、工商管理類研究生入學測試GMAT(GraduateforManagementandAdministrationTest)以及全美護士國家委員會資格測試(NurseNationalCommitteeLicenseTest)等都己經采用了CAT測試方式。日本的職稱英語測試系統CASEC是普遍使用的系統,遍布于各大公司,教育部門和政府機構。通常CASEC測試題目不足30個,就能讓測試的結果達到90%以上,提高了測試的準確率,也節約了測試時間。在歐美許多國家,CAT已成為教育測試職業測試和認證測試的主要形式。微軟的MCSE(微軟認證系統工程師)測試也采用了這一種形式。
總體來說,計算機自適應考試系統,在美國起步早,發展快,國外部分權威資格認證考試都逐步采用計算機自適應考試。
4.研究總結與展望
CAT相對傳統的紙筆測驗,可以施測較少項目就準確測量被試特質,極大提高測驗效率。目前國內較多研究集中于CAT的選題策略上,由于測驗的精度和安全性相互制約,如何比較,選擇最優項目,有待于進一步研究。未來研究應進一步提高選題策略的綜合表現、深入探討多級評分項目和認知診斷。
我國引進國外IRT先進理論,堅持獨立創新,應用發展較快,但由于受IRT理論模型的局限性和我國傳統測試方式、教育模式等因素的影響,基于IRT理論模型的自適應測試在我國實際教學的應用仍處于探索階段,如何克服IRT理論模型的局限性,并結合教學的實際情況,設計出一種具有較好性能和實際可操作性的自適應測試方法。也有待于進一步努力。
參考文獻
1 羅芬,丁樹良,王曉慶,多級評分計算機化自適應測驗動態綜合選題策略,心理學報.2012
2 毛秀珍,辛濤,計算機自適應測驗選題策略述評,心理科學進展.2011年
3 程小揚,丁樹良,嚴深海,朱隆尹,引入曝光因子的計算機化自適應測驗選題策略,心理學報.2011
4 唐小娟,丁樹良,俞宗火,計算機自適應測驗在認知診斷中的應用,心理科學進展.2012
5 林健,閏華,武兵,計算機自適應考試理論分析.太原理工大學學報,2004,35(2):222一223
6 曾彥鈞, 張雅媛, 郭伯臣.基于知識結構之適性診斷測驗系統的防猜選題策略.測驗統計年刊.2006
一、編制化學試卷的基本要求
(1)考核內容覆蓋全面,考核點分布合理,各種內容比例適當,符合化學學科特點,有較好的代表性,又突出重點,注意聯系社會和生活實際。
(2)考核深度符合大綱規定,沒有過難、過易題,總體難度中等,使學習達到規定要求者都能取得合格成績。
(3)題量適當,既能保證試題覆蓋率和信度、效度要求,又能(在難度測驗情況下)使考生有足夠的解答時間。
(4)各試題之間相互獨立,不相互提供答案或暗示。
(5)編排合理、同類型試題集中編排并冠以扼要的指導語,說明解答的要求和方式。在各類試題中盡量按照先易后難順序排列。解答各題需要的原子量等數據資料可集中提示,避免零亂散雜。
二、編制化學試卷的一般程序
(一)進行總體構思
總體構思包括明確考試的目的(為什么考)和性質:是期前預備性(摸底、預測、分組)的,或者是期中形成性(診斷,激勵)的,還是期末總結性(評定)的,根據考試目的確定考試的內容范圍和要求(合格標準);確定考試的方法(口試、筆試還是操作法)和類型(是常模對照測驗,還是目標對照測驗,是客觀型測驗、論說型測驗,還是實踐型測驗,是個別測驗,還是集體測驗,等等)
(二)擬訂編制計劃
編制計劃是試卷的設計藍圖,是編選試題的依據,它跟試題取樣的代表性和誤差大小有著密切的關系,對命題的科學性有著重要的影響。
試卷編制計劃主要包括兩部分內容:一部分是試題編選和試卷編制的原則要求,具體說明考試的目標、內容范圍、方法、試題類型以及編選試題和編制試卷的具體要求等。另一部分是試題內容和層次的分布規定,常常以雙向表格形式出現。
在擬定編題計劃時,還要根據題目的內容、層次等因素確定適宜的題目形式。這樣,雙向細目表不但可以表明每一內容層次的分數比例,還可以表示相應的題目形式和數量。
擬訂雙向細目表時,要注意層次分類合理、比例恰當。布盧姆認為,按照他對認識領域目標的分類,各層次適宜的比例為:知識占15%,領會占25%,運用占30%,分析占15%,綜合占10%,評價占5%。我國較多的人認為,前三個層次共應占60%~70%,分析、綜合可占30%~40%,評價則占0%~10%。實際上,在測驗編制時,可以有小的偏離。
(三)編選和審查試題
試題要避免跟教科書和復習資料中的習題相同,避免重復使用。在可能時,應盡量自編,力求新穎(參見《怎樣編制化學習題和化學試題》)
試題審查的主要內容是:是否符合考試的目的和性質?內容范圍和層次分布是否符合編制計劃?有沒有科學性錯誤?題文是否完整、明確、簡練、不會影響學生正常地解答?是不是跟教科書和復習資料中的習題雷同?有沒有互相暗示答案等等。審查結果大體上有4種情況:①完全合格,通過審查;②大體合格,最好稍作修改;③部分合格,必須修改;④不合格,必須淘汰。
最初入圍的試題數量應多于編題計劃,以利篩選和編制復份。
(四)組編試卷
組編試卷工作包括
(1)選定題目;選定題目除要以編制計劃為依據外,還要考慮難度要求和區分度要求、考試時間、實驗題的操作實施條件等。
(2)排序、編號;①把題型相同的集中編排,由簡單題型到復雜題型;②同一題型中,由易到難,由低層次到高層次,內容相近的可相對集中;③全部試題依次統一編號,避免在同一試卷中出現相同的題號。
(3)編寫指導語、數據表;指導語應簡明扼要地說明答題的方式、要求、分數比例和評分辦法以及測驗目的,時間限制等。全卷指導語應跟各題指導語分開編寫。數據表應限定為解題必需的原子量等數據,并且不得對任一題的解答直接提供答案或者有暗示作用。數據表可以集中放在卷首,也可以按題分設,以方便查找和篇幅緊湊為原則。
(4)版面設計;①試題之間應留有必要的間隔;一道試題的題文應排在一起,不要分頁。②要留有足夠的作答位置并且明確指示,也可以另外設計分離的答題紙。選擇題的題干與備選項不要排在一行,各備選項之間有必要的間隔填充題的各空格長度應基本相同,以免暗示或誤導學生。③設計記分表,以便集中填寫各題得分。④設計填寫考生個人資料(姓名,班級等)的位置。⑤標明考試名稱和時間。⑥力求美觀、緊湊,格式規范和統一。
(五)試做、復核、調整,編制標準答案和評分標準
試卷組編完成后,教師應進行試做,對試題和試卷細致地進行檢查,并且對照考試大綱和編制計劃細致地進行復核,針對內容不當、比例不當、難度不當或者時間過緊過松等情況作出適當的調整。
試卷復核、調整完成后,及時編制標準答案和評分標準。評分標準應該利于反映考核目標水平,根據學生的實際情況,充分估計到各種可能性,并符合編制計劃對題分的規定。
(六)編制復份
試卷常常要編制復份。復份應該具有相同的內容、水平、結構以及題量、難度和區分度,即是等價的,但題目不應重復。
編制等價復份比較困難,解決辦法最好是利用各試題的復份,也可以把所有采用的試題按難度由小到大順序編號,再按下面所示方式分組,分別編成若干份復份:
試題編號 1 2 3 4 5 6 7 8 9 10 11 12…
復份卷號 A B B A A B B A A B B A…
或
在學校教育中,定期評定學生學業成績,是教學工作的重要組成部分。過去受到“應試教育”的思想影響,對于學生的數學成績往往只看考試的卷面分數,這種“只見分數不見人”的做法,在“素質教育”的要求下,已開始在轉變。為了做好這項十分重要的工作,聯想到與這項工作有關的許多名詞、術語。諸如,國家教委1992年頒布的小學初中課程計劃(試行)中第三部分叫做“考試考查”,上海中小學課程教材改革委員會1991年印發的數學學科課程標準(草案)中第七部分叫做“教學評價和成績核定”。而有些教育理論書上又稱為“學習的評定”,有些教育辭書上則稱作“學業成績考查與評定”,還有通常說的“測驗”等等。因此,需要對于這些名詞、術語的各自含意及相互關系,作一些粗略的界定,才有利于做好這項工作。
從學校教育的宗旨是為國家培養高素質的人才來看,要有一定的質量要求,需要定期考核學生在德、智、體諸方面的發展與進步。因此,學業成績評定應是一個大概念,而考試、考查、測驗僅僅是評定學生學業成績的一切手段??荚嚒y驗著眼于客觀、正確地把學生達到教學目標的程度加以量化,學業成績評定從測試的結果有多大價值為著眼點,這兩者往往結合在一起使用。
學業成績評定的含義,通常是指學校根據一定的標準,拿數學學科來說,則以教學大綱、教材的教學要求為標準,對教學過程中學生所產生或者即將產生的思想、學業、行動和個性等方面的變化,或者變化的發展趨勢,作出恰如其人的估價。通過這樣的評價,既能反饋教師的教學效果,起到診斷、調節和強化的作用;又能反饋學生的學業進展,起到激發學習積極性,增強自信心,萌發學習成功的感受等效應,促使學生整體素質的提高。
考試、考查和測驗,其功能都是檢查學習成績和教學效果的測定方法,是測量的數量化分析和科學推斷的手段。現行的課程計劃規定考試以每學期進行一次為宜,考查著重在平時進行。上海的課程標準規定小學數學學科對一、二年級只進行日常性考查,三年級起采用日常性考查和考試相結合的方式,而日常性考查應包括認知、情感和操作三個領域??荚噭t以認知領域的教學要求為主要依據,采用命題解答的方式。由此可知,考試與考查的區別有三:其一是考試以認知領域為主,考查還包括情感和操作領域;其二是考試每學期進行一次,考查則不限于每學期進行幾次;其三是考試可用百分制記分,考查采用等第制,例如,用優良、及格、不及格來表達,或者用A、B、C三個等級。至于測驗的含義跟考查是相似的(在英文里都叫test),習慣上將考查用于學生學習成績的檢查,而測驗使用的范圍較廣,如,智力測驗、能力測驗、個別測驗、目標參照測驗、常模參照測驗,以及潛力參照測驗等等。
二、成績評定的分類和目標
布盧姆(Bloom.B.S)把評定分為三類:一是配置性評定,二是形成性評定,三是總結性評定。這樣的分類在我國的教學實踐中早有運用,通常稱為摸底評定、診斷評定和總結評定。
不論進行哪一類評定,都必須具備明確的評定目標。在這些目標中,認知領域的目標依據教學大綱和教材,編制恰當的考題,注意考題的有效性(效度)和可靠性(信度),有關這方面的理論和做法早有專著論述,不再重復。而情感領域和操作領域的目標,在數學學科中尚缺少研究,隨著時間的推移,必須著手實驗,俗話說“摸著石子過河”。為此,初步草擬了如下的內容,作引玉之磚而已。
學生學習數學情感和操作評定目標
1、掌握學習內容的能力
A、等:能輕松、迅速地從教材中找出重點和關鍵,簡明扼要地講述中心內容。
B、等:基本上能夠從教材中區分出重點,但講述不清楚。
C、等:通常不能區分教材中的重點,注意力往往集中在次要特征、屬性上。
2、完成基本技能的速度
A、等:完成基本學習技能(計算、繪圖、操作、實驗)的速度和正確率高于班中多數學生。
B、等:完成基本學習技能的速度和正確率等同于班中多數學生。
C、等:完成基本學習技能的速度和正確率低于班中多數學生。
3.學習態度和毅力
A、等:在整堂課上保持旺盛的精力,主動積極參與學習活動,不怕困難。
B、等:在整堂課上保持正常精力,有時不能主動參與學習活動,怕困難。
C、等:學習精力較差,注意力下降,不主動參與學習,作業常出錯。
4、思維的獨立性
A等:能獨立思考,提出自己的見解;常提建議,善于補充同學的發言;能尋求創造性的解題方法。
B等:在旁人啟發下能獨立思考;能獨立完成習題,遇到困難仍然能進行嘗試。
C等:不善于獨立思考,一遇困難就求助他人,經常需要監督性的幫助。
5、學習中的自我檢查
A等:有自我檢查的習慣;能主動運用逆運算檢查解題的正確性;會判定自己解題的合理性。
B等:能按教師或教材的要求,進行自我檢查訂正。
C等:不愿意自我檢查,或者草率地檢查,錯誤仍然存在。
6、遵守學習紀律的自覺性
A等:認識學習的目的性,自學維護集體紀律,表現出首創性和頑強性。
B等:認識學習的目的性,基本上能遵守學習紀律,能按時完成作業。
C等:學習目的性不明確,常常不能做到集體要求,不能按時完成作業。
7、合作態度與競爭意識
A等:能主動積極參與小組討論;能幫助同學;善于接受他人幫助;具有優于他人的競爭意識。
B等:能參與小組討論,發表自己見解;不易接納他人意見;競爭意識不強。
C等:不主動參與小組討論,不愿意發表意見,缺乏競爭勇氣。
三、綜合評定與操作方法
綜合評定包括日常性考查和終結性考試,它們之間的關系如下:
綜合評定日常性考查認知領域的單元測驗(百分制或等第制均可)
情感與操作領域的目標評定(等第制)
終結性考試(一、二年級用等第制三年級以上用百分制)
其中一、二年級可以全部采用等第制,從小淡化他們的分數觀念,克服多年來為幾分之差而產生“失敗者的”心態,三年級以上既有百分制又有等第制,可以兩者并用,即某一個學生既有終結考試的分數,又有情感、操作領域目標評定的等第。也可以自定比例折合成分數進行綜合評定。例如,上海的課程標準就采用日常性考查占50%,其中考試占20%,期末考試占30%的權重進行總評,用百分制的分數表達,必要時可附加評語。又規定日??疾橹械牡鹊冢砂磧灹紴?5分、及格為65分、不及格為45分折合成分數。當然,這只是一個地區制定的標準,各地各校也可以根據實際情況自己制定標準。總之,按素質教育的要求,不僅要評定考試分數,更要重視評定學生學習的心理素質和意志性格。
考試評分是大家比較熟悉而又習慣的方法,對于情感、操作領域的目標評定,雖有指標,畢竟模糊性較大,家長和學生應有一個適應的過程。為此,在具體操作上,可以廣為宣傳,讓家長和學生有所了解,宣傳的過程也是一種教育過程,可以促使每個學生積極向上爭取達到優良(或A等),使這一改革措施起到各級作用。
四、考試命題的導向作用
人們常說“考試題目是指揮棒”,這個說法不無道理,只要考試還存在,就會有人把考題當作“指揮棒”,也就是你考什么,我就教什么、練什么,甚至演變成“追題族”,短時期內恐難改變。為此,要十分注意考題的導向性。
其一,不是課本上有什么就考什么,還要依據教學大綱的要求。例如,四則運算的計算法則,課本上都有。因此有人在考題里編制一個填充題,讓學生把法則填寫完整,這就是引導學生去背誦、默寫計算法則,這是一個導向問題。數的四則運算只要求會正確計算就行了,至于計算法則只是計算中的一種操作流程,況且操作方法很多,課本上講的只是其中的一種,要求學生去背誦法則,只能使他們頭腦僵化,不符合數學教學的目的。又如,按應用題的數量關系繪制線段圖,也是課本上常見的,考題中不宜要求學生繪制線段圖,教學大綱也無此要求。線段圖只是幫助學生分析數量之間的關系,是解題的手段和工具,不是教學的目的。
此外,現行的數學課本中還編選了一些選學題、思考題、按大綱規定不是不作考試要求的,也不能編進考試題。
研究的進展不大,學科的成熟度不高,與我國廣泛開展的教育評價活動很不適應.我國各省市都有考試院(中心),也成立了許多評估、評價機構,廣泛展開了對教育測評估評價活動。而與此相應的教育測驗、教育統計、教育測量、教育評估、教育評價理論很不成熟.尤其值得重視的是教育評價與教育研究和發展,以及對教育評價實踐的指導.鑒于此,本文對與教育評價相關概念進行簡述和辨析.
一.關于教育評價相關概念簡述
教育測驗:即為考試,它是對人的知識、技能和能力以及某些心理特征的測量??荚囀墙逃u價的一種手段。考試是個系統,它由主考、
被考(考生)、試卷(試題的集合及其評分標準)、考分四要素組成。考試的過程就是主考組織編制試題,通過試題作用于被考,將正確答案、評分標準與被考的反應(答案)相比較,然后給出考分的過程。考試從宏觀上可分為社會考試和教育考試兩大類。教育考試又可分為校內考試和校外考試兩類。按考試分數的解釋與使用,可分為常模參照性考試和標準參照性考試。按考試對象分,有學業的成就考試、學術能力傾向測驗(其目的在于測量考生學習的潛在能力、發展傾向,如音樂能力傾向測量)、人格測驗(如測量態度、興趣、情緒、性格等).按測驗人數分,有個別測驗、團體測量.接測驗方式分,有紙筆測驗(用筆時試卷作答)和非紙筆測驗(如口試、實驗操作、表演等)。其它可分為難度測驗、速度測驗、總結性測驗、診斷性測驗以及大規模測驗(其成績的使用有權威性,要求嚴格,標準化程度高)、教師自編測驗(即教師自編用于課堂教學的測驗)等.[1]
教育統計(學):運用數理統計學的原理和方法研究教育現象中的數量關系的一門應用學科。它通過數據的分析和處理,準確地掌握教育
情況,為制定教育方針、政策提供科學依據,為開展教育科學研究,探索教育規律,制定教育方案,檢查教育效率提供科學方法,也為教育管理和教育評價提供有效的工具.它分為兩大類:一是描述統計學,研究簡縮數據和描述這些數據,二是推斷統計學,用數據進行統計檢驗,統計分析和非參數統計法作出決策。前者只是分析某一樣本的特點,而后者則是通過抽取母體的一個樣本,并以此樣本為根據來分析母體的特點.它是在教育問題的研究中,描述樣本,分析樣本,分析樣本與總體的關系,從而進行教育科學推論的一種原理和方法.其研究方法一般有:大量觀察法、統計分組法、綜合指標計算法、統計資料檢驗法、統計資料圖示等。[2]
教育測量(學):研究如何測量學生的學業成績、學習能力、興趣愛好、思想品德以及教育效益等問題的一門教育學科。它運用各種測量
手段和數理統計方法等數學工具,根據教育目標或教學計劃的要求,研究如何測量和評價教育效果,如何編制測量計劃,各種類型試題的優缺點,衡量一個學業成績測驗好壞的數量指標,如何進行測驗結果的統計分析,測驗分數的解釋和評價等.其主要內容包括:測量原理、項目分析、效度、信度、標準化測驗、測驗的設計和編制、測驗的常模、測驗的實施和評分、測驗結果的解釋等。[3]
教育評估:是一種有系統地去尋找并搜集資料,對評估對象作預測性、估計性的評判,以便協助教育決策者從若干種可行的策略中擇一而
行的過程.在我國教育評估與教育評價不作嚴格區別,在實踐中具體運用時,不同的范圍和場合有不同的習慣用法.如高等教育中多用評估,在督導部門也稱督導評估,而在普通教育領域多用教育評價不過兩個概念是有一定區別的.評估有估價的含義,較為模糊粗略,而評價相對而言是較為精確的價值判斷,評估多用于群體或單位的狀態及效果的估價,而評價則既有對群體和單位的價值判斷,也有對個人的判斷.教育評估的一個重要目的就是為教育決策提供重要依據,國家教育管理部門要根據教育評估的結果,及時調整教育的決策。教育評估的結果對國家、對學校都是一份咨詢材料,而不是行動綱領.[4]
教育評價(學):以教育為對象,研究各類教育目標與相應的教育現象之間的關系,并給予一定的價值判斷的學科.它的研究范圍可劃分
為:宏觀教育評價(研究教育思想評價和教育制度評價)和微觀教育評價(研究學校教育系統內部各類教育思想和教育活動的評價,如學校辦學思想、學校領導管理質量、教師教育和教學質量、學生德智體全面發展質量的評價等)。它的基本范疇是:教育評價的對象,教育評價的范圍,教育評價的模式,教育質的規定性評價,教育量的規定性的評價,教育質和量變化的度的評價,教育評價的指標體系,教育評價的類型.其研究的基本原則有:客觀性原則、理論聯系實際原則、發展性原則和聯系性原則.其種類包括目標評價、過程評價、條件評價、貢獻評價等.[5]
教育評價(學):教育評論學是研究教育評論現象和教育評論活動規律的科學.或者說它是研究教育評論的歷史、現狀,教育評論現象的
本質聯系,教育評論工作的性質、任務和作用,以及教育評論工作的原則、方法的科學.教育評論學是與教育理論、教育史并列的一門教育學科.要建立教育評論學的學科體系,必須解決兩大難題,即建立教育評論學的范疇體系和概念體系,并給予科學的揭示和闡述,使這些概念和范疇形成一個有機整體.同時,還要運用這些概念、范疇及其所固有的內在聯系,采取科學的方法論證教育評論活動中最普通、最一般的科學原理;從而揭示出整個教育評論活動及其形成和發展的基本規律。教育評論學的研究對象和任務,從根本上規定了教育評論學的學科性質和范疇.首先,教育評論活動是一種教育科研活動,它的直接結果是鑒別、評判教育文化的優劣,進而對教育界產生社會輿論導向作用;而教育文化本身及其所產生的依附于受教育者身心的精神產品,都屬于饈緞翁凍?,可见教育评|奐沂粲諮芯懇饈緞翁徒沂窘逃纜芻疃謀局使媛?,建立完整的教育评|堊аЭ鋪逑怠K裕逃纜堊б彩粲諢±礪堊Э啤T俅?,教育评|堊У難芯慷韻缶齠私逃纜堊婕罷黿逃煊潁諍址岣弧R部紗硬煌詠牽攵圓煌凍虢⒍嗖棵擰⒍嗖憒蔚姆種аЭ疲ㄈ紓航逃礪燮纜堊?、教育史评|堊?、教育行政评|堊А⒔逃移纜堊У齲?,所以教育评|堊в質且幻拋酆閑緣難Э芠6]
二、關于教育評價相關概念與教育評價的關系
教育評價與教育測驗的關系:教育測驗是對人的知識、技能和能力以及其他某些心理特征的檢測,是教育評價的一種手段,確切地說它是
教育評價獲得評價信息的工具之一.教育評價獲取信息的測驗法就是來自于教育測驗.
教育評價與教育統計的關系:教育統計是運用數理統計的原理和方法研究教育現象中的數量關系,通過數據的分析和處理確切地掌握教育
情況,也是教育評價的一種手段和工具。教育評價中獲取信息的統計法就來自于教育統計。
教育評價與教育測量的關系:教育測量通過對學生知識的掌握、智能的發展、思想品德的變化、體質的狀況以及教育活動的各個方面的測
定,為教育評價提供依據,是教育評價信息的主要來源.如果沒有教育測量提供的資料,教育評價將成為無源之水,失去了作價值判斷的依據,其科學性、準確性便無從談起。另外,教育測量的結果只有通過教育評價才能獲得實際意義,成為改進教育工作有參考價值的信息.[7]
教育評價與教育評估的關系:教育評價與教育評估是非常相近的兩個概念,在許多場合是通用的。評價是精確的價值判斷;而評估是估計
的、預測性的價值判斷。在我國從政府的文件到學者的文章論著,以及教育實踐都把評估與評價混用。我個人傾向于把教育評估的對象限定在以宏觀、中觀的復雜教育系統的戰略性、預測性估價方面,對于微觀的較簡單的教育系統的過去和現存實態則作為教育評價的對象。
教育評價與教育評論的關系:教育評論是對教育文化的反思和展望,它的對象是以教育文化中的精神文化和制度文化為主的,以真善美作
為評論標準的觀念活動。嚴格講它與教育評價雖只一字之差,但它與教育評價分屬于教育科學的不同領域,有著重大區別。比如,教育評價是一種管理活動,而教育評論則為觀念活動;教育評價由評價機構按嚴密的程序實施,而教育評論則由教育評論家個人采用靈活多樣的方式方法評述;教育評價有明確的指標體系并要求量化,而教育評論無需指標體系更不用量化,教育評價的對象是具體的可控的,而教育評論的對象是抽象的,不可控的;教育評價的結果多用于改進工作,而教育評論的結果則多用于改變觀念;等等。這不是說教育評價與教育評論一點關系都沒有,它們的關系表現在教育評價的結果可以成為教育評論的論據影響教育評論,而教育評論的結果可以作為教育思想觀念影響教育評價所依據的教育價值觀。
三、從價值論角度看與教育評價相關概念的區別
唯物主義的價值論認為,價值判斷和事實判斷是人們把握客觀世界和兩種不同方式。兩者反映的對象、意義和參加的心理成份都有著質的
區別。事實判斷是以客體的本質和規律為對象的,它探討客體“是怎樣的“、”是什么“,探討事物的現象、本質和規律等實體屬性,即以理性認識這種抽象思維形式反映客體的本質及其規律。而價值判斷是以客體與主體需要的關系為對象,它探討客體的價值屬性,即客體的社會意義------對社會需要意味著什么,它以多種意識形式-----認識(價值與事實判斷)、情感(對價值的態度體驗)、意志(對價值的自覺保證)等諸種形式的綜合來反映客體與主體需要的關系。
本學期快結束了,還有七天的復習時間。在這一學期,我收獲了許多,也明白了許多道理……為了這次期末考試,我要評價一下自己,讓我順利度過期末考試,迎接漫長的寒假。
作文是我的一大優點,自從二年級起,作文的水平就突飛猛進,好詞好句像一只只蜜蜂一涌而上,經常受到老師的表揚?!白魑男钤备傎悤r,只要老師一選我做代表,我不是狀元就是榜眼,因此同學們在作文這一方面都敬佩我,讓我對作文更有信心。聽說這次家長會上,老師還表揚說我作文寫得好!
在跑步方面我也有了明顯的進步。三年級下學期時,我最高才跑了8秒7,而四年級上學期,我居然可以跑到8秒2!看來,多跑跑步對我跑步測驗還是有效!
不過,在做數學的計算題時,我總是出錯,真是不可思議!4次測驗有3次我失分就是失在計算題上!我最后總結:我不是不細心也不是不會做,就是沒有多練。要是我計算對的話,那我的87分就可以變成92分,94分變成98分了……