数学建模论文快速评卷策略word模板 g168
时间:2022年03月28日
/来源:网络
/编辑:佚名
78模板网分享数学建模论文快速评卷策略模板
快速评卷策略
第二组
摘要:竞赛后的评阅试卷过程往往需要很大的人力物力,如何评阅最少的试卷与最少的评分误差就能将优胜者选出是本文解决的关键问题。
首先我们对系统偏差进行定义,根据现实生活中的改卷情况,构建系统偏差模型。考虑系统偏差与改卷数量和改卷的顺序有关,还与评这份试卷的人数多少有关。阅卷人数与系统偏差假设呈线性关系,在一次评阅中首先根据这一次评卷的人数确定因人数而造成的评分误差 ;评卷过程中的评分误差按照先减小到最小值再因评卷疲劳增大的趋势所确定的函数值 ,二者之和构成了系统偏差。通过每次分组方案的评卷过程中产生的系统偏差最大值 与第三名的成绩来确定删除分数线,从而筛选出一定数量的试卷,统计试卷总数后,按照剩下的试卷数确定下一轮的评分方法。通过对整个评卷过程系统偏差的值进行累加求和,得到评分的总偏差除以评卷次数为这种方案下的平均评分偏差。并可以算出阅卷人最小的阅卷份数。
采用列举法将一些方案列出,根据计算机不断模拟打分,计算出各个方案的评卷次数和系统偏差之和,取各方案中此两个值均较小的方案作为最佳评卷策略。
根据模拟出的结果,进行分析之后得出分组方案还与试卷分数的方差有关,分数离散度越大评卷的次数越小,分数越集中评卷的次数越大。
关键词:系统偏差 计算机模拟 评卷次数
1问题重述
在确定像数学建模竞赛这种形式比赛的优胜者时,常常要评阅大量的答卷,比如说,有P=100份答卷。一个由J位评阅人组成的小组来完成评阅任务,基于竞赛资金,对于能够聘请的评阅人数量和评阅时间的限制,如果P=100,通常取J=8.
理想的情况是每个评阅人看所有的答案,并将它们一一排序,但这种方法工作量太大。另一种方法是进行一系列筛选,在一次筛选中每个评阅人只看一定数量的的答卷,并给出分数。为了减少所看答卷的数量,考虑如下的筛选方法:如果答卷是排序的,则在每个评阅人给出的排序中排在最下面的30%答卷被淘汰;如果答卷没有排序,而是打分(比如说从1分到100分),则某个截止分数线以下的答卷被淘汰。
这样,通过筛选的答卷重新放在一起返回给评阅小组,重复上述过程,人们关注的是,每个评阅人看的答卷总数要显著地小于P。评阅过程直到剩下W份答卷时停止,这些就是优胜者。当P=100通常取W=3。
你的任务是利用排序、打分及其他方法的组合,确定一种筛选方法,按照这种方法,最后选中的W份答卷只能来自“最好的”2W份答卷(所谓“最好的”是指,我们假定存在着一种评阅人一致赞同的答卷的绝对排序)。例如,用你给出的方法得到的最后3份答卷将全部包括在“最好的”6份答卷中,在所有满足上述要求的方法中,希望你能给出使每个评阅人所看答卷份数最少的一种方法。
注意在打分时存在系统偏差的可能,例如,对于一批答卷,一位评阅人平均给70分,而另一位可能给80分。在你给出的方法中如何调节尺度来适应竞赛参数(P,J和W)的变化?
2假设与符号
模型假设:
1.评委的评分具有相对客观性,每份卷子得分的系统偏差是由评委评阅卷子的数量造成的疲劳和每位评委的偏好引起的。
2.卷子是密封的,评委不会知道评阅的卷子来自那里
3.P份试卷客观上存在优劣,加上得分的系统偏差,逼近客观分,就可以按一定的原则决定是否筛选。
4.每位评卷老师只对分得的卷子评阅一次,不存在回头重新打分。
5.每一组里每一份试卷的编号是随机的,等可能性的
6.抽样出来的试卷,不记到评委评卷的数量中
7.系统偏差的大小就可以反映本次评分的客观,公平程度和确保最好的试卷一定会被评选出来,且有效的减少了评委的工作量。
8.评委有可能评同一份试卷不止一次。
符号说明:
:第 阶段,每一个小组的评委数;
:第 阶段的小组数;
:第 阶段时还剩的试卷数;
:给个评委评卷数量;
:系统偏差基值;
其他符号见文中说明
3 模型的建立与模型的建立
3.1 模型的准备
名词解释:
该份卷子的客观分数:所有评卷人看完该份卷子给出的分数相加除以评卷总人数J。
系统偏差:该份卷子的实际分数与客观分数之间的差异。
系统偏差的基值a:J位评卷人对一份试卷评分的最大值与最小值的差。
系统偏差的基值a的求法:
通过对P份试卷先进行随机抽样n份,这n份试卷J位评委都要看,记录评委对每一份试卷的打分; =这份试卷评分的最大值与最小值的差,则
3.2 问题的分析:
减少评委工作量可行性分析
由于最后要选出W份最好的试卷,且P份试卷客观上存在优劣,则对评委的打分加以修正得到一个得分的区间(试卷的真实分数就在这个范围),再把试卷汇总按得分区间进行统计、筛选,剩下的试卷开始下一轮的评分和筛选,且满足最好的W份答卷在下一轮的评卷过程中。每一轮的评分后,试卷数量不断减少,以此达到减少评委工作量的优化工作。
系统偏差模型的建立
一方面,每一份卷子得分的系统偏差 与x个评卷人是否看过该卷子有关,当x=J时,(理想情况),不妨设此时的 =0;x=1时, =a,多少人评阅该份卷子造成的系统偏差不妨设存在一个线性关系,则有:
化简得
,
另一方面,每一份卷子得分的系统偏差 与评委评阅卷子的数量n有关,评阅第一份试卷时,由于没有参照标准且根据我们的假设又必须打出一个分数,则这个分数会存在较大的误差,随着卷子的增多,评阅卷子的个体误差会越来越少,不妨假设评委评完所分卷子的一半时,评卷的误差最小,之后这个误差又会因为评卷的疲劳而逐渐加大,容易想到
这个函数。因为考虑 时,有 , ; , ; , ,满足我们的假设规律:中间小,两端大。
构造这种形式的函数 , 其中A(N)为这一评委评阅N份试卷存在的最大偏差,A(N)这个函数与每位评委的工作能力有关,N较小时,A(N)也较小,随着N的增大,A(N)会趋向一定值 。
需满足:n=1时 =0; 时 = ; 时 = ,由于有三个已知条件构造:
得
取N=6,A(6)=1, 的图像如下:
对于函数A(N)的确定,由于达到某一N时,A(N)会趋向一定值
这里我们考虑 这个形式的函数,此函数具有随着x的增大 最后函数值趋近于1,对于我们的分析随着N的增大,最后函数值趋近于 可得
,u为我们发生指数递减变化的基值,不妨设u=10,即评委每多评10份试卷就会发生指数递减变化。
的估计值,对于一百分的卷子,我们认为一份卷子有10分的误差就很大了,所以 =10综上分析得:
函数图像如下:
则一份卷子总的得分系统偏差
3.3 模型的建立
多阶段逐步优化问题
有P份试卷,J名评委,最后确定W份最好的试卷,这一过程显然要分为m个阶段,每一阶段每个评分小组分到 名评委,每一阶段有: 个小组;每一阶段每个小组分到 ,份答卷,i=1时, 份;i为其他时 份试卷,在这个过程中每名评委评卷的最少数量为: ,且不存在两个评委打分相差很大,还要再互相交换评选的情况。
由 ,这一评卷过程的极限的系统偏差为10,则这一批试卷评卷分数的最大误差为A(N),对排列出来的卷子进行排序后取第W名卷子的成绩减去A(N),得到我们的删去分数sq,w为第W名试卷到删去分数线上保留的试卷数。
由上面的分析,m和 确定了评分过程的精确度 ,定性分析为m和 越大, 越小,
求解他们之间的定量关系
由上面系统偏差的分析pc是关于x和每一阶段评卷数量 的函数,每一阶段的评分误差
目标函数
3.4 模型求解:模拟试探法找出最优方案
P=100份,J=8人,W=3份,由上面的分析经过m轮评卷可以得到最好的W份试卷,当J=8时,为了使每个小组的评委人数相等, 只能取1,2,4,8,依次被分成8组,4组,2组,1组。则本题的分组数目是有限的。
方案的一种情况:(方差较大)
第一轮评卷时,如果一个小组两名评委,因评委差异造成的误差为 = ,N=25时,A(N)=9.24,得删去分数线sq=cj(W)-A(N)。由于评委差异造成的误差a在这一批卷子中广泛存在,对每一个评分小组不予考虑,但对所有试卷的评分误差应当考虑。用计算机编程模拟一次可得按这种方式评卷第一轮后剩下的试卷,结果如下:
每组模拟评卷平均值
第一组50.458650.517952.563854.384661.849864.009364.029864.600965.4395
69.390469.442370.073871.494471.825672.286776.520779.910383.703
84.374785.066891.212891.347191.385194.177396.7922
第二组55.935657.580958.879460.326362.410264.029267.136669.456470.9323
72.164372.385573.949974.323875.928379.130480.3782.149182.5952
84.665288.126290.498492.824694.850795.70898.5792
第三组50.170252.760857.114957.962257.98558.183259.976560.382761.6532
62.957866.453666.958570.392171.494381.119481.153681.846588.7509
88.907689.224989.870590.093895.717598.87999.2625
第四组51.165751.310356.9658.138459.111562.646465.809968.301669.7578
72.305173.373475.591776.009176.490278.849579.550882.615484.0492
84.220784.364492.567693.398693.549593.57897.9657
删去分数线:第一小组: =91.3851-9.24=82.15分
第二小组: =94.8507-9.24=85.61分
第三小组: =95.7175-9.24=86.48分
第四小组: =93.5495-9.24=84.31分
经过这样的评卷方式后,一轮后只剩下28份试卷。(红色标记的为进入下一轮评选的试卷)平均每份试卷的评分误差由 为 +4.8
第二轮评分过程:经过一轮筛选后,由于剩下28份试卷,每组两名评委,因评委差异造成的误差为 = 则需分成4组,每组7份试卷,当N=7时,A(N)= 6.6819同第一问的处理得到删去分数线
用计算机编程模拟一次可得按这种方式评卷第一轮后剩下的试卷,结果如下:
每组模拟评卷平均值
第一组63.459765.709670.222571.091686.655988.319391.0578
第二组61.202661.576869.189779.802584.116985.917993.8273
第三组63.53875.073275.354576.017776.311790.700695.6564
第四组61.02778.476279.735682.458796.867899.303199.7591
删去分数线:第一小组: =86.6559-6.6819=79.974分
第二小组: =84.1169-6.6819=77.435分
第三小组: =76.3117-6.6819=69.6298分
第四小组: =96.8678-6.6819=90.1859分
经过这样的评卷方式后,第二轮后只剩下16份试卷。平均每份试卷的评分误差由 为 +3.9
第三轮评分过程:经过一轮筛选后,由于剩下16份试卷,每组四名评委,因评委差异造成的误差为 = 则需分成2组,每组8份试卷,当N=8时,A(N)= 6.8997同第一问的处理得到删去分数线
用计算机编程模拟一次可得按这种方式评卷第一轮后剩下的试卷,结果如下:
每组模拟评卷平均值
第一组74.526275.689675.802979.082979.138586.250290.466790.937
第二组81.351284.896687.806989.347394.648995.609795.800396.9931
删去分数线:第一小组: =86.2502-6.8997=79.3505分
第二小组: =95.6097-6.8997=88.71分
经过这样的评卷方式后,第三轮后只剩下8份试卷。平均每份试卷的评分误差由
为 +4
第四轮评卷:当剩下的试卷较少时,八位评委同时评判评这些试卷,选出前三名,误差为0。
则一名评委在这评卷过程中最少判了 ,判分平均误差为每一阶段判分平均误差相加除以判分阶段,得( +4.8+ +3.9+ +4+0)/4= +3.2
方案的另一种情况:(分差较小)
每组模拟评卷平均值
第一组60.006860.676761.335862.047462.729762.816964.833566.229766.6474
68.25369.190570.06970.740572.299974.6375.446479.146679.828
80.21581.750381.815384.506886.115588.14688.9237
第二组61.784362.82164.70567.583570.34970.417370.631571.748572.4906
73.498474.099378.89679.52579.690581.552481.85882.269282.2893
84.98485.440386.074686.520788.193888.65388.7464
第三组60.001261.1561.745663.937165.534766.823167.550369.411969.7675
69.836571.402372.989773.567273.671874.167774.846275.245476.2656
79.679583.607785.271585.655985.892686.594486.9841
第四组61.959463.089364.022364.749564.902667.580770.261871.205771.2543
73.722274.520774.591974.881875.711176.971977.546678.292678.357
82.837883.976184.185985.295885.733686.51389.0838
删去分数线:第一小组: =86.1155-9.24=76.8755分
第二小组: =88.1938-9.24=78.9538分
第三小组: =85.8926-9.24=76.6526分
第四小组: =85.7336-9.24=76.4936分
经过这样的评卷方式后,一轮后只剩下40份试卷。平均每份试卷的评分误差由 为 +4.8
第二轮评分过程:经过一轮筛选后,由于剩下40份试卷,每组两名评委,因评委差异造成的误差为 = 则需分成4组,每组10份试卷,当N=10时,A(N)= 7.3106 同第一问的处理得到删去分数线
每组模拟评卷平均值
第一组65.774667.185570.017471.716974.696875.341278.96479.010379.637584.6064
第二组66.230266.659567.395970.104371.484576.073778.658780.15480.924988.3307
第三组67.398971.227674.357375.875780.737581.041984.959886.957788.121989.5285
第四组66.617366.701268.63369.28872.108674.270178.187178.620278.641185.9094
删去分数线:第一小组: =79.0103-7.3106 =71.6997分
第二小组: =80.154-7.3106 =72.8434分
第三小组: =86.9577-7.3106 =79.6451分
第四小组: =78.6202-7.3106 =71.3096分
经过这样的评卷方式后,第二轮后只剩下24份试卷。平均每份试卷的评分误差由 为 +4.2
第三轮评分过程:经过一轮筛选后,由于剩下24份试卷,每组2名评委,因评委差异造成的误差为 = 则需分成4组,每组6份试卷,当N=6时,A(N)= 6.4566同第一问的处理得到删去分数线。An =6.4566
每组模拟评卷平均值
第一组72.409972.679480.294786.480287.695789.2727
第二组70.965877.539177.60378.027878.255878.4199
第三组73.259677.481383.403284.97388.146789.2368
第四组70.771277.446279.084781.248685.855785.9046
删去分数线:第一小组: =86.4802- 6.4566 =80.0236分
第二小组: =78.0278- 6.4566 =71.5712分
第三小组: =84.973- 6.4566 =78.5164分
第四小组: =81.2486- 6.4566 =74.792分
经过这样的评卷方式后,第三轮后只剩下18份试卷。平均每份试卷的评分误差由 为 +4.6
第四轮评分过程:经过一轮筛选后,由于剩下18份试卷,每组4名评委,因评委差异造成的误差为 = 则需分成2组,每组9份试卷,当N=9时,A(N)= 7.1095同第一问的处理得到删去分数线
每组模拟评卷平均值
第一组68.352770.55274.727476.512682.181187.137390.712590.870992.0494
第二组69.191969.83972.370983.039583.123789.580991.494691.927694.3576
删去分数线:第一小组: =90.7125-6.4566=84.2559分
第二小组: =91.4946-6.4566=85.038分
经过这样的评卷方式后,第四轮后只剩下8份试卷。平均每份试卷的评分误差由 为 +4.8
第五轮评卷:当剩下的试卷较少时,八位评委同时评判评这些试卷,选出前三名,误差为0。
则一名评委在这评卷过程中最少判了 ,判分平均误差为每一阶段判分平均误差相加除以判分阶段,得( +4.8+ +4.2+ +4.6+ +4.8+0)/5= +3.68
通过上面的分析每一轮评选剩下的试卷数量,直接影响评委的工作量,若这批卷子质量都较好,分数较近。则被保留的的试卷较多,评委需经过多轮评分才能评出最后的W份。
若这批卷子分数相差很大,则被保留的的试卷较少,评委经过较少的评分就能评出最后的W份。
模型的最优解具有很大的随机性,直接与计算机模拟出来的分数的方差有关。
参考文献:
1.宋来忠、王志明《数学建模与实验》科学出版社 2005年出版
链接: https://pan.baidu.com/s/111GLYy7DR5lpj6tSQrjzwg 提取码: x86q