Վիճակագրական տվյալների մշակման նպատակը. Առաջնային վիճակագրական տվյալների մշակում: Վիճակագրության տարրերի ուսումնասիրության հիմնական նպատակները

Փորձի արդյունքների վիճակագրական մշակման մեթոդներն են մաթեմատիկական մեթոդները, բանաձևերը, քանակական հաշվարկների մեթոդները, որոնց օգնությամբ փորձի ընթացքում ստացված ցուցանիշները կարելի է ընդհանրացնել, բերել համակարգ՝ բացահայտելով դրանցում թաքնված օրինաչափությունները։

Խոսքը վիճակագրական բնույթի այնպիսի օրինաչափությունների մասին է, որոնք առկա են փորձի ընթացքում ուսումնասիրված փոփոխականների միջեւ։

Տվյալներ հիմնական տարրերն են, որոնք պետք է դասակարգվեն կամ դասակարգվեն վերամշակման նպատակով 26:

Մաթեմատիկական և վիճակագրական վերլուծության որոշ մեթոդներ հնարավորություն են տալիս հաշվարկել այսպես կոչված տարրական մաթեմատիկական վիճակագրությունը, որը բնութագրում է տվյալների ընտրանքային բաշխումը, օրինակ.

նմուշի միջին,

Նմուշի շեղում,

Մեդիան և այլն:

Մաթեմատիկական վիճակագրության այլ մեթոդները հնարավորություն են տալիս դատել առանձին ընտրանքային վիճակագրության փոփոխությունների դինամիկան, օրինակ.

դիսպերսիայի վերլուծություն,

Ռեգրեսիոն վերլուծություն.

Օգտագործելով ընտրանքային մեթոդների երրորդ խումբը, կարելի է արժանահավատորեն դատել վիճակագրական հարաբերությունների մասին, որոնք գոյություն ունեն այս փորձի ընթացքում ուսումնասիրված փոփոխականների միջև.

Հարաբերակցության վերլուծություն;

Գործոնային վերլուծություն;

համեմատության մեթոդներ.

Մաթեմատիկական-վիճակագրական վերլուծության բոլոր մեթոդները պայմանականորեն բաժանվում են առաջնային և երկրորդային 27:

Առաջնային են կոչվում այն մեթոդները, որոնց օգնությամբ հնարավոր է ձեռք բերել ցուցիչներ, որոնք ուղղակիորեն արտացոլում են փորձի ժամանակ կատարված չափումների արդյունքները։

Երկրորդական մեթոդները կոչվում են վիճակագրական մշակում, որի օգնությամբ առաջնային տվյալների հիման վրա բացահայտվում են դրանցում թաքնված վիճակագրական օրինաչափությունները։

Վիճակագրական մշակման առաջնային մեթոդները ներառում են, օրինակ.

Նմուշի միջինի որոշում;

Նմուշի շեղում;

Ընտրովի նորաձևություն;

Նմուշի միջն.

Երկրորդական մեթոդները սովորաբար ներառում են.

Հարաբերակցության վերլուծություն;

Ռեգրեսիայի վերլուծություն;

Երկու կամ ավելի նմուշների համար առաջնային վիճակագրության համեմատման մեթոդներ:

Դիտարկենք տարրական մաթեմատիկական վիճակագրության հաշվարկման մեթոդներ՝ սկսած ընտրանքի միջինից:

Թվաբանական միջին - բոլոր տվյալների արժեքների գումարի հարաբերակցությունն է 28 տերմինների թվին:

Միջին արժեքը, որպես վիճակագրական ցուցանիշ, փորձի ընթացքում ուսումնասիրված հոգեբանական որակի միջին գնահատումն է:

Այս գնահատումը բնութագրում է դրա զարգացման աստիճանը որպես ամբողջություն հոգեախտորոշիչ հետազոտության ենթարկված առարկաների խմբում: Ուղղակիորեն համեմատելով երկու կամ ավելի նմուշների միջին արժեքները՝ մենք կարող ենք դատել գնահատվող որակի այս նմուշները կազմող մարդկանց զարգացման հարաբերական աստիճանի մասին:

Նմուշի միջինը որոշվում է հետևյալ բանաձևով 29.

որտեղ x cf-ն նմուշի միջին կամ թվաբանական միջինն է.

n - նմուշի կամ մասնավոր հոգեախտորոշիչ ցուցանիշների առարկաների թիվը, որոնց հիման վրա հաշվարկվում է միջին արժեքը.

x k - ցուցիչների մասնավոր արժեքներ առանձին առարկաների համար: Նման n ցուցանիշ կա, ուստի այս փոփոխականի k ինդեքսը արժեքներ է վերցնում 1-ից n;

∑ - ընդունված է մաթեմատիկայի մեջ, այն փոփոխականների արժեքների գումարման նշանը, որոնք գտնվում են այս նշանից աջ:

Ցրվածություն 30-ի միջին արժեքի վերաբերյալ տվյալների ցրվածության չափումն է:

Որքան մեծ է շեղումը, այնքան մեծ է դիսպերսիան կամ ցրվածությունը տվյալների մեջ: Այն որոշվում է, որպեսզի կարողանանք միմյանցից տարբերել նույն միջին, բայց տարբեր տարածված քանակությունները։

Դիսպերսիան որոշվում է հետևյալ բանաձևով.

որտեղ է ընտրանքի շեղումը, կամ պարզապես շեղումը.

Արտահայտություն, որը նշանակում է, որ բոլոր x k-ի համար այս նմուշի առաջինից մինչև վերջինը, անհրաժեշտ է հաշվարկել մասնավոր և միջին արժեքների տարբերությունները, քառակուսի դնել այդ տարբերությունները և ամփոփել դրանք.

n-ը նմուշի կամ առաջնային արժեքների առարկաների թիվն է, որոնց համար հաշվարկվում է շեղումը:

միջին կոչվում է ուսումնասիրվող հատկանիշի արժեքը, որը բաժանում է նմուշը, որը դասավորված է այս հատկանիշի արժեքով, կիսով չափ:

Միջինի իմացությունը օգտակար է պարզելու համար, թե արդյոք ուսումնասիրված հատկանիշի որոշակի արժեքների բաշխումը սիմետրիկ է և մոտենում է այսպես կոչված նորմալ բաշխմանը: Նորմալ բաշխման միջին և միջինը սովորաբար նույնն են կամ շատ քիչ են տարբերվում միմյանցից:

Եթե հատկանիշների ընտրանքային բաշխումը նորմալ է, ապա դրա վրա կարող են կիրառվել տվյալների նորմալ բաշխման վրա հիմնված երկրորդական վիճակագրական հաշվարկման մեթոդներ: Հակառակ դեպքում դա հնարավոր չէ անել, քանի որ լուրջ սխալներ կարող են սողոսկել հաշվարկների մեջ:

Նորաձևություն ևս մեկ տարրական մաթեմատիկական վիճակագրություն և փորձարարական տվյալների բաշխման բնութագիր: Ռեժիմը հետազոտվող հատկանիշի քանակական արժեքն է, որն առավել հաճախ հանդիպում է ընտրանքում:

Սիմետրիկ հատկանիշների բաշխման համար, ներառյալ նորմալ բաշխումը, ռեժիմի արժեքները համընկնում են միջին և միջին արժեքների հետ: Բաշխումների այլ տեսակների համար, ասիմետրիկ, դա բնորոշ չէ:

Երկրորդային վիճակագրական մշակման մեթոդը, որի միջոցով պարզվում է փորձարարական երկու շարքի տվյալների միջև կապը կամ ուղղակի կապը, կոչվում է. հարաբերակցության վերլուծության մեթոդ. Այն ցույց է տալիս, թե ինչպես է մի երեւույթը ազդում մյուսի վրա կամ կապված է դրա հետ իր դինամիկայով: Այս տեսակի կախվածություններ կան, օրինակ, մեծությունների միջև, որոնք միմյանց հետ պատճառահետևանքային կապի մեջ են: Եթե պարզվի, որ երկու երևույթ վիճակագրորեն էականորեն փոխկապակցված են միմյանց հետ, և եթե միևնույն ժամանակ վստահություն կա, որ դրանցից մեկը կարող է հանդես գալ որպես մյուս երևույթի պատճառ, ապա միանշանակ հետևում է, որ դրանց միջև կա պատճառահետևանքային կապ. .

Այս մեթոդի մի քանի տեսակներ կան.

Գծային հարաբերակցության վերլուծությունը թույլ է տալիս ուղղակի կապեր հաստատել փոփոխականների միջև իրենց բացարձակ արժեքներով: Այս կապերը գրաֆիկորեն արտահայտվում են ուղիղ գծով, այստեղից էլ առաջացել է «գծային» անվանումը։

Գծային հարաբերակցության գործակիցը որոշվում է հետևյալ բանաձևով 31.

որտեղ r xy - գծային հարաբերակցության գործակից;

x, y -համեմատված արժեքների միջին նմուշի արժեքները.

X ես , յ ես - համեմատած քանակությունների մասնավոր նմուշի արժեքներ.

Պ -համեմատված ցուցանիշների շարքի արժեքների ընդհանուր թիվը.

Դիսպերսիաներ, համեմատվող արժեքների շեղումներ միջին արժեքներից:

Դասակարգային հարաբերակցությունը որոշում է կախվածությունը ոչ թե փոփոխականների բացարձակ արժեքների, այլ նրանց կողմից զբաղեցրած հերթական տեղերի կամ շարքերի միջև՝ ըստ մեծության դասավորված շարքի: Վարկանիշային հարաբերակցության գործակցի բանաձևը 32 է.

որտեղ R s - աստիճանի հարաբերակցության գործակիցը ըստ Spearman-ի;

դ ես - նույն առարկաների ցուցիչների շարքերի տարբերությունը պատվիրված տողերում.

Պ -առարկաների կամ թվային տվյալների (շարքերի) թիվը փոխկապակցված շարքում:

1. Վիճակագրական տվյալների մշակման գործիքներ Excel-ում

2. Հատուկ գործառույթների կիրառում

3. Օգտագործելով ANALYSIS PACKAGE գործիքը

գրականություն:

հիմնական:

1. Բերք. Տվյալների վերլուծություն հետ Microsoft Excel. Պեր. անգլերենից / Burke, Kenneth, Carey, Patrick. - M .: Հրատարակչություն «Ուիլյամ», 2005 թ. - S. 216 - 256:

2. Միշին Ա.Վ. Ինֆորմացիոն տեխնոլոգիաիրավաբանական գործունեության մեջ՝ արհեստանոց / Ա.Վ. Միշին. – M.: RAP, 2013. – S. 2-11.

լրացուցիչ:

3. Ինֆորմատիկա իրավաբանների և տնտեսագետների համար. Դասագիրք բուհերի համար / Ed. Ս.Վ. Սիմոնովիչ. - Սանկտ Պետերբուրգ: Peter, 2004. - S. 498-516.

Պրակտիկա #30

Թեմա թիվ 11.1. Տվյալների բազաների պահպանում Access DBMS-ում

Դասը անցկացվում է նախագծերի մեթոդով։

Ծրագրի նպատակը` մշակել դատարանի աշխատանքի վերաբերյալ տվյալների բազա:

Տեխնիկական առաջադրանք.

1. Երկու աղյուսակներից «Դատավորներ» և «Հայցադիմումներ» շտեմարան ստեղծել «Դատարան»՝ համապատասխանաբար հետևյալ կառուցվածքով.

Աղյուսակ «Դատավորներ»

Դաշտի անվանումը	Մրցավարի կոդը	ԱՄԲՈՂՋ ԱՆՈՒՆԸ	Ընդունելության օրեր	Աշխատանքային ժամեր	Աշխատանքային փորձ
Տվյալների տեսակը	Թվային	Տեքստ	Տեքստ	Տեքստ	Թվային

Դաշտի չափը	երկար ամբողջ թիվ				երկար ամբողջ թիվ
Դաշտի ձևաչափ	Հիմնական				Հիմնական
Տասնորդական տեղերի քանակը
Կանխադրված արժեք			"Ամուսնացնել"	«15:00-17:00»
Արժեքային պայման	>36200 Եւ<36299		Երկուշաբթի կամ երեքշաբթի կամ չորեքշաբթի կամ հինգշաբթի կամ ուրբաթ		>0 Եվ<40
Սխալի հաղորդագրություն			Վավեր արժեքներն են երկուշաբթի, երեքշաբթի, չորեքշաբթի, հինգշաբթի կամ ուրբաթ: Կրկին մուտքագրեք	!	Վավեր արժեքներն են 1-ից մինչև 39: Խնդրում ենք կրկին փորձել:
Պարտադիր դաշտ	Այո՛	Այո՛	Ոչ	Ոչ	Ոչ
Ինդեքսավորված դաշտ		Ոչ	Ոչ	Ոչ	Ոչ

Նշում. Հայտարարեք «Դատավորի օրենսգիրք» բանալի դաշտը:

Աղյուսակ «Պահանջներ»

Դաշտի անվանումը	Գործի համարը	հայցվոր	Պատասխան-չիկ	Մրցավարի կոդը	Հանդիպման ամսաթիվը
Տվյալների տեսակը	Թվային	Տեքստ	Տեքստ	Թվային	Ամսաթիվ Ժամ
Դաշտի հատկություններ. Ընդհանուր ներդիր
Դաշտի չափը	երկար ամբողջ թիվ			երկար ամբողջ թիվ	Ամբողջական ամսաթվի ձևաչափ
Դաշտի ձևաչափ	Հիմնական
Տասնորդական տեղերի քանակը
Կանխադրված արժեք
Արժեքային պայման	>0 Եվ<99999			>36200 Եւ<36299
Սխալի հաղորդագրություն	Սխալ մուտքագրում. նորից փորձեք:			Վավեր արժեքներն են 36201-ից մինչև 36298: Խնդրում ենք կրկին փորձել:
Պարտադիր դաշտ	Այո՛	Ոչ	Ոչ	Ոչ	Ոչ
Ինդեքսավորված դաշտ	Այո (Համընկնումներ չեն թույլատրվում)	Ոչ	Ոչ	Այո (Պատահականությունը թույլատրվում է)	Ոչ

2. Դատավորների աղյուսակում մուտքագրեք հետևյալ տվյալների գրառումները.

Պահանջների աղյուսակում մուտքագրեք հետևյալ տվյալների գրառումները.

3. Օգտագործեք «Դատավորի կոդը» դաշտը՝ աղյուսակների միջև «մեկ-շատ» հարաբերություն հաստատելու համար։ ԴատավորներԵվ դատական հայցեր. Միևնույն ժամանակ սահմանեք «Ապահովել տվյալների ամբողջականությունը» և «կապված դաշտերի կասկադային թարմացում»:

գրականություն:

հիմնական:

1. Միշին Ա.Վ. Տեղեկատվական տեխնոլոգիաները մասնագիտական գործունեության մեջ. ուսումնական ուղեցույց / Ա.Վ. Միշինը, Լ.Է. Միստրով, Դ.Վ. Կարտավցև. - M.: RAP, 2011. - S. 259-264:

լրացուցիչ:

Պրակտիկա #31

Թեմա թիվ 11.2. Access DBMS-ում ձևերի և հարցումների ստեղծման սկզբունքները

1. Տվյալների մուտքագրման համար մուտքագրման ձևերի մշակում:

2. Հաշվարկների իրականացման և մուտքագրված տվյալների վերլուծության մեթոդիկա.

գրականություն:

հիմնական:

1. Միշին Ա.Վ. Տեղեկատվական տեխնոլոգիաները մասնագիտական գործունեության մեջ. ուսումնական ուղեցույց / Ա.Վ. Միշինը, Լ.Է. Միստրով, Դ.Վ. Կարտավցև. - M.: RAP, 2011. - S. 265-271.

լրացուցիչ:

2. Ինֆորմատիկա և տեղեկատվական տեխնոլոգիաներ. դասագիրք համալսարանականների համար / I.G. Լեսնիչայա, Ի.Վ. Անհայտ կորած Յու.Դ. Ռոմանովա, Վ.Ի. Շեստակովը։ - 2-րդ հրատ. - M.: Eksmo, 2006. - 544 p.

3. Միխեևա Է.Վ. Տեղեկատվական տեխնոլոգիաները մասնագիտական \u200b\u200bգործունեության մեջ. Դասագիրք միջին մասնագիտական \u200b\u200bդպրոցների ուսանողների համար / E.V. Միխեև. - 2-րդ հրատ., ջնջված: - Մ.: Ակադեմիա, 2005. - 384 էջ.

№3 լաբորատոր աշխատանք. Վիճակագրական տվյալների մշակում MatLab համակարգում

Խնդրի ընդհանուր հայտարարություն

Լաբորատոր աշխատանքի հիմնական նպատակը MatLAB միջավայրում վիճակագրական տվյալների մշակման հետ աշխատելու հիմունքներին ծանոթանալն է։

Տեսական մաս

Առաջնային վիճակագրական տվյալների մշակում

Տվյալների վիճակագրական մշակումը հիմնված է առաջնային և երկրորդային քանակական մեթոդների վրա: Վիճակագրական տվյալների առաջնային մշակման նպատակը ստացված տեղեկատվության կառուցվածքն է, որը ենթադրում է տվյալների խմբավորում առանցքային աղյուսակների մեջ՝ ըստ տարբեր պարամետրերի: Հում տվյալները պետք է ներկայացվեն այնպիսի ձևաչափով, որ անձը կարողանա մոտավոր գնահատել ստացված տվյալների հավաքածուն և բացահայտել տեղեկատվություն ստացված տվյալների բաշխվածության մասին, օրինակ՝ տվյալների միատարրությունը կամ կոմպակտությունը: Տվյալների առաջնային վերլուծությունից հետո կիրառվում են երկրորդային վիճակագրական տվյալների մշակման մեթոդներ, որոնց հիման վրա որոշվում են վիճակագրական օրինաչափությունները առկա տվյալների հավաքածուում:

Տվյալների զանգվածի վրա առաջնային վիճակագրական վերլուծություն կատարելը թույլ է տալիս գիտելիքներ ձեռք բերել հետևյալի մասին.

Ո՞րն է նմուշի համար առավել բնորոշ արժեքը: Այս հարցին պատասխանելու համար որոշվում են կենտրոնական տենդենցի չափումներ։

Արդյո՞ք տվյալների մեծ ցրվածություն կա այս բնորոշ արժեքի հետ կապված, այսինքն՝ ո՞րն է տվյալների «անորոշությունը»: Այս դեպքում որոշվում են փոփոխականության չափերը։

Հարկ է նշել այն փաստը, որ կենտրոնական միտումի և փոփոխականության չափման վիճակագրական ցուցանիշները որոշվում են միայն քանակական տվյալներով։

Կենտրոնական միտումի միջոցառումներ- արժեքների խումբ, որի շուրջ խմբավորվում են մնացած տվյալները: Այսպիսով, կենտրոնական տենդենցի չափումները ընդհանրացնում են տվյալների զանգվածը, ինչը հնարավորություն է տալիս եզրակացություններ կազմել ինչպես ամբողջ նմուշի, այնպես էլ համեմատական վերլուծություն անցկացնելու համար: տարբեր նմուշներ միմյանց հետ:

Ենթադրենք, կա տվյալների ընտրանք, ապա կենտրոնական միտումի չափումները գնահատվում են հետևյալ ցուցանիշներով.

1. նմուշի միջինբոլոր նմուշային արժեքների գումարը նրանց թվի վրա բաժանելու արդյունք է: Այն որոշվում է բանաձևով (3.1):

(3.1)

Որտեղ - ես-րդ նմուշի տարրը;

nնմուշի տարրերի քանակն է:

Ընտրանքային միջինն ապահովում է ամենամեծ ճշգրտությունը կենտրոնական միտումի գնահատման գործընթացում:

2. Միջին- առաջացնում է արժեք վերևում և ներքևում, որից տարբեր արժեքների թիվը նույնն է, այսինքն՝ սա հաջորդական տվյալների շարքի կենտրոնական արժեքն է: Այն որոշվում է կախված նմուշի տարրերի քանակի հավասարությունից/տարօրինակությունից՝ օգտագործելով (3.2) կամ (3.3) բանաձևերը: Տվյալների նմուշի միջինը գնահատելու ալգորիթմ.

Առաջին հերթին տվյալները դասակարգվում են (դասավորվում) աճման/նվազման կարգով։

Եթե պատվիրված նմուշն ունի տարօրինակ թվով տարրեր, ապա մեդիանը նույնն է, ինչ կենտրոնական արժեքը:

(3.2)

Որտեղ n

Զույգ թվով տարրերի դեպքում մեդիանը սահմանվում է որպես երկու կենտրոնական արժեքների միջին թվաբանական:

(3.3)

որտեղ է պատվիրված նմուշի միջին տարրը.

- պատվիրված ընտրության տարրը հետևյալն է.

Նմուշի տարրերի քանակը:

Այն դեպքում, երբ նմուշի բոլոր տարրերը տարբեր են, ապա նմուշի տարրերի ուղիղ կեսը մեծ են միջինից, իսկ մյուս կեսը ավելի քիչ են: Օրինակ, նմուշի համար (1, 5, 9, 15, 16) մեդիանը նույնն է, ինչ 9-րդ տարրը:

Վիճակագրական տվյալների վերլուծության ժամանակ մեդիանը թույլ է տալիս բացահայտել ընտրանքի այն տարրերը, որոնք խիստ ազդում են ընտրանքի միջին արժեքի վրա:

Ասենք՝ ունենք 20 հոգանոց նմուշ։ Նմուշի տարրերը տեղեկատվություն են յուրաքանչյուր անձի միջին ամսական եկամտի մասին: Ենթադրենք, որ 19 մարդ ունի միջին ամսական 20 հազար եկամուտ: եւ 1 անձ՝ 300 տր. եկամուտով. Ամբողջ ընտրանքի ամսական ընդհանուր եկամուտը 680 տր. Միջինը, նմուշը պատվիրելուց հետո, սահմանվում է որպես նմուշի տասներորդ և տասնմեկերորդ տարրերի թվաբանական միջին) և հավասար է Me = 20 tr: Այս արդյունքը մեկնաբանվում է այսպես. մեդիանը ընտրանքը բաժանում է երկու խմբի, այնպես որ կարելի է եզրակացնել, որ առաջին խմբում յուրաքանչյուր մարդ միջին ամսական եկամուտ ունի ոչ ավելի, քան 20 հազար ռուբլի, իսկ երկրորդ խմբում՝ ոչ։ 20 հազար ռուբլուց պակաս Ռ. Այս օրինակում կարելի է ասել, որ միջինը բնութագրվում է նրանով, թե որքան է վաստակում «միջին» մարդը: Մինչդեռ ընտրանքի միջին արժեքն էականորեն բարձր է S=34-ից, ինչը վկայում է միջին եկամուտը գնահատելիս այս բնութագրի անընդունելիության մասին:

Այսպիսով, որքան մեծ է տարբերությունը միջին և ընտրանքային միջինի միջև, այնքան մեծ է ընտրանքի տվյալների ցրումը (քննարկվող օրինակում 300 տրիլիոն եկամուտ ունեցող անձը ակնհայտորեն տարբերվում է որոշակի ընտրանքի միջին մարդկանցից և ունի էական ազդեցություն միջին եկամտի գնահատման վրա): Ինչ անել նման տարրերի հետ, որոշվում է յուրաքանչյուր առանձին դեպքում: Բայց ընդհանուր դեպքում ընտրանքի հավաստիությունն ապահովելու համար դրանք հանվում են, քանի որ դրանք մեծ ազդեցություն ունեն վիճակագրական ցուցանիշների գնահատման վրա։

3. Նորաձևություն (Mo)- առաջացնում է այն արժեքը, որն առավել հաճախ հանդիպում է նմուշում, այսինքն՝ ամենաբարձր հաճախականությամբ արժեքը: Ռեժիմի գնահատման ալգորիթմ.

Այն դեպքում, երբ նմուշը պարունակում է նույնքան հաճախ հանդիպող տարրեր, ապա ասում ենք, որ նման նմուշում ռեժիմ չկա։

Եթե երկու հարակից աղբամաններն ունեն նույն հաճախականությունը, որն ավելի մեծ է, քան մյուս աղբամանների հաճախականությունը, ապա ռեժիմը սահմանվում է որպես երկու արժեքների միջին:

Եթե նմուշի երկու տարրերը ունեն նույն հաճախականությունը, որը մեծ է նմուշի մնացած տարրերի հաճախականությունից, և միևնույն ժամանակ այդ տարրերը հարակից չեն, ապա ասում ենք, որ այս նմուշում կա երկու ռեժիմ։

Վիճակագրական վերլուծության ռեժիմն օգտագործվում է այն իրավիճակներում, երբ անհրաժեշտ է արագ գնահատել կենտրոնական տենդենցի չափը և բարձր ճշգրտություն չի պահանջվում: Օրինակ, նորաձեւությունը (չափի կամ ապրանքանիշի առումով) հարմար է օգտագործել գնորդների շրջանում առավել պահանջված հագուստն ու կոշիկները որոշելու համար։

Ցրման չափումներ (փոփոխականություն)- վիճակագրական ցուցանիշների խումբ, որը բնութագրում է նմուշի առանձին արժեքների տարբերությունները: Ելնելով դիսպերսիոն միջոցառումների ցուցանիշներից՝ հնարավոր է գնահատել նմուշի տարրերի միատարրության և կոմպակտության աստիճանը։ Ցրման միջոցառումները բնութագրվում են ցուցիչների հետևյալ շարքով.

1. Սահեցրեք -սա դիտարկումների արդյունքների (նմուշի տարրեր) առավելագույն և նվազագույն արժեքների միջև ընկած միջակայքն է: Շրջանակի ցուցիչը ցույց է տալիս տվյալների բազայում արժեքների տարածվածությունը: Եթե միջակայքը մեծ է, ապա պոպուլյացիայի մեջ արժեքները շատ ցրված են, հակառակ դեպքում (միջակայքը փոքր է), ասում են, որ պոպուլյացիայի արժեքները մոտ են միմյանց: Շրջանակը որոշվում է բանաձևով (3.4):

(3.4)

Որտեղ - նմուշի առավելագույն տարրը.

նմուշի նվազագույն տարրն է:

2.Միջին շեղումմիջին թվաբանական տարբերությունն է (բացարձակ արժեքով) նմուշի յուրաքանչյուր արժեքի և դրա նմուշի միջինի միջև: Միջին շեղումը որոշվում է բանաձևով (3.5):

(3.5)

Որտեղ - ես-րդ նմուշի տարրը;

Նմուշի միջին արժեքը՝ հաշվարկված բանաձևով (3.1);

Նմուշի տարրերի քանակը:

Մոդուլ անհրաժեշտ է այն պատճառով, որ յուրաքանչյուր կոնկրետ տարրի միջինից շեղումները կարող են լինել ինչպես դրական, այնպես էլ բացասական: Հետևաբար, եթե մոդուլը չվերցվի, ապա բոլոր շեղումների գումարը մոտ կլինի զրոյին, և անհնար կլինի դատել տվյալների փոփոխականության աստիճանը (տվյալների կուտակումը նմուշի միջինի շուրջ): Վիճակագրական վերլուծության ժամանակ եղանակը և միջինը կարող են վերցվել ընտրանքի միջինի փոխարեն:

3. Ցրվածությունցրման չափանիշ է, որը նկարագրում է տվյալների արժեքների և միջինի հարաբերական շեղումը: Այն հաշվարկվում է որպես յուրաքանչյուր նմուշի տարրի քառակուսի շեղումների գումարը միջին արժեքից: Կախված ընտրանքի չափից, շեղումը գնահատվում է տարբեր ձևերով.

Մեծ նմուշների համար (n>30) ըստ բանաձևի (3.6)

(3.6)

Փոքր նմուշների համար (n<30) по формуле (3.7)

(3.7)

որտեղ X i - նմուշի i-րդ տարրը;

S-ը նմուշի միջին արժեքն է.

Նմուշի տարրերի քանակը;

(X i – S) - տվյալների հավաքածուի յուրաքանչյուր արժեքի միջին արժեքից շեղում:

4. Ստանդարտ շեղումչափում է, թե որքանով են ցրված տվյալների կետերը իրենց միջինի նկատմամբ:

Անհատական շեղումների քառակուսիացման գործընթացը շեղումների հաշվարկման ժամանակ մեծացնում է ստացված շեղումների արժեքի շեղման աստիճանը սկզբնական շեղումներից, որն իր հերթին լրացուցիչ սխալներ է առաջացնում: Այսպիսով, տվյալների կետերի տարածման գնահատականը դրանց միջինի վերաբերյալ միջին շեղման արժեքին մոտավորելու համար, քառակուսի արմատը հանվում է շեղումից: Տարբերության արդյունահանված արմատը բնութագրում է փոփոխականության չափը, որը կոչվում է միջին քառակուսի արմատ կամ ստանդարտ շեղում (3.8):

(3.8)

Ենթադրենք, դուք ծրագրային ապահովման մշակման ծրագրի ղեկավար եք: Ձեր հսկողության տակ ունեք հինգ ծրագրավորող։ Կառավարելով նախագծի իրականացման գործընթացը՝ դուք առաջադրանքները բաշխում եք ծրագրավորողների միջև: Օրինակի պարզության համար մենք ելնենք նրանից, որ առաջադրանքները համարժեք են բարդությամբ և կատարման ժամանակով։ Դուք որոշեցիք վերլուծել յուրաքանչյուր ծրագրավորողի աշխատանքը (շաբաթվա ընթացքում կատարված առաջադրանքների քանակը) վերջին 10 շաբաթվա ընթացքում, ինչի արդյունքում ստացաք հետևյալ նմուշները.

Շաբաթվա անվանումը

Կատարված առաջադրանքների միջին քանակը գնահատելուց հետո ստացաք հետևյալ արդյունքը.

Շաբաթվա անվանումը											Ս
											22,3
											22,4
											22,2
											22,1
											22,5

S ցուցանիշի հիման վրա բոլոր ծրագրավորողները միջինում աշխատում են նույն արդյունավետությամբ (շաբաթական մոտ 22 առաջադրանք)։ Այնուամենայնիվ, փոփոխականության (տիրույթի) ցուցանիշը շատ բարձր է (չորրորդ ծրագրավորողի 5 առաջադրանքից մինչև հինգերորդ ծրագրավորողի 24 առաջադրանք):

Շաբաթվա անվանումը	Ս	Պ
	22,3
	22,4
	22,2
	22,1
	22,5

Եկեք գնահատենք ստանդարտ շեղումը, որը ցույց է տալիս, թե ինչպես են արժեքները բաշխվում նմուշներում միջինի համեմատ, մասնավորապես, մեր դեպքում գնահատելու համար, թե որքան մեծ է շաբաթից շաբաթ առաջադրանքի ավարտի տարածումը:

Շաբաթվա անվանումը	Ս	Պ	ԱՅՍՊԵՍ
	22,3		1,56
	22,4		1,8
	22,2		2,84
	22,1		1,3
	22,5		5,3

Ստանդարտ շեղման արդյունքում ստացված գնահատականը ասում է հետևյալը (եկեք գնահատենք երկու ծայրահեղ դեպքերը՝ 4 և 5 ծրագրավորողները).

4 ծրագրավորողների ընտրանքում յուրաքանչյուր արժեք միջինից 1,3 աշխատատեղով շեղվում է միջինից:

Ծրագրավորողի 5-ի նմուշի յուրաքանչյուր արժեք միջինից շեղվում է միջինից 5,3 աշխատատեղով:

Որքան մոտ է ստանդարտ շեղումը 0-ին, այնքան ավելի հուսալի է միջինը, քանի որ դա ցույց է տալիս, որ նմուշի յուրաքանչյուր արժեք գրեթե հավասար է միջինին (մեր օրինակում 22,5 կետ): Հետևաբար, 4-րդ ծրագրավորողն ամենահետևողականն է՝ ի տարբերություն 5-ի։ Առաջադրանքների կատարման շաբաթական փոփոխականությունը 5-րդ ծրագրավորողի համար կազմում է 5,3 առաջադրանք, ինչը ցույց է տալիս զգալի տարածում: 5-րդ ծրագրավորողի դեպքում միջինին չի կարելի վստահել, և հետևաբար դժվար է գուշակել հաջորդ շաբաթվա կատարած առաջադրանքների քանակը, ինչն իր հերթին դժվարացնում է պլանավորելն ու աշխատանքային գրաֆիկը պահպանելը։ Թե ինչ կառավարչական որոշում եք կայացնում այս դասընթացում, կարևոր չէ: Կարևոր է, որ դուք ստանաք գնահատական, որի հիման վրա կարող են համապատասխան կառավարման որոշումներ կայացվել:

Այսպիսով, կարելի է ընդհանուր եզրակացություն անել, որ միջինը միշտ չէ, որ ճիշտ է գնահատում տվյալները: Միջին գնահատման ճիշտությունը կարելի է դատել ստանդարտ շեղման արժեքով:

Դասախոսություն 12. Արդյունքների վիճակագրական մշակման մեթոդներ.

Արդյունքների վիճակագրական մշակման մեթոդները կոչվում են մաթեմատիկական տեխնիկա, բանաձևեր, քանակական հաշվարկների մեթոդներ, որոնց օգնությամբ փորձի ընթացքում ստացված ցուցանիշները կարելի է ընդհանրացնել, բերել համակարգ՝ բացահայտելով դրանցում թաքնված օրինաչափությունները։ Խոսքը վիճակագրական բնույթի այնպիսի օրինաչափությունների մասին է, որոնք առկա են փորձի ընթացքում ուսումնասիրված փոփոխականների միջեւ։

1. Փորձարարական արդյունքների առաջնային վիճակագրական մշակման մեթոդներ

Մաթեմատիկական և վիճակագրական վերլուծության բոլոր մեթոդները պայմանականորեն բաժանվում են առաջնային և երկրորդային: Առաջնային են կոչվում այն մեթոդները, որոնց օգնությամբ հնարավոր է ձեռք բերել ցուցիչներ, որոնք ուղղակիորեն արտացոլում են փորձի ժամանակ կատարված չափումների արդյունքները։ Ըստ այդմ, առաջնային վիճակագրական ցուցանիշներ են նրանք, որոնք օգտագործվում են հենց հոգեախտորոշիչ մեթոդներում և հանդիսանում են հոգեախտորոշման արդյունքների նախնական վիճակագրական մշակման արդյունք: Երկրորդական մեթոդները կոչվում են վիճակագրական մշակում, որի օգնությամբ առաջնային տվյալների հիման վրա բացահայտվում են դրանցում թաքնված վիճակագրական օրինաչափությունները։

Վիճակագրական մշակման առաջնային մեթոդները ներառում են, օրինակ, ընտրանքի միջինի որոշումը, ընտրանքի շեղումը, ընտրանքի ռեժիմը և ընտրանքի միջինը: Երկրորդական մեթոդները սովորաբար ներառում են հարաբերակցության վերլուծություն, ռեգրեսիոն վերլուծություն, երկու կամ ավելի նմուշներում առաջնային վիճակագրության համեմատման մեթոդներ:

Դիտարկենք տարրական մաթեմատիկական վիճակագրության հաշվարկման մեթոդները:

Նորաձևությունկոչվում է ուսումնասիրվող հատկանիշի քանակական արժեք, որն առավել տարածված է ընտրանքում:

միջինկոչվում է ուսումնասիրվող հատկանիշի արժեքը, որը բաժանում է նմուշը, որը դասավորված է այս հատկանիշի արժեքով, կիսով չափ:

նմուշի միջին(միջին թվաբանական) արժեքը՝ որպես վիճակագրական ցուցանիշ, փորձի ընթացքում ուսումնասիրված հոգեբանական որակի միջին գնահատումն է։

ցրվել(երբեմն այս արժեքը կոչվում է միջակայք) նմուշը նշվում է R տառով: Սա ամենապարզ ցուցիչն է, որը կարելի է ձեռք բերել նմուշի համար՝ այս տատանումների շարքի առավելագույն և նվազագույն արժեքների տարբերությունը: .

Ցրվածությունփոփոխականի արժեքների շեղումների քառակուսիների միջին թվաբանական միջին արժեքն է:

2. Փորձարարական արդյունքների երկրորդային վիճակագրական մշակման մեթոդներ

Փորձարարական տվյալների վիճակագրական մշակման երկրորդական մեթոդների օգնությամբ ուղղակիորեն ստուգվում, ապացուցվում կամ հերքվում են փորձի հետ կապված վարկածները։ Այս մեթոդները, որպես կանոն, ավելի բարդ են, քան նախնական վիճակագրական մշակման մեթոդները, և հետազոտողից պահանջում են լավ պատրաստված լինել տարրական մաթեմատիկայի և վիճակագրության մեջ:

Քննարկված մեթոդների խումբը կարելի է բաժանել մի քանի ենթախմբերի.

1 ռեգրեսիայի հաշվարկ

Ռեգրեսիոն հաշվարկը մաթեմատիկական վիճակագրության մեթոդ է, որը թույլ է տալիս նվազեցնել մասնավոր, անհամաչափ տվյալները որոշակի գծային գրաֆիկի, որը մոտավորապես արտացոլում է նրանց ներքին հարաբերությունները և կարողանալ մոտավորապես գնահատել մեկ այլ փոփոխականի հավանական արժեքը փոփոխականներից մեկի արժեքով: .

2. Հարաբերակցություն

Երկրորդային վիճակագրական մշակման հաջորդ մեթոդը, որի միջոցով պարզվում է փորձարարական տվյալների երկու շարքի կապը կամ ուղղակի կախվածությունը, կոչվում է հարաբերակցության մեթոդ։ Այն ցույց է տալիս, թե ինչպես է մի երեւույթը ազդում մյուսի վրա կամ կապված է դրա հետ իր դինամիկայով: Այս տեսակի կախվածություններ կան, օրինակ, մեծությունների միջև, որոնք միմյանց հետ պատճառահետևանքային կապի մեջ են: Եթե պարզվի, որ երկու երևույթ վիճակագրորեն էականորեն փոխկապակցված են միմյանց հետ, և եթե միևնույն ժամանակ վստահություն կա, որ դրանցից մեկը կարող է հանդես գալ որպես մյուս երևույթի պատճառ, ապա միանշանակ հետևում է, որ դրանց միջև կա պատճառահետևանքային կապ. .

3 Գործոնային վերլուծություն

Գործոնային վերլուծությունը վիճակագրական մեթոդ է, որն օգտագործվում է մեծ քանակությամբ փորձարարական տվյալների մշակման ժամանակ։ Գործոնային վերլուծության խնդիրներն են՝ փոփոխականների քանակի կրճատում (տվյալների կրճատում) և փոփոխականների միջև հարաբերությունների կառուցվածքի որոշումը, այսինքն. փոփոխականների դասակարգում, ուստի գործոնային վերլուծությունը օգտագործվում է որպես տվյալների կրճատման մեթոդ կամ որպես կառուցվածքային դասակարգման մեթոդ:

Վերանայեք հարցերը

1. Որոնք են վիճակագրական մշակման մեթոդները:

2. Ի՞նչ ենթախմբերի են բաժանվում վիճակագրական մշակման երկրորդական մեթոդները.

3. Բացատրե՛ք հարաբերակցության մեթոդի էությունը:

4. Ո՞ր դեպքերում են կիրառվում վիճակագրական մշակման մեթոդները:

5. Ձեր կարծիքով, որքանո՞վ է արդյունավետ վիճակագրական մշակման մեթոդների կիրառումը գիտական հետազոտություններում։

2. Դիտարկենք վիճակագրական տվյալների մշակման մեթոդների առանձնահատկությունները:

գրականություն

1.. Գորբատով Դ.Ս. Հոգեբանական հետազոտությունների սեմինար. Պրոց. նպաստ. - Սամարա. «ԲԱՀՐԱԽ - Մ», 2003. - 272 էջ.

2. Էրմոլաև Ա.Յու. Մաթեմատիկական վիճակագրություն հոգեբանների համար. - Մ.: Մոսկվայի հոգեբանական և սոցիալական ինստիտուտ: Ֆլինտ, 2003.336s.

3. Կորնիլովա Տ.Վ. Ներածություն հոգեբանական փորձին. Դասագիրք բուհերի համար. Մ.: CheRo հրատարակչություն, 2001 թ.