هدف از پردازش داده های آماری. پردازش داده های آماری اولیه اهداف اصلی مطالعه عناصر آمار

روش های پردازش آماری نتایج آزمایش روش های ریاضی، فرمول ها، روش های محاسبات کمی است که با کمک آنها می توان شاخص های به دست آمده در طول آزمایش را تعمیم داد، وارد سیستم کرد و الگوهای پنهان در آنها را آشکار کرد.

ما در مورد چنین قانونمندی هایی با ماهیت آماری صحبت می کنیم که بین متغیرهای مورد مطالعه در آزمایش وجود دارد.

داده ها عناصر اصلی هستند که به منظور پردازش طبقه بندی یا طبقه بندی می شوند 26 .

برخی از روش های تجزیه و تحلیل ریاضی و آماری محاسبه به اصطلاح آمار ریاضی ابتدایی را که توزیع نمونه داده ها را مشخص می کند، ممکن می سازد، به عنوان مثال:

میانگین نمونه،

واریانس نمونه،

مدین و دیگران.

سایر روش های آمار ریاضی قضاوت در مورد پویایی تغییرات در آمار نمونه های فردی را ممکن می سازد، به عنوان مثال:

تجزیه و تحلیل پراکندگی،

تجزیه و تحلیل رگرسیون.

با استفاده از روش‌های نمونه‌گیری گروه سوم، می‌توان روابط آماری موجود بین متغیرهایی را که در این آزمایش مورد بررسی قرار می‌گیرند، به طور قابل اعتماد قضاوت کرد:

تجزیه و تحلیل همبستگی؛

تحلیل عاملی؛

روش های مقایسه

تمام روش های تحلیل ریاضی-آماری به طور متعارف به اولیه و ثانویه تقسیم می شوند 27 .

روش ها اولیه نامیده می شوند که با کمک آنها می توان شاخص هایی را به دست آورد که مستقیماً نتایج اندازه گیری های انجام شده در آزمایش را منعکس می کند.

روش های ثانویه را پردازش آماری می نامند که به کمک آن بر اساس داده های اولیه، الگوهای آماری نهفته در آنها آشکار می شود.

روش های پردازش آماری اولیه به عنوان مثال عبارتند از:

تعیین میانگین نمونه؛

واریانس نمونه؛

مد انتخابی؛

میانه نمونه

روش های ثانویه معمولاً عبارتند از:

تجزیه و تحلیل همبستگی؛

تجزیه و تحلیل رگرسیون؛

روش های مقایسه آمار اولیه برای دو یا چند نمونه.

بیایید روش هایی را برای محاسبه آمار ریاضی ابتدایی، با میانگین نمونه در نظر بگیریم.

میانگین حسابی - نسبت مجموع تمام مقادیر داده ها به تعداد عبارت 28 است.

مقدار متوسط به عنوان یک شاخص آماری، میانگین ارزیابی کیفیت روانشناختی مورد مطالعه در آزمایش است.

این ارزیابی میزان رشد آن را به عنوان یک کل در گروهی از افراد که تحت یک معاینه تشخیصی روانی قرار گرفتند مشخص می کند. با مقایسه مستقیم مقادیر میانگین دو یا چند نمونه، می‌توان میزان نسبی توسعه را در افرادی که این نمونه‌ها را تشکیل می‌دهند از کیفیت مورد ارزیابی قضاوت کرد.

میانگین نمونه با استفاده از فرمول 29 زیر تعیین می شود:

که در آن x cf میانگین نمونه یا میانگین حسابی نمونه است.

n - تعداد افراد در نمونه یا شاخص های تشخیص روانی خصوصی که بر اساس آنها مقدار متوسط محاسبه می شود.

x k - مقادیر خصوصی شاخص ها برای افراد فردی. n چنین شاخص وجود دارد، بنابراین شاخص k این متغیر مقادیری از 1 تا n را می گیرد.

∑ - پذیرفته شده در ریاضیات، علامت جمع مقادیر آن دسته از متغیرهایی است که در سمت راست این علامت قرار دارند.

پراکندگی اندازه گیری پراکندگی داده ها در مورد مقدار میانگین 30 است.

هر چه واریانس بیشتر باشد، واریانس یا پراکندگی در داده ها بیشتر است. به این منظور تعیین می شود که بتوان مقادیری را که دارای میانگین یکسان، اما پراکندگی متفاوت هستند، از یکدیگر متمایز کرد.

پراکندگی با فرمول زیر تعیین می شود:

واریانس نمونه یا به سادگی واریانس کجاست.

عبارتی به این معنی که برای تمام x k از اول تا آخر در این نمونه، لازم است تفاوت بین مقادیر خصوصی و میانگین محاسبه شود، این تفاوت ها مربع و جمع شوند.

n تعداد افراد در نمونه یا مقادیر اولیه است که واریانس برای آنها محاسبه می شود.

میانه مقدار صفت مورد مطالعه نامیده می شود که نمونه را به ترتیب مقدار این صفت به نصف تقسیم می کند.

دانستن میانه برای تعیین اینکه آیا توزیع مقادیر خاص صفت مورد مطالعه متقارن است و به توزیع به اصطلاح نرمال نزدیک می شود مفید است. میانگین و میانه برای یک توزیع نرمال معمولاً یکسان هستند یا تفاوت بسیار کمی با یکدیگر دارند.

اگر توزیع نمونه ویژگی ها نرمال باشد، می توان از روش های محاسبه آماری ثانویه بر اساس توزیع نرمال داده ها برای آن استفاده کرد. در غیر این صورت، این نمی تواند انجام شود، زیرا اشتباهات جدی می توانند در محاسبات رخنه کنند.

روش یکی دیگر از آمارهای ریاضی ابتدایی و ویژگی توزیع داده های تجربی. حالت مقدار کمی صفت مورد مطالعه است که اغلب در نمونه یافت می شود.

برای توزیع ویژگی متقارن، از جمله توزیع نرمال، مقادیر حالت با مقادیر میانگین و میانه منطبق است. برای انواع دیگر توزیع ها، نامتقارن، این معمول نیست.

روش پردازش آماری ثانویه که از طریق آن رابطه یا رابطه مستقیم بین دو سری داده های تجربی مشخص می شود، نامیده می شود. روش تحلیل همبستگی این نشان می دهد که چگونه یک پدیده بر دیگری تأثیر می گذارد یا در پویایی آن با آن مرتبط است. وابستگی هایی از این دست، به عنوان مثال، بین کمیت هایی که در روابط علی با یکدیگر هستند وجود دارد. اگر معلوم شود که دو پدیده از نظر آماری به طور معناداری با یکدیگر همبستگی دارند و در عین حال این اطمینان وجود دارد که یکی از آنها می تواند به عنوان عامل پدیده دیگر عمل کند، قطعاً نتیجه می شود که بین آنها رابطه علّی وجود دارد. .

انواع مختلفی از این روش وجود دارد:

تحلیل همبستگی خطی به شما این امکان را می دهد که پیوندهای مستقیمی بین متغیرها در مقادیر مطلق آنها ایجاد کنید. این اتصالات به صورت گرافیکی با یک خط مستقیم بیان می شوند، از این رو به آن "خطی" می گویند.

ضریب همبستگی خطی با استفاده از فرمول 31 زیر تعیین می شود:

جایی که r xy - ضریب همبستگی خطی;

x، y -مقادیر متوسط نمونه مقادیر مقایسه شده؛

ایکس من ، y من - مقادیر نمونه خصوصی مقادیر مقایسه شده؛

پ -تعداد کل مقادیر در سری مقایسه شده از شاخص ها؛

پراکندگی، انحراف مقادیر مقایسه شده از مقادیر متوسط.

همبستگی رتبه وابستگی را نه بین مقادیر مطلق متغیرها، بلکه بین مکان های ترتیبی یا رتبه هایی که توسط آنها در یک سری مرتب شده بر اساس بزرگی اشغال شده است تعیین می کند. فرمول ضریب همبستگی رتبه 32 است:

که در آن Rs - ضریب همبستگی رتبه طبق اسپیرمن.

د من - تفاوت بین رتبه های شاخص های موضوعات مشابه در ردیف های مرتب شده؛

پ -تعداد موضوعات یا داده های دیجیتال (رتبه ها) در سری های همبسته.

1. ابزارهای پردازش داده های آماری در اکسل

2. استفاده از توابع خاص

3. با استفاده از ابزار ANALYSIS PACKAGE

ادبیات:

اصلی:

1. برک. تجزیه و تحلیل داده ها با مایکروسافت اکسل. : مطابق. از انگلیسی / برک، کنت، کری، پاتریک. - M .: انتشارات "ویلیام"، 2005. - S. 216 - 256.

2. Mishin A.V. فناوری اطلاعاتدر فعالیت حقوقی: کارگاه / A.V. میشین. – M.: RAP, 2013. – S. 2-11.

اضافی:

3. انفورماتیک برای حقوقدانان و اقتصاددانان: کتاب درسی برای دانشگاه ها / ویرایش. S.V. سیمونوویچ - سنت پترزبورگ: پیتر، 2004. - S. 498-516.

تمرین شماره 30

موضوع شماره 11.1. نگهداری پایگاه داده در Access DBMS

درس با روش پروژه انجام می شود.

هدف پروژه: ایجاد پایگاه داده در مورد کار دادگاه.

وظیفه فنی:

1. یک پایگاه داده «دادگاه» از دو جدول «قضات» و «ادعای» به ترتیب با ساختار زیر ایجاد کنید:

جدول "داوران"

نام زمینه	کد داور	نام و نام خانوادگی	روزهای پذیرایی	ساعات کاری	تجربه کاری
نوع داده	عددی	متن	متن	متن	عددی

اندازه میدان	عدد صحیح بلند				عدد صحیح بلند
فرمت فیلد	پایه ای				پایه ای
تعداد ارقام اعشار
مقدار پیش فرض			"چهارشنبه"	"15:00 الی 17:00"
شرط ارزش	>36200 و<36299		دوشنبه یا سه شنبه یا چهارشنبه یا پنجشنبه یا جمعه		> 0 و<40
پیغام خطا			مقادیر معتبر Mon، Tue، Wed، Thu یا Friday هستند. دوباره تایپ کن	!	مقادیر معتبر از 1 تا 39 هستند. لطفاً دوباره امتحان کنید!
زمینه اجباری	آره	آره	خیر	خیر	خیر
فیلد نمایه شده		خیر	خیر	خیر	خیر

توجه داشته باشید. فیلد کلیدی "کد قاضی" را اعلام کنید.

جدول "ادعاها"

نام زمینه	تعداد مورد	شاکی	جواب چیک	کد داور	تاریخ جلسه
نوع داده	عددی	متن	متن	عددی	زمان قرار
مشخصات فیلد: برگه عمومی
اندازه میدان	عدد صحیح بلند			عدد صحیح بلند	فرمت تاریخ کامل
فرمت فیلد	پایه ای
تعداد ارقام اعشار
مقدار پیش فرض
شرط ارزش	> 0 و<99999			>36200 و<36299
پیغام خطا	ورودی اشتباه است - دوباره امتحان کنید!			مقادیر معتبر از 36201 تا 36298 هستند. لطفاً دوباره امتحان کنید!
زمینه اجباری	آره	خیر	خیر	خیر	خیر
فیلد نمایه شده	بله (هیچ مسابقه مجاز نیست)	خیر	خیر	بله (تصادف مجاز است)	خیر

2. در جدول Judges رکوردهای داده زیر را وارد کنید:

در جدول ادعاها، رکوردهای داده زیر را وارد کنید:

3. از فیلد «کد داور» برای ایجاد رابطه «یک به چند» بین جداول استفاده کنید. قضاتو دعاوی حقوقی. در همان زمان، "اطمینان از یکپارچگی داده ها" و "به روز رسانی آبشاری فیلدهای مرتبط" را تنظیم کنید.

ادبیات:

اصلی:

1. Mishin A.V. فناوری اطلاعات در فعالیت حرفه ای: راهنمای مطالعه / A.V. میشین، ال.ای. میستروف، دی.و. کارتاوتسف. - M.: RAP، 2011. - S. 259-264.

اضافی:

تمرین شماره 31

موضوع شماره 11.2. اصول ایجاد فرم ها و پرس و جوها در Access DBMS

1. توسعه فرم های ورودی برای ورود داده ها.

2. روش انجام محاسبات و تجزیه و تحلیل داده های وارد شده.

ادبیات:

اصلی:

1. Mishin A.V. فناوری اطلاعات در فعالیت حرفه ای: راهنمای مطالعه / A.V. میشین، ال.ای. میستروف، دی.و. کارتاوتسف. - M.: RAP، 2011. - S. 265-271.

اضافی:

2. انفورماتیک و فناوری اطلاعات: کتاب درسی برای دانشجویان دانشگاه / I.G. Lesnichaya، I.V. گم شده، یو.د. رومانوا، V.I. شستاکوف - ویرایش دوم - م.: اکسمو، 2006. - 544 ص.

3. Mikheeva E.V. فناوری اطلاعات در فعالیت حرفه ای: کتاب درسی برای دانش آموزان مدارس متوسطه حرفه ای / E.V. میخیف. - چاپ دوم، پاک شد. - م.: فرهنگستان، 2005. - 384 ص.

کار آزمایشگاهی شماره 3. پردازش داده های آماری در سیستم MatLab

بیان کلی مشکل

هدف اصلی کار آزمایشگاهی آشنایی با مبانی کار با پردازش داده های آماری در محیط MatLAB می باشد.

بخش تئوری

پردازش داده های آماری اولیه

پردازش آماری داده ها بر اساس روش های کمی اولیه و ثانویه است. هدف از پردازش اولیه داده های آماری، ساختار دادن به اطلاعات دریافتی است، که مستلزم گروه بندی داده ها در جداول محوری بر اساس پارامترهای مختلف است. داده های خام باید به گونه ای ارائه شوند که فرد بتواند ارزیابی تقریبی از مجموعه داده های دریافتی انجام دهد و اطلاعاتی را در مورد توزیع داده های نمونه داده های دریافتی، به عنوان مثال، همگن یا فشرده بودن داده ها، آشکار کند. پس از تجزیه و تحلیل داده های اولیه، روش های پردازش داده های آماری ثانویه اعمال می شود که بر اساس آن الگوهای آماری در مجموعه داده های موجود تعیین می شوند.

انجام یک تجزیه و تحلیل آماری اولیه روی یک آرایه داده به شما امکان می دهد در مورد موارد زیر دانش کسب کنید:

معمولی ترین مقدار برای نمونه چیست؟ برای پاسخ به این سوال، معیارهای گرایش مرکزی تعیین می شود.

آیا پراکندگی زیادی از داده ها نسبت به این مقدار مشخصه وجود دارد، به عنوان مثال، "فازی" داده ها چیست؟ در این مورد، معیارهای تغییرپذیری تعیین می شود.

شایان ذکر است که شاخص های آماری اندازه گیری گرایش و تنوع مرکزی تنها بر اساس داده های کمی تعیین می شود.

اقدامات گرایش مرکزی- گروهی از مقادیر که بقیه داده ها حول آنها گروه بندی می شوند. بنابراین، معیارهای گرایش مرکزی آرایه داده ها را تعمیم می دهد، که نتیجه گیری را هم در مورد نمونه به عنوان یک کل و هم انجام یک تجزیه و تحلیل مقایسه ای ممکن می کند. نمونه های مختلف با یکدیگر

فرض کنید یک نمونه داده وجود دارد، سپس معیارهای گرایش مرکزی با شاخص های زیر برآورد می شوند:

1. میانگین نمونهحاصل تقسیم مجموع مقادیر نمونه بر تعداد آنها است که با فرمول (3.1) تعیین می شود.

(3.1)

جایی که - منعنصر نمونه -ام

nتعداد عناصر نمونه است.

میانگین نمونه بیشترین دقت را در فرآیند تخمین روند مرکزی ارائه می دهد.

2. میانه- یک مقدار بالا و پایین تولید می کند که تعداد مقادیر مختلف یکسان است، یعنی این مقدار مرکزی در یک سری داده های متوالی است. با استفاده از فرمول (3.2) یا (3.3) بسته به یکنواختی / عجیب بودن تعداد عناصر در نمونه تعیین می شود. الگوریتم تخمین میانه برای یک نمونه داده:

اول از همه، داده ها به ترتیب صعودی/نزولی رتبه بندی می شوند.

اگر نمونه مرتب شده دارای تعداد فرد عنصر باشد، میانه همان مقدار مرکزی است.

(3.2)

جایی که n

در مورد تعداد زوج از عناصر، میانه به عنوان میانگین حسابی دو مقدار مرکزی تعریف می شود.

(3.3)

میانگین عنصر نمونه سفارش داده شده کجاست.

- عنصر انتخاب سفارشی زیر

تعداد عناصر نمونه

در صورتی که همه عناصر نمونه متفاوت باشند، دقیقاً نیمی از عناصر نمونه بزرگتر از میانه و نیمی دیگر کمتر هستند. به عنوان مثال، برای نمونه (1، 5، 9، 15، 16)، میانه همان عنصر 9 است.

در تجزیه و تحلیل داده های آماری، میانه به شما امکان می دهد عناصر نمونه را که به شدت بر مقدار میانگین نمونه تأثیر می گذارد، شناسایی کنید.

فرض کنید یک نمونه 20 نفره داریم. عناصر نمونه اطلاعاتی در مورد میانگین درآمد ماهانه هر فرد است. فرض کنید 19 نفر میانگین درآمد ماهانه 20 هزار نفر دارند. و 1 نفر با درآمد 300 تر. کل درآمد ماهانه کل نمونه 680 ترون است. میانه، پس از سفارش نمونه، به عنوان میانگین حسابی عناصر دهم و یازدهم نمونه تعریف می شود) و برابر Me = 20 tr است. این نتیجه به شرح زیر تفسیر می شود: میانه نمونه را به دو گروه تقسیم می کند، به طوری که می توان نتیجه گرفت که در گروه اول، هر فرد میانگین درآمد ماهانه بیش از 20 هزار روبل ندارد و در گروه دوم، هیچ درآمدی ندارد. کمتر از 20 هزار روبل. R. در این مثال، می‌توان گفت که میانگین با میزان درآمد فرد «متوسط» مشخص می‌شود. در حالی که مقدار میانگین نمونه به طور قابل توجهی بالاتر از S=34 است که نشان دهنده غیرقابل قبول بودن این ویژگی در ارزیابی میانگین سود است.

بنابراین، هرچه تفاوت بین میانگین و میانگین نمونه بیشتر باشد، پراکندگی داده‌های نمونه بیشتر است (در مثال مورد بررسی، فردی با درآمد 300 تریلیون به وضوح با میانگین افراد در یک نمونه خاص متفاوت است و دارای تأثیر قابل توجهی بر برآورد درآمد متوسط). اینکه با چنین عناصری چه باید کرد در هر مورد جداگانه تصمیم گیری می شود. اما در حالت کلی، برای اطمینان از قابلیت اطمینان نمونه، از آنجایی که تأثیر زیادی بر ارزیابی شاخص های آماری دارند، آنها حذف می شوند.

3. مد (Mo)- مقداری را تولید می کند که بیشتر در نمونه رخ می دهد، یعنی مقداری با بالاترین فرکانس. الگوریتم تخمین حالت:

در صورتی که نمونه حاوی عناصری باشد که به طور مساوی رخ می دهند، می گوییم که در چنین نمونه ای حالتی وجود ندارد.

اگر دو سطل مجاور فرکانس یکسانی داشته باشند که از فرکانس سایر بن‌ها بیشتر است، حالت به عنوان میانگین دو مقدار تعریف می‌شود.

اگر دو عنصر نمونه فرکانس یکسانی داشته باشند که از فرکانس عناصر باقیمانده نمونه بیشتر است و در عین حال این عناصر مجاور هم نباشند، می گوییم در این نمونه دو حالت وجود دارد.

حالت در تجزیه و تحلیل آماری در شرایطی استفاده می شود که نیاز به تخمین سریع معیار گرایش مرکزی است و دقت بالایی لازم نیست. به عنوان مثال، مد (از نظر اندازه یا مارک) برای تعیین لباس و کفشی که بیشترین تقاضا را در بین خریداران دارند، مناسب است.

اندازه گیری های پراکندگی (تغییرپذیری)- گروهی از شاخص های آماری که تفاوت بین مقادیر فردی نمونه را مشخص می کند. بر اساس شاخص های اندازه گیری پراکندگی، می توان میزان همگنی و فشردگی عناصر نمونه را ارزیابی کرد. معیارهای پراکندگی با مجموعه شاخص های زیر مشخص می شوند:

1. کشیدن انگشت -این فاصله بین حداکثر و حداقل مقادیر نتایج مشاهدات (عناصر نمونه) است. نشانگر محدوده، گسترش مقادیر در یک مجموعه داده را نشان می دهد. اگر محدوده بزرگ باشد، مقادیر در جمعیت بسیار پراکنده است، در غیر این صورت (محدوده کوچک است)، گفته می شود که مقادیر در جمعیت نزدیک به یکدیگر قرار دارند. محدوده با فرمول (3.4) تعیین می شود.

(3.4)

جایی که - حداکثر عنصر نمونه؛

حداقل عنصر نمونه است.

2.انحراف متوسطاختلاف میانگین حسابی (در مقدار مطلق) بین هر مقدار در نمونه و میانگین نمونه آن است. میانگین انحراف با فرمول (3.5) تعیین می شود.

(3.5)

جایی که - منعنصر نمونه -ام

مقدار میانگین نمونه، با فرمول (3.1) محاسبه می شود.

تعداد عناصر نمونه

مدول با توجه به اینکه انحراف از میانگین برای هر عنصر خاص می تواند مثبت و منفی باشد ضروری است. بنابراین، اگر مدول گرفته نشود، مجموع همه انحرافات نزدیک به صفر خواهد بود و قضاوت در مورد درجه تغییرپذیری داده ها (تراکم داده ها حول میانگین نمونه) غیرممکن خواهد بود. در تجزیه و تحلیل آماری، حالت و میانه ممکن است به جای میانگین نمونه گرفته شود.

3. پراکندگیاندازه گیری پراکندگی است که انحراف نسبی بین مقادیر داده و میانگین را توصیف می کند. به عنوان مجموع انحرافات مجذور هر عنصر نمونه از مقدار میانگین محاسبه می شود. بسته به حجم نمونه، واریانس به روش های مختلفی برآورد می شود:

برای نمونه های بزرگ (n>30) طبق فرمول (3.6)

(3.6)

برای نمونه های کوچک (n<30) по формуле (3.7)

(3.7)

که در آن X i - i-امین عنصر نمونه؛

S مقدار میانگین نمونه است.

تعداد عناصر نمونه؛

(X i – S) - انحراف از مقدار میانگین برای هر مقدار مجموعه داده.

4. انحراف معیارمعیاری است که نشان می دهد نقاط داده نسبت به میانگین آنها چقدر پراکنده هستند.

فرآیند تربیع انحرافات فردی در محاسبه واریانس، درجه انحراف مقدار انحراف به دست آمده را از انحرافات اصلی افزایش می دهد که به نوبه خود خطاهای اضافی را ایجاد می کند. بنابراین، به منظور تقریب تخمین پراکندگی نقاط داده در مورد میانگین آنها به مقدار میانگین انحراف، ریشه دوم از واریانس استخراج می شود. ریشه استخراج شده از واریانس معیاری از تغییرپذیری به نام ریشه میانگین مربع یا انحراف استاندارد را مشخص می کند (3.8).

(3.8)

فرض کنید شما یک مدیر پروژه توسعه نرم افزار هستید. شما پنج برنامه نویس زیر نظر خود دارید. با مدیریت فرآیند اجرای پروژه، وظایف را بین برنامه نویسان توزیع می کنید. برای سادگی مثال، از این واقعیت که وظایف از نظر پیچیدگی و زمان اجرا معادل هستند، عمل می کنیم. شما تصمیم گرفتید کار هر برنامه نویس (تعداد کارهای تکمیل شده در طول هفته) را برای 10 هفته گذشته تجزیه و تحلیل کنید که در نتیجه نمونه های زیر را دریافت کردید:

نام هفته

پس از ارزیابی میانگین تعداد کارهای انجام شده، نتیجه زیر را دریافت کردید:

نام هفته											اس
											22,3
											22,4
											22,2
											22,1
											22,5

بر اساس شاخص S، همه برنامه نویسان به طور متوسط با کارایی یکسان (حدود 22 کار در هفته) کار می کنند. با این حال، شاخص تغییرپذیری (محدوده) بسیار بالا است (از 5 کار برای برنامه نویس چهارم تا 24 کار برای برنامه نویس پنجم).

نام هفته	اس	پ
	22,3
	22,4
	22,2
	22,1
	22,5

بیایید انحراف استاندارد را تخمین بزنیم، که نشان می‌دهد که چگونه مقادیر در نمونه‌ها نسبت به میانگین توزیع می‌شوند، یعنی در مورد ما، تخمین می‌زنیم که گسترش تکمیل کار از هفته به هفته چقدر است.

نام هفته	اس	پ	بنابراین
	22,3		1,56
	22,4		1,8
	22,2		2,84
	22,1		1,3
	22,5		5,3

تخمین حاصل از انحراف استاندارد موارد زیر را می گوید (بیایید دو برنامه نویس 4 و 5 حالت شدید را ارزیابی کنیم):

هر مقدار در نمونه 4 برنامه نویس به طور متوسط 1.3 شغل از میانگین انحراف دارد.

هر مقدار در نمونه برنامه نویس 5 به طور متوسط 5.3 شغل از میانگین انحراف دارد.

هرچه انحراف استاندارد به 0 نزدیکتر باشد، میانگین قابل اعتمادتر است، زیرا نشان می دهد که هر مقدار در نمونه تقریباً برابر با میانگین است (22.5 مورد در مثال ما). بنابراین، برنامه نویس 4 در مقابل برنامه نویس 5، سازگارترین است. متغیر هفته به هفته تکمیل کار برای برنامه نویس پنجم 5.3 وظیفه است که نشان دهنده گسترش قابل توجه است. در مورد برنامه نویس پنجم نمی توان به میانگین اعتماد کرد و بنابراین پیش بینی تعداد کارهای انجام شده برای هفته آینده دشوار است که به نوبه خود برنامه ریزی و رعایت برنامه های کاری را دشوار می کند. اینکه در این دوره چه تصمیمی مدیریتی می گیرید اهمیتی ندارد. این مهم است که شما یک ارزیابی دریافت کنید که بر اساس آن تصمیمات مدیریتی مناسب اتخاذ شود.

بنابراین، می توان یک نتیجه کلی گرفت که میانگین همیشه داده ها را به درستی تخمین نمی زند. صحت برآورد میانگین را می توان با مقدار انحراف معیار قضاوت کرد.

سخنرانی 12. روشهای پردازش آماری نتایج.

روش های پردازش آماری نتایج، تکنیک های ریاضی، فرمول ها، روش های محاسبات کمی نامیده می شوند که با کمک آنها می توان شاخص های به دست آمده در طول آزمایش را تعمیم داد، به یک سیستم آورد و الگوهای پنهان در آنها را آشکار کرد. ما در مورد چنین قانونمندی هایی با ماهیت آماری صحبت می کنیم که بین متغیرهای مورد مطالعه در آزمایش وجود دارد.

1. روش های پردازش آماری اولیه نتایج تجربی

تمام روش های تجزیه و تحلیل ریاضی و آماری به طور مشروط به اولیه و ثانویه تقسیم می شوند. روش ها اولیه نامیده می شوند که با کمک آنها می توان شاخص هایی را به دست آورد که مستقیماً نتایج اندازه گیری های انجام شده در آزمایش را منعکس می کند. بر این اساس، شاخص‌های آماری اولیه به آن‌هایی گفته می‌شود که در خود روش‌های تشخیصی روان‌شناختی مورد استفاده قرار می‌گیرند و حاصل پردازش آماری اولیه نتایج تشخیص روان‌شناختی هستند. روش های ثانویه را پردازش آماری می نامند که به کمک آن بر اساس داده های اولیه، الگوهای آماری نهفته در آنها آشکار می شود.

روش‌های پردازش آماری اولیه شامل تعیین میانگین نمونه، واریانس نمونه، حالت نمونه و میانه نمونه است. روش‌های ثانویه معمولاً شامل تحلیل همبستگی، تحلیل رگرسیون، روش‌های مقایسه آمار اولیه در دو یا چند نمونه است.

روش هایی را برای محاسبه آمار ریاضی ابتدایی در نظر بگیرید.

روشبه نام مقدار کمی صفت مورد مطالعه، رایج ترین در نمونه.

میانهمقدار صفت مورد مطالعه نامیده می شود که نمونه را به ترتیب مقدار این صفت به نصف تقسیم می کند.

میانگین نمونهمقدار (میانگین حسابی) به عنوان یک شاخص آماری، میانگین ارزیابی کیفیت روانشناختی مورد مطالعه در آزمایش است.

پراکنده کردن(گاهی اوقات این مقدار محدوده نامیده می شود) نمونه با حرف R نشان داده می شود. این ساده ترین شاخصی است که می توان برای نمونه به دست آورد - تفاوت بین حداکثر و حداقل مقادیر این سری تغییرات خاص. .

پراکندگیمیانگین حسابی مجذور انحراف مقادیر یک متغیر از مقدار میانگین آن است.

2. روش های پردازش آماری ثانویه نتایج تجربی

با کمک روش های ثانویه پردازش آماری داده های تجربی، فرضیه های مربوط به آزمایش مستقیماً تأیید، اثبات یا رد می شوند. این روش‌ها معمولاً پیچیده‌تر از روش‌های پردازش آماری اولیه هستند و محقق را ملزم می‌کند که در ریاضیات و آمار ابتدایی به خوبی آموزش ببیند.

گروه روش های مورد بحث را می توان به چند زیر گروه تقسیم کرد:

1 حساب رگرسیون

حساب رگرسیون روشی از آمار ریاضی است که به شما امکان می دهد داده های خصوصی و نامتجانس را به یک نمودار خطی مشخص که تقریباً رابطه داخلی آنها را منعکس می کند کاهش دهید و بتوانید مقدار احتمالی متغیر دیگری را با مقدار یکی از متغیرها تقریباً تخمین بزنید. .

2. همبستگی

روش بعدی پردازش آماری ثانویه که به وسیله آن ارتباط یا وابستگی مستقیم بین دو سری داده های تجربی مشخص می شود، روش همبستگی نامیده می شود. این نشان می دهد که چگونه یک پدیده بر دیگری تأثیر می گذارد یا در پویایی آن با آن مرتبط است. وابستگی هایی از این دست، به عنوان مثال، بین کمیت هایی که در روابط علی با یکدیگر هستند وجود دارد. اگر معلوم شود که دو پدیده از نظر آماری به طور معناداری با یکدیگر همبستگی دارند و در عین حال این اطمینان وجود دارد که یکی از آنها می تواند به عنوان عامل پدیده دیگر عمل کند، قطعاً نتیجه می شود که بین آنها رابطه علّی وجود دارد. .

3 تحلیل عاملی

تحلیل عاملی یک روش آماری است که هنگام پردازش مقادیر زیادی از داده های تجربی استفاده می شود. وظایف تحلیل عاملی عبارتند از: کاهش تعداد متغیرها (کاهش داده ها) و تعیین ساختار روابط بین متغیرها، یعنی. طبقه بندی متغیرها، بنابراین تحلیل عاملی به عنوان روش کاهش داده ها یا به عنوان روش طبقه بندی ساختاری استفاده می شود.

سوالات را مرور کنید

1. روش های پردازش آماری چیست؟

2. روش های فرعی پردازش آماری به چه زیر گروه هایی تقسیم می شوند؟

3. ماهیت روش همبستگی را توضیح دهید؟

4. روش های پردازش آماری در چه مواردی استفاده می شود؟

5. به نظر شما استفاده از روش های پردازش آماری در تحقیقات علمی چقدر موثر است؟

2. ویژگی های روش های پردازش داده های آماری را در نظر بگیرید.

ادبیات

1.. گورباتوف D.S. کارگاه تحقیقات روانشناختی: Proc. کمک هزینه - سامارا: «بحراخ - م»، 1382. - 272 ص.

2. Ermolaev A.Yu. آمار ریاضی برای روانشناسان. - M.: موسسه روانشناسی و اجتماعی مسکو: فلینت، 2003.336s.

3. Kornilova T.V. مقدمه ای بر آزمایش روانشناسی کتاب درسی برای دانشگاه ها. M.: انتشارات CheRo، 2001.