significance test procedure to decide if a null hypothesis (1.41) is to be rejected in favour of an alternative hypothesis (1.42) EXAMPLE 1 As an example, if an actual, continuous random variable (2.29) can take values between −∞ and +∞ and one has a suspicion that the true probability distribution is not a normal distribution (2.50), then the hypotheses will be formulated, as follows. ⎯ The scope of the situation is all continuous probability distributions (2.23), which can take values between −∞ and +∞. ⎯ The conjecture is that the true probability distribution is not a normal distribution. ⎯ The null hypothesis is that the probability distribution is a normal distribution. ⎯ The alternative hypothesis is that the probability distribution is not a normal distribution. EXAMPLE 2 If the random variable follows a normal distribution with known standard deviation (2.37) and one suspects that its expectation value µ deviates from a given value µ0, then the hypotheses will be formulated according to Case 3 in the next example. EXAMPLE 3 This example considers three possibilities in statistical testing. Case 1. It is conjectured that the process mean is higher than the target mean of µ0.
NOTE 1 A statistical test is a procedure, which is valid under specified conditions, to decide, by means of observations from a sample, whether the true probability distribution belongs to the null hypothesis or the alternative hypothesis. NOTE 2 Before a statistical test is carried out the possible set of probability distributions is at first determined on the basis of the available information. Next the probability distributions, which could be true on the basis of the conjecture to be studied, are identified to constitute the alternative hypothesis. Finally, the null hypothesis is formulated as the complement to the alternative hypothesis. In many cases, the possible set of probability distributions and hence also the null hypothesis and the alternative hypothesis can be determined by reference to sets of values of relevant parameters. NOTE 3 As the decision is made on the basis of observations from a sample, it may be erroneous leading to either a Type I error (1.46), rejecting the null hypothesis when in fact it is correct, or a Type II error (1.47), failure to reject the null hypothesis in favour of the alternative hypothesis when the alternative hypothesis is true. NOTE 4 Case 1 and Case 2 of Example 3 above are instances of one-sided tests. Case 3 is an example of a two-sided test. In all three of these cases, the one-sided versus two-sided qualifier is determined by consideration of the region of the parameter µ corresponding to the alternative hypothesis. More generally, one-sided and twosided tests can be governed by the region for rejection of the null hypothesis corresponding to the chosen test statistic. That is, the test statistic has an associated critical region favouring the alternative hypothesis, but it may not relate directly to a simple description of the parameter space as in Cases 1, 2 and 3. NOTE 5 Careful attention to the underlying assumptions must be made or the application of statistical testing may be flawed. Statistical tests that lead to stable inferences even under possible mis-specification of the underlying assumptions are referred to as robust. The one-sample t test for the mean is an example of a test considered very robust under non-normal distributions. Bartlett’s test for homogeneity of variances is an example of a non-robust procedure, possibly leading to the excessive rejection of equality of variances in distributional cases for which the variances were in fact identical.
тест значајности (significance test)
поступак којим се одлучује да ли ће нулта хипотеза (1.41) бити одбачена у корист алтернативне хипотезе (1.42)
ПРИМЕР 1 На пример, ако стварна континуирана случајна променљива (2.29) може да има вредности између -¥ и +¥ и ако се сумња да истинска расподела вероватноће није нормална расподела (2.50), тада ће хипотеза бити формулисана на следећи начин.
– Опсег ситуације су све континуиране расподеле вероватноће (2.23), које могу да имају вредности између -¥ и +¥.
– Претпоставља се да истинска расподела вероватноће није нормална расподела.
– Нулта хипотеза је да је расподела вероватноће нормална расподела.
– Алтернативна хипотеза је дарасподела вероватноће није нормална расподела.
ПРИМЕР 2 Ако случајна променљива прати нормалну расподелу са познатом стандардном девијацијом (2.37) и сумња се да њена очекивана вредност m одступа од дате вредности _m_0, тада ће хипотезе бити формулисане у складу са случајем 3 у следећем примеру.
ПРИМЕР 3 Овај пример разматра три могућности у статистичком испитивању.
НАПОМЕНА 1 Статистички тест је поступак који важи под одређеним условима да би се, помоћу посматрања из узорка, одлучило да ли стварна расподела вероватноће припада нултој или алтернативној хипотези.
НАПОМЕНА 2 Пре него што се изврши статистички тест, на почетку се, на основу доступних информација утврђује се могући скуп расподела вероватноће. Следеће расподеле вероватноће, које би могле да буду тачне на основу претпоставки које ће бити проучаване, идентификоване су као алтернативна хипотеза. На крају, нулта хипотеза је формулисана као допуна алтернативној хипотези. У многим случајевима се могући скуп расподела вероватноће, а тиме и нулта хипотеза и алтернативна хипотеза могу одредити позивањем на скупове вредности релеватних параметара.
НАПОМЕНА 3 С обзиром на то да се одлука доноси на основу посматрања из узорка, може да буде погрешна и да води или до грешке I типа (1.46), одбацујући нулту хипотезу када је у ствари тачна, или до грешке II типа (1.47), неуспеха у одбацивању нулте хипотезе у корист алетрнативне хипотезе када је алтернативна хипотеза тачна.
НАПОМЕНА 4 Случај 1 и случај 2 из претходног примера 3 јесу примери једностраних испитивања. Случај 3 је пример двостраног испитивања. У сва три случаја, једнострани насупрот двостраног квалификатора одређује се разматрањем области параметра m који одговара алтернативној хипотези. Уопштеније, једностраним и двостраним испитивањима може се управљати облашћу за одбацивање нулте хипотезе која одговара изабраној статистици испитивања. Односно, статистика испитивања има повезану критичну област која фаворизује алтернативну хипотезу, али се не мора директно односити на једноставан опис простора параметара као у случајевима 1, 2 и 3.
НАПОМЕНА 5 Мора пажљиво да се обрати пажња на основне претпоставке, или примена статистичких тестова може да буде неисправна. Статистички тестови који воде до стабилних закључака чак и под могућом погрешном спецификацијом основних претпоставки називају се робусним. Један узорак t теста за средњу вредност је пример теста који се сматра веома робусним у неуобичајеним расподелама. Бартлетов тест за хомогена одступања је пример неробусног поступка који би могао да води до прекомерног одбацивања једнакости одступања у случајевима расподеле, за које су одступања у ствари идентична.