Биологический каталог




Современная генетика. Том 3

Автор Ф.Айала, Дж.Кайгер

всех четырех значений в таблице 2x2 нам достаточно, кроме значений в графах «всего», знать хотя бы одно из четырех. Например, число монозиготных дискордантных близнецов равно 64 — — 30 = 34 и т. п. Такие таблицы могут иметь любое число строк (г) и столбцов (с). При этом, разумеется, строка и столбец «всего» не учитываются. В общем случае число степеней свободы равно (г — 1)(с —1).

Поскольку значение %2 = 12,08 больше допустимого значения хи-квадрата для одной степени свободы и 5%-ного уровня значимости, мы приходим к заключению, что тип близнецов, с одной стороны, и конкордантность или дискордантность в отношении бронхиальной астмы-с другой, нельзя считать независимыми друг от друга. Отсутствие независимости, возможно, обусловлено существованием наследственной составляющей в предрасположенности к бронхиальной астме.

Проверка гипотезы о равновесии Харди—Вайнберга. У людей имеются два аллеля в локусе pGM. В выборке из 200 представителей белой расы обладатели различных генотипов распределились следующим образом:

PGM^/PGM1 108

PGMl/PGM2 86

PGM2/PGM2 6

Всего: 200

Мы хотим установить, соответствуют ли эти данные частотам, которых следует ожидать, исходя из равновесия Харди—Вайберга. Сначала рассчитаем частоту р аллеля PGM;

(108-2)+ 86 302 Л

» = — - = = 0,755.

У 400 400

Теоретически ожидаемые частоты и численность генотипов составляют

Генотип Частота Численность

PGM1/PGM1 р2 = 0,570 114

PGM'/PGM2 2pq = = 0,370 74

PGM2/PGM2 q2 = 0,060 12

Рассчитывая значение хи-квадрат, как и выше, получаем %2 = 5,26. Каково число степеней свободы в этом случае? Оно равно единице, а не двум, как могло показаться по аналогии с рассмотренным выше случаем менделевского расщепления. Дело в том, что по исходным данным мы рассчитывали, что частота аллеля р равна 0,755. Зная это значение и общий объем выборки, мы можем определить ожидаемые численности двух генотипических классов, если знаем число особей в одном из этих трех классов.

Это позволяет сформулировать еще одно правило (аналогичное приведенному выше) для определения числа степеней свободы: число степеней свободы равно разности между числом классов и числом независимых величин, полученных на основе данных, использованных для расчета ожидаемых значений. В рассматриваемом выше случае менделевского расщепления общее число растений было единственным значением, полученным из исходных данных. Зная это значение и законы Менделя, мы можем рассчитать ожидаемое число растений каждого фе-нотипического класса. В случае проверки равновесия Харди—Вайнберга мы на основе исходных данных рассчитаем два значения: общее число людей в выборке и частоте аллеля р. Заметим, что величина %2, равная 5,26, статистически достоверна при 5%-ном уровне значимости и одной степени свободы, но статистически не достоверна для двух степеней свободы. Если бы мы ошибочно предположили, что существуют две степени свободы, то не отвергли бы гипотезу о соответствии частот указанных трех генотипов равновесию Харди—Вайнберга.

Предостережение, Метод хи-квадрат-это приблизительный метод, дающий хорошие результаты, только если общий объем выборки и теоретически ожидаемые численности в каждом классе достаточно велики; если же они малы, то данный метод неэффективен. Практически следует руководствоваться двумя правилами: 1) если имеется только одна степень свободы, то ожидаемые значения численности для каждого класса должны быть не меньше пяти; 2) если число степеней свободы больше единицы, то ожидаемые значения численности в каждом классе должны быть не меньше единицы. Существуют, однако, приемы, которыми можно воспользоваться, когда эти условия не выполняются.

Если число степеней свободы равно единице, а численность одного из классов меньше пяти, то следует применять поправку Йетса. Она состоит в том, что, прежде чем вычислить значения хи-квадрат, каждую из разностей между наблюдаемыми и ожидаемыми значениями приближают к нулю на 0,5 единицы. В табл. П.4 приведен расчет значения

хи-квадрат для результатов возвратного скрещивания между кроликами-альбиносами (Если число степеней свободы больше единицы, но имеются классы, в которых ожидаемые значения меньше единицы, то можно объединить эти классы таким образом, чтобы значения во всех новых классах были не меньше единицы. При этом не следует забывать о том, что при определении числа степеней свободы нужно использовать число новых (объединенных) классов. В табл. П.5 приводятся результаты исследования, в котором определялись хромосомные перестройки в выборке из 50 личинок Drosophila pseudoobscura. Прежде всего мы подсчитываем частоты каждой последовательности генов в популяции

(1б-2) + 22 + 6

P (AR) = — = 0,60,

(4 -2) + 22 + 0

q(CH)= too =(W

r(TL)=\- 0,60 - 0,30 = 0,10.

Ожидаемые частоты генотипов можно подсчитать путем разложения квадрата суммы (р + q + г)2, ожидаемые численности генотипических классов получают умножением общего числа особей в выборке (50) на ожидаемые частоты. Все это проделано в табл. П.5. Из исходных данных определяют три независимые величины: частоты р, q (г не является независимой величиной, а рассчитывается просто как разность г = 1 — р — q) и общее число особей. Поскольку имеется шесть классов, число степеней свободы равно 6—3 независимых значения = 3. Величина х2 составляет 8,67, что статистически достоверно для 5%-ного уровня значимости и трех степеней свободы. В нижней части табл. П.5 два класса с минимальными ожидаемыми значениями объединены. Теперь мы имеем пять классов и, следовательно, 5 — 3 = 2 степени свободы. Новое значение х2 равно 1,81, что означает отсутствие статистической достоверности на 5%-ном уровне значимости.

П. III. Среднее значение и дисперсия

Предположим, что имеется выборка особей, у которых измерен некоторый признак, например рост. Всю информацию о распределении этого признака в выборке можно свести к двум величинам: среднему значению и вариансе, или дисперсии. Среднее значение служит мерой «основной тенденции», а дисперсия-мерой ширины распределения.

Среднее арифметическое, или просто среднее значение распределения, вычисляется по формуле

Х =

где X среднее, ^Х- сумма индивидуальных значений признака у всех особей выборки, a N-число особей.

Пусть мы измерили рост десяти студентов и получили следующий набор данных, округленных до целых значений в сантиметрах 170, 174, 177, 178, 178, 179, 179, 180, 181 и 184 см. Средний по выборке рост равен:

X = -^-(170 + 172 + 177 + 178 + 178 + 179 + 179 + 180 + 181 + 184) = 178,0 см.

Вариансой, или дисперсией, называется частное от деления суммы квадратов разностей между индивидуальными значениями признака и средним его значением на величину, которая на единицу меньше числа индивидуумов в выборке: $2=?(Х-Х)2

N-1 '

где s2-дисперсия, а все остальные символы имеют тот же смысл, что и в предыдущей формуле: X-индивидуальное значение, Х-среднее значение, ЛГ-число индивидуумов. Дисперсия роста в нашей выборке из 10 студентов равна:

s2 = j[(- 8)2 + (- 4)2 + (- I)2 + О2 + О2 + I2 + I2 + 22 + З2 + б2] = 132

1JZ = 14,67 см2.

Дисперсию часто удобно вычислять с помощью следующей формулы, математически эквивалентной предыдущей:

S2 =

Y,x2-nx2

N-l

Воспользуемся ею для нашего примера:

S2 = I- [(ПО2 + 1742 + 1772 + 1782 + 1782 + 1792 + 1792 + 1802 +

+ Ш' + 184=- 10(178',] = 316972-316840 = ^ ^

Дисперсия измеряется в квадратных единицах, поскольку выражается через сумму квадратов отклонений от среднего. Чтобы оценивать ширину распределения в тех же единицах, что и его среднее значение, используют среднеквадратичное, или стандартное, отклонение, определяемое просто как квадратный корень из дисперсии:

S =

'1,(Х-Х)2 N - 1

где s -стандартное отклонение. В рассмотренном выше примере s = - 3,83 см.

П. IV. Распределение Пуассона

Рассмотрим следующий эксперимент, похожий на описанный в гл. 20 классический опыт Луриа и Дельбрюка. В большую пробирку с жидкой питательной средой вносят клетки Escherichia coli, чувствительные к фагу Т1. Культуру инкубируют до тех пор, пока она не достигнет максимального титра. После этого из пробирки отбирают пробы объемом по 0,2 мл и высевают на чашки Петри с агаром, содержащим фаг Т1. В клетках Е. coli с некоторой частотой происходят мутации tons tonR. На чашках с фагом Т1 устойчивые бактерии ton делятся и формируют колонии, бактерии tons делиться не способны. Число фагоустойчивых колоний на каждой из 60 чашек представлено в табл. П.6 (третий столбец). Общее число колоний на всех чашках равно 70, т.е. в среднем по 1,17 колонии на чашку.

Таблица 6.П.1. Наблюдаемые и теоретически ожидаемые на основе распределения Пуассона результаты в эксперименте с бактериями

. Число колоний Число Число Ожидаемая Ожидаемое

на чашку чашек колоний частота количество

чашек чашек

0 22 0 0,311 18,7

1 19 19 0,363 21,8

2 10 20 0,212 12,7

3 6 18 0,082 4,9

4 2 8 0,024 1,44

5 1 5 0,006 0,34

Всего 60 70 0,998 59,9

Когда вероятность отдельного события (в данном случае мутации) очень мала, а число испытаний (бактерий) очень велико, то частота событий подчиняется распределению Пуассона. (При этом предполагается также, что события независимы; в нашем примере это означает, что возникновение мутации у одной бактерии не влияет на вероятность ее возникновения у другой бактерии.) Другим примером пуассоновского распределения может служить число случаев ахондроплазии на каждые 10 000 новорожденных в браке нормальных родителей по всему населению земного шара.

Значения членов распределения Пуассона задаются следующей общей формулой:

mmTi'"где р(к)-вероятность того, что в данной выборке реализуется к инт

страница 53
< К СПИСКУ КНИГ > 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72

Скачать книгу "Современная генетика. Том 3" (4.14Mb)


[каталог]  [статьи]  [доска объявлений]  [обратная связь]

п»ї
Химический каталог

Copyright © 2009
(20.09.2020)