Матричные алгоритмы построения деревьев


Алгоритмы матричного построения деревьев: UPGMA, WPGMA, NNM, FNM, UPGMC, WPGMC Работа перечисленных матричных методов построена по одному принципу, основанному на итеративной обработке матрицы расстояний между таксонами. На каждом шаге в матрице расстояний D ищется минимальный элемент Dij. Найденные таксоны i и j объединяются, образуя новый таксон k. Строки и столбцы, соответствующие таксонам i и j, выбрасываются из матрицы D и добавляется новая строка и новый столбец, соответствующие таксону k. В результате матрица сокращается на одну строку и один столбец. Эта процедура повторяется до тех пор, пока не будут объединены все таксоны.

Разные матричные методы отличаются лишь способом вычисления расстояний от вновь образуемого на каждом шаге таксона k до всех оставшихся таксонов. В общей форме расстояние между таксоном k и любым другим таксоном l для всех шести методов можно записать с помощью формулы:

D{lkl}l = a{li }lD{lil }l+ a{lj }lD{ljl }l+ b{lj }lD{lij }l+ g *D{lil }l- D{ljl}l* 

где коэффициенты ai , aj , b j, g различны для разных методов.

При расчете коэффициентов может использоваться информация о числе объединяемых в один более крупный таксон исходных таксонов самого нижнего ранга, т.н. OTU (Operational Taxonomic Units). Пусть таксоны i, j и k содержат ti , t jи tk OTU, соответственно. Если таксон k образуется путем объединения таксонов i и j, то

tk = t i+ tj

 Конкретные значения коэффициентов для разных методов определяются следующим образом: 

Метод ближайших соседей (Nearest Neighbor) 

ai = 0.5, aj = 0.5, b j= 0, g = -0.5;  

Метод удаленных соседей (Furthest Neighbor) 

a i= 0.5, aj = 0.5, bj = 0, g = 0.5;

 UPGMA (Arithmetic Average) 

ai = ti /tl , a j= tj /t l, b j= 0, g = 0;

 WPGMA (Weighted Average) 

ai = 0.5, aj = 0.5, b j= 0, g = 0

 UPGMC (Unweighted Centroid) 

a i= ti /tl , aj = tj /tl  , bj  = - (t it j)/(tl  t l ), g = 0; 

 WPGMC (Weighted Centroid) 

ai = 0.5, aj = 0.5, bj = -0.25, g = 0 

Более детальное изложение этих методов можно найти в книге: Peter H. A., Sneath R. S. , "Numerical Taxonomy. The principles and practice of numerical classification", 1973.

Смотрите также:

  • Методы современного предка построения деревьев
  • ФИЛОГЕНЕТИЧЕСКИЕ ДЕРЕВЬЯ: МЕТОДЫ РЕКОНСТРУКЦИИ