UCLUST - UCLUST

UCLUST[1]является алгоритм предназначен для кластеризации нуклеотид или же аминокислотные последовательности в кластеры на основе сходства последовательностей. Алгоритм был опубликован в 2010 году и реализован в программе, также называемой UCLUST. Алгоритм описывается автором как следующие два простых критерия кластеризации в отношении запрошенного порога сходства T. Первый критерий утверждает, что последовательность центроидов любого заданного кластера будет иметь сходство меньше, чем T, с последовательностью центроидов любого другого кластера. Второй критерий утверждает, что каждая последовательность-член в данном кластере будет иметь сходство с последовательностью центроида кластера, которая равна или больше T.

Алгоритм UCLUST - жадный. В результате порядок последовательностей во входном файле повлияет на результирующие кластеры и их качество. По этой причине рекомендуется, чтобы последовательности были отсортированы перед переходом на этап кластеризации. Программа UCLUST оснащена некоторыми опциями для сортировки входных последовательностей перед их кластеризацией.

Программа UCLUST широко используется среди биоинформатический исследовательского сообщества, где он использовался для нескольких приложений, включая назначение OTU (например, 16), создавая неизбыточные ген каталоги, таксономический назначение и филогенетический анализ.

внешняя ссылка

  • Эдгар, Р.С. «Алгоритм UCLUST». drive5.
  • "Проект документации по программному обеспечению Bio-Linux". NEBC.

Смотрите также

Рекомендации