Вариант последовательности ампликона - Amplicon sequence variant

Вариант последовательности ампликона (ASV) - термин, используемый для обозначения одиночных ДНК последовательности, восстановленные с высокой пропускной способности маркерный ген анализ. Эти считывания ампликонов создаются после удаления ошибочных последовательностей, сгенерированных во время ПЦР и секвенирование. Это позволяет ASV различать вариацию последовательности по изменению одного нуклеотида. ASV используются для классификации групп видов на основе последовательностей ДНК, выявления биологических и экологических вариаций, а также для определения экологических закономерностей. В течение многих лет стандартной единицей для анализа маркерных генов был операционные таксономические единицы (OTU), которые генерируются путем кластеризации последовательностей на основе общего порога сходства. Эти традиционные единицы были созданы путем построения молекулярных таксономических единиц либо путем кластеризации на основе сходства между чтениями секвенирования (de-novo OTU), либо путем кластеризации справочных баз данных для определения и маркировки OTU (OTU с закрытыми ссылками). Вместо использования точных вариантов последовательности (однонуклеотидные изменения), OTU отличаются менее фиксированным порогом несходства, который обычно составляет 3%. Это означает, что эти единицы должны разделять 97% последовательности ДНК. С другой стороны, методы ASV способны разрешить различия в последовательностях всего за одно изменение нуклеотида, что дает этому методу возможность полностью избежать основанных на сходстве операционных единиц кластеризации. Таким образом, ASV обеспечивают более точное измерение вариации последовательности, поскольку этот метод использует различия ДНК вместо созданных пользователем различий OTU. ASV также называют вариантами точной последовательности (ESV), OTU нулевого радиуса (zOTU), суб-OTU (sOTU), гаплотипами или олиготипами.[1] [2]

Это сравнивает ASV и OTU. На этой диаграмме отмечена отметка о том, является ли этот метод анализа маркерных генов точным, прослеживаемым, воспроизводимым или всеобъемлющим.
На этом графике показана реальная последовательность, которая была упорядочена более ста раз. Черные точки называются облаком ошибок, а по оси Y отображается количество типов этой конкретной ошибки в этом наборе. Красная вертикальная линия представляет 3% -ный предел, это означает, что все справа от этой линии - новая биология, а все, что слева - ошибка. Это демонстрирует ошибки или новую биологию, которые можно упустить при использовании OTU, поскольку OTU будут включать их в порог несходства 3%.
Это та же самая реальная последовательность, которая была упорядочена более ста раз, как на приведенном выше графике. Черные точки называются облаком ошибок, а по оси Y отображается количество типов этой конкретной ошибки в этом наборе. Теперь эта диаграмма показывает, как ASV предотвращают включение этих ошибок, связанных с OTU, в набор данных, потому что ASV ограничивают ошибки тем, что они находятся ниже черной изогнутой линии, а новая биология - это те точки над изогнутой черной линией. Это означает, что ASV более точно измеряют различия между последовательностями.
Это наглядно демонстрирует, как OTU регистрируют ошибочные считывания ампликона, созданные в результате ПЦР и секвенирования. Когда эти последовательности усиливаются в кластерные блоки, эти ошибки улавливаются и помещаются в кластерные блоки. Таким образом, OTU собирают более широкий набор точек данных и потенциально могут случайно сгруппировать две различные последовательности ДНК в одну и ту же единицу, что видно только по двум цветам или последовательностям ДНК, собранным в OTU вместо четырех цветов (последовательности ДНК).
Это наглядно показывает, как ASV удаляют и исправляют ошибки из PCR, по сравнению с диаграммой OTU выше. ASV могут создавать группы для всех четырех цветов или наблюдаемых последовательностей ДНК. Это позволяет ASV более точно находить вариации последовательности.

Преимущества OTU

Хотя ASV позволяют более точное и точное измерение вариации последовательности, OTU по-прежнему являются приемлемым и ценным подходом. В исследовании, проведенном Глассманом и Мартини, эти исследователи смогли доказать валидность OTU в применении к широкомасштабным исследованиям анализа разнообразия. Они пришли к выводу, что OTU и ASV обеспечили аналогичные экологические результаты, при этом ASV позволили немного более точно определить разнообразие грибов и бактерий. Это исследование показало, что даже несмотря на то, что теперь ASV позволят более точно измерить диверсификацию видов, ученые не должны ставить под сомнение достоверность хорошо построенных исследований, в которых OTU использовались для демонстрации широкомасштабной диверсификации. [3]

Преимущества ASV

Внедрение методов ASV вызвало споры среди исследователей относительно их полезности. Некоторые утверждали, что ASV должны заменить OTU в анализе маркерных генов. Аргументы в пользу ASV сосредоточены на точности, управляемости, воспроизводимости и полноте, которые ASV могут обеспечить для анализа маркерных генов. Полезность более точного разрешения (точности) последовательностей и преимущество возможности легко сравнивать последовательности между различными исследованиями (сходимость и воспроизводимость) делают ASV лучшим вариантом для анализа различий последовательностей. Единицы внутри OTU могут меняться между исследователями, экспериментами и базами данных, поскольку они являются оперативными единицами и, следовательно, зависят от человека, создавшего этот конкретный порог сходства. В то время как ASV представляют собой точные вариации нуклеотидных последовательностей, поэтому изменения, наблюдаемые между прошлыми экспериментами, могут быть более легко связаны с биологическими различиями, а не с различиями в кластеризации единиц. Это означает, что исследователи могут работать с собой два года назад, потому что ASV не используют базы данных или кластеры смещений исследователей, вместо этого ASV представляют собой обнаруживаемые биологические вариации, обеспечивающие единообразную маркировку для всех наборов данных. Кроме того, таблицы ASV обеспечивают более точную и полную вариацию последовательности по сравнению с базами данных OTU, поскольку рабочие единицы варьируются в зависимости от эксперимента и исследователя. Поскольку это точные варианты последовательности, ASV являются более полными и точными по сравнению с оперативными единицами, созданными каждой базой данных. Хотя достоверность OTU доказана, ASV являются более точными, многоразовыми, всеобъемлющими и воспроизводимыми для секвенирования маркерных генов. [4] [5]

Методы ASV

Популярные методы разрешения ASV, включая DADA2,[6] Деблюр,[7] MED,[8] и UNOISE.[9] Эти методы работают в широком смысле, создавая модель ошибок, адаптированную для отдельного цикла секвенирования, и применяя алгоритмы, которые используют модель для различения истинных биологических последовательностей и последовательностей, созданных в результате ошибки.

Рекомендации

  1. ^ Портер, Тересита М .; Хаджибабаей, Мехрдад (2018). «Расширение масштабов: руководство по высокопроизводительным геномным подходам к анализу биоразнообразия». Молекулярная экология. 27 (2): 313–338. Дои:10.1111 / mec.14478. ISSN  1365–294X. PMID  29292539.
  2. ^ Каллахан, Бенджамин Дж .; Макмерди, Пол Дж .; Холмс, Сьюзан П. (декабрь 2017 г.). «Варианты точной последовательности должны заменить рабочие таксономические единицы в анализе данных маркерных генов». Журнал ISME. 11 (12): 2639–2643. Дои:10.1038 / ismej.2017.119. ISSN  1751-7370.
  3. ^ Глассман, Сидней I .; Мартини, Дженнифер Б. Х. (29 августа 2018 г.). «Широкомасштабные экологические образцы устойчивы к использованию вариантов точных последовательностей по сравнению с оперативными таксономическими единицами». мСфера. 3 (4). Дои:10.1128 / мСфера.00148-18. ISSN  2379-5042.
  4. ^ Каллахан, Бенджамин Дж; Макмерди, Пол Дж; Холмс, Сьюзан П. (21.07.2017). «Варианты точной последовательности должны заменить операционные таксономические единицы в анализе данных маркерных генов». Журнал ISME. 11 (12): 2639–2643. Дои:10.1038 / ismej.2017.119. ЧВК  5702726.
  5. ^ Каллахан, Бенджамин Дж .; Макмерди, Пол Дж .; Холмс, Сьюзан П. (декабрь 2017 г.). «Варианты точной последовательности должны заменить рабочие таксономические единицы в анализе данных маркерных генов». Журнал ISME. 11 (12): 2639–2643. Дои:10.1038 / ismej.2017.119. ISSN  1751-7370.
  6. ^ Каллахан, Бенджамин Дж; Макмерди, Пол Дж; Розен, Майкл Дж; Хан, Эндрю В; Джонсон, Эми Дж; Холмс, Сьюзан П. (2015-08-06). «DADA2: вывод образца с высоким разрешением из данных ампликона». Дои:10.1101/024034. Цитировать журнал требует | журнал = (помощь)
  7. ^ Амир, Амнон; Макдональд, Дэниел; Навас-Молина, Хосе А .; Копылова Евгения; Мортон, Джеймс Т .; Зеч Сюй, Чжэньцзян; Кайтли, Эрик П .; Томпсон, Люк Р .; Хайд, Эмбриетт Р. (25 апреля 2017 г.). Гилберт, Джек А. (ред.). «Deblur быстро решает однонуклеотидные паттерны последовательностей сообщества». mSystems. 2 (2). Дои:10.1128 / mSystems.00191-16. ISSN  2379-5077. ЧВК  5340863. PMID  28289731.
  8. ^ Эрен, Мурат; Моррисон, Хилари Дж. Леско, Памела Дж .; Ревейо, Жюли; Vineis, Joseph H; Согин, Митчелл Л. (2014-10-17). «Минимальное разложение энтропии: неконтролируемое олиготипирование для чувствительного разделения последовательностей генов-маркеров с высокой пропускной способностью». Журнал ISME. 9 (4): 968–979. Дои:10.1038 / ismej.2014.195. ISSN  1751-7362. ЧВК  4817710. PMID  25325381.
  9. ^ Эдгар, Роберт С. (2016-10-15). «UNOISE2: улучшенное исправление ошибок для секвенирования ампликонов Illumina 16S и ITS». Дои:10.1101/081257. Цитировать журнал требует | журнал = (помощь)