Метод кликовой перколяции - Clique percolation method

В метод кликовой перколяции[1] это популярный подход к анализу перекрытия структура сообщества из сети. Период, термин сетевое сообщество (также называемый модулем, кластером или сплоченной группой) не имеет общепринятого уникального определения и обычно определяется как группа узлов, которые более плотно связаны друг с другом, чем с другими узлами в сети. Существует множество альтернативных методов обнаружения сообществ в сетях.[2] например, Алгоритм Гирвана – Ньюмана, иерархическая кластеризация и модульность максимизация.

Определения

Метод кликовой перколяции (CPM)

Метод кликовой перколяции строит сообщества из k-клики, которые соответствуют полным (полносвязным) подграфам k узлы. (Например, a k-клик в k = 3 эквивалентно треугольнику). Два k-клики считаются смежными, если они разделяют k - 1 узел. Сообщество определяется как максимальное объединение k-клики, которые могут быть достигнуты друг от друга через ряд смежных k-клики. Такие сообщества лучше всего интерпретировать с помощью k-clique template (объект, изоморфный полному графу k узлы). Такой шаблон можно разместить на любом k-кликнуть по графику и перекатиться на соседний k-clique, перемещая один из своих узлов и сохраняя другой k - 1 узел исправлен. Таким образом k-кликовые сообщества сети - это все те подграфы, которые можно полностью изучить, свернув k-clique в них, но не может быть оставлен этим шаблоном.

Это определение позволяет естественным образом пересекаться между сообществами, как показано на рисунке 1, где показаны четыре k-кликовые сообщества в k = 4. Сообщества обозначены цветом, а перекрытие между ними выделено красным. Приведенное выше определение также является локальным: если определенный подграф удовлетворяет критериям, которые следует рассматривать как сообщество, то он останется сообществом независимо от того, что происходит с другой удаленной частью сети. Напротив, при поиске сообществ путем оптимизации по отношению к глобальному количеству изменение далеко в сети может также изменить форму сообществ в невозмущенных регионах. Кроме того, было показано, что глобальные методы могут страдать от проблемы предела разрешения,[3] где размер наименьшего сообщества, которое может быть извлечено, зависит от размера системы. Определение местного сообщества, такое как здесь, автоматически обходит эту проблему.

Поскольку даже небольшие сети могут содержать огромное количество k-cliques, реализация этого подхода основана на поиске все максимальные клики а не индивидуальный k-клики.[1] Это неизбежно требует нахождения графа максимум клика, которая является NP-жесткий проблема. (Мы подчеркиваем для читателя, что найти максимальную клику намного сложнее, чем найти одну максимальную клику.) Это означает, что хотя сети с несколькими миллионами узлов уже были успешно проанализированы с помощью этого подхода,[4] в худшем случае сложность выполнения экспоненциально зависит от количества узлов.

Метод направленной кликовой перколяции (CPMd)

В сети с направленными ссылками направленная k-clique - это полный подграф с k узлы, удовлетворяющие следующему условию. В k узлы могут быть упорядочены так, что между произвольной парой из них существует направленная связь, указывающая от узла с более высоким рангом к узлу с более низким рангом. Метод направленной перколяции кликов определяет направленные сетевые сообщества как перколяционные кластеры направленных k-клики.

Метод взвешенной кликовой перколяции (CPMw)

В сети с взвешенными связями взвешенный k-clique - это полный подграф с k такие узлы, что среднее геометрическое из k (k - 1) / 2 веса звена в пределах k-clique больше выбранного порогового значения, я. Метод взвешенной перколяции кликов определяет взвешенные сетевые сообщества как перколяционные кластеры взвешенных k-клики. Обратите внимание, что среднее геометрическое весов ссылок внутри подграфа называется интенсивностью этого подграфа.[5]

Обобщения клик-графов

Методы перколяции кликов можно обобщить, регистрируя различную степень перекрытия между различными k-клики. Затем это определяет новый тип графа, граф клики,[6] где каждый k-клика в исходном графе представлена ​​вершиной в новом графе клик. Ребра в графе клик используются для записи силы перекрытия клик в исходном графе. Затем можно применить любой обнаружение сообщества к этому графу кликов, чтобы идентифицировать кластеры в исходном графе через k-кликовая структура.

Например, в простом графике мы можем определить перекрытие между двумя k-cliques - количество вершин, общих для обоих k-клики. Затем метод перколяции клик эквивалентен пороговой обработке этого графа клик, отбрасывая все ребра веса меньше (k-1), а оставшиеся компоненты связности образуют сообщества клик, найденных в CPM. Для k = 2 клики - это ребра исходного графа, а граф клик в этом случае является линейный график исходной сети.

На практике использование числа общих вершин в качестве меры силы перекрытия клик может дать плохие результаты, так как большие клики в исходном графе имеют гораздо больше, чем k вершин, будет доминировать над графом клик. Проблема возникает из-за того, что если вершина находится в п другой k-клики, которые будут способствовать п (п-1) / 2 ребра в таком кликовом графе. Простое решение - позволить каждой вершине, общей для двух перекрывающихся kклики, чтобы внести вес, равный 1 / п при измерении силы перекрытия двух k-клики.

В общем, точка зрения графа клик - полезный способ найти обобщения стандартных методов перколяции клик, чтобы обойти любые возникающие проблемы. Он даже показывает, как описывать расширения этих методов на основе других мотивы, подграфы кроме k-клики. В этом случае граф клики лучше всего подходит для конкретного примера гиперграф.

Перколяционный переход в CPM

В Модель Эрдеша – Реньи показывает серию интересных переходов, когда вероятность п двух подключаемых узлов увеличивается. Для каждого k можно найти определенную пороговую вероятность пc выше которого k-клики организуются в гигантское сообщество.[7][8][9](Размер гигантского сообщества сопоставим с размером системы, другими словами, гигантское сообщество занимает конечную часть системы даже в термодинамическом пределе.) Этот переход аналогичен перколяционный переход в статистическая физика. Подобный феномен можно наблюдать и во многих реальных сетях: если k является большим, за сообщества принимаются только наиболее плотно связанные части, поэтому они обычно остаются маленькими и рассредоточенными. Когда k снижается, как количество, так и размер сообществ начинают расти. Однако в большинстве случаев критический k может быть достигнуто значение, ниже которого возникает гигантское сообщество, размывающее детали структуры сообщества путем слияния (и делания невидимым) многих более мелких сообществ.

Приложения

Метод кликовой перколяции был использован для обнаружения сообществ по исследованиям метастаз рака[10][11] через различные социальные сети[4][12][13][14][15] документировать кластеризацию[16] и экономичные сети.[17]

Алгоритмы и ПО

Существует ряд реализаций перколяции кликов. Метод кликовой перколяции был впервые реализован и популяризирован CFinder. [1] (бесплатное программное обеспечение для некоммерческого использования) для обнаружения и визуализации перекрывающихся сообществ в сетях. Программа позволяет настраивать визуализацию и позволяет легко прогуливаться по найденным сообществам. Пакет также содержит версию программы для командной строки, которая подходит для написания сценариев.

Более быстрая реализация (имеется в наличии под GPL) был реализован другой группой.[18] Другой пример, который также очень быстр в определенных контекстах, - это алгоритм SCP.[19]

Параллельные алгоритмы

Параллельная версия метода кликовой перколяции была разработана и разработана С. Майнарди. и другие..[20] Используя современные многоядерные / многопроцессорные вычислительные архитектуры, метод позволяет извлекать k-Clique сообщества из очень больших сетей, таких как Интернет.[21] Авторы выпустили исходный код метода под GPL и сделали его в свободном доступе для сообщества.

Смотрите также

  • Социальная сеть
  • Структура сообщества
  • Обзорная статья Сообщества в сетях
  • Фортунато, Санто (2010). «Обнаружение сообществ в графах». Отчеты по физике. 486 (3–5): 75–174. arXiv:0906.0612. Bibcode:2010ФР ... 486 ... 75Ф. Дои:10.1016 / j.physrep.2009.11.002.
  • Библиография ссылок на структуру сообщества

использованная литература

  1. ^ а б Палла, Гергей (2005). «Выявление перекрывающейся структуры сообщества сложных сетей в природе и обществе». Природа. 435 (7043): 814–818. arXiv:физика / 0506133. Bibcode:2005Натура.435..814П. Дои:10.1038 / природа03607. PMID  15944704.
  2. ^ Фортунато, Санто (2010). «Обнаружение сообществ в графах». Отчеты по физике. 486 (3–5): 75–174. arXiv:0906.0612. Bibcode:2010ФР ... 486 ... 75Ф. Дои:10.1016 / j.physrep.2009.11.002.
  3. ^ Фортунато, С. (2007). «Предел разрешения при обнаружении сообщества». Труды Национальной академии наук. 104 (1): 36–41. arXiv:физика / 0607100. Bibcode:2007ПНАС..104 ... 36F. Дои:10.1073 / pnas.0605965104. ЧВК  1765466. PMID  17190818.
  4. ^ а б Палла, Гергей (2007). «Количественная оценка эволюции социальных групп». Природа. 446 (7136): 664–667. arXiv:0704.0744. Bibcode:2007Натура.446..664П. Дои:10.1038 / природа05670. PMID  17410175.
  5. ^ Оннела, Юкка-Пекка; Сарамяки, Яри; Кертес, Янош; Каски, Киммо (2005). «Интенсивность и связность мотивов в взвешенных сложных сетях». Физический обзор E. 71 (6): 065103. arXiv:cond-mat / 0408629. Bibcode:2005PhRvE..71f5103O. Дои:10.1103 / PhysRevE.71.065103. PMID  16089800.
  6. ^ Эванс, Т. С. (2010). «Графы кликов и пересекающиеся сообщества». Журнал статистической механики: теория и эксперимент. 2010 (12): P12037. arXiv:1009.0638. Bibcode:2010JSMTE..12..037E. Дои:10.1088 / 1742-5468 / 2010/12 / P12037.
  7. ^ Дереньи, Имре; Палла, Гергей; Вичек, Тамаш (2005). «Перколяция клик в случайных сетях». Письма с физическими проверками. 94 (16): 160202. arXiv:cond-mat / 0504551. Bibcode:2005ПхРвЛ..94п0202Д. Дои:10.1103 / PhysRevLett.94.160202. PMID  15904198.
  8. ^ Палла, Гергей; Дереньи, Имре; Вичек, Тамаш (2006). «Критическая точка перколяции k-клик в графе Эрдеша – Реньи». Журнал статистической физики. 128 (1–2): 219–227. arXiv:cond-mat / 0610298. Bibcode:2007JSP ... 128..219P. Дои:10.1007 / s10955-006-9184-х.
  9. ^ Ли, Мин; Дэн, Ёджин; Ван, Бинг-Хун (2015). «Просачивание кликов в случайных графах». Физический обзор E. 92 (4): 042116. arXiv:1508.01878. Bibcode:2015PhRvE..92d2116L. Дои:10.1103 / PhysRevE.92.042116. PMID  26565177.
  10. ^ Йонссон, П. Ф. (2006). «Глобальные топологические особенности раковых белков в человеческом интерактоме». Биоинформатика. 22 (18): 2291–2297. Дои:10.1093 / биоинформатика / btl390. ЧВК  1865486. PMID  16844706.
  11. ^ Йонссон, П.Ф .; Каванна, Т; Зича, Д; Бейтс, Пенсильвания (2006). «Кластерный анализ сетей, созданных посредством гомологии: автоматическая идентификация важных белковых сообществ, участвующих в метастазировании рака». BMC Bioinformatics. 7: 2. Дои:10.1186/1471-2105-7-2. ЧВК  1363365. PMID  16398927.
  12. ^ González, Marta C .; Линд, Педро Дж .; Херрманн, Ханс Дж. (2006). «Система мобильных агентов для моделирования социальных сетей». Письма с физическими проверками. 96 (8): 088702. arXiv:физика / 0602091. Bibcode:2006ПхРвЛ..96х8702Г. Дои:10.1103 / PhysRevLett.96.088702. PMID  16606237.
  13. ^ Kumpula, Jussi M .; Оннела, Юкка-Пекка; Сарамяки, Яри; Каски, Киммо; Кертес, Янош (2007). «Появление сообществ в взвешенных сетях». Письма с физическими проверками. 99 (22): 228701. arXiv:0708.0925. Bibcode:2007PhRvL..99v8701K. Дои:10.1103 / PhysRevLett.99.228701. PMID  18233339.
  14. ^ Тойвонен, Риитта; Оннела, Юкка-Пекка; Сарамяки, Яри; Hyvönen, Jörkki; Каски, Киммо (2006). «Модель для социальных сетей». Physica A: Статистическая механика и ее приложения. 371 (2): 851–860. arXiv:физика / 0601114. Bibcode:2006PhyA..371..851T. Дои:10.1016 / j.physa.2006.03.050.
  15. ^ González, M.C .; Herrmann, H.J .; Kertész, J .; Вичек, Т. (2007). «Структура сообщества и этнические предпочтения в школьных сетях дружбы». Physica A: Статистическая механика и ее приложения. 379 (1): 307–316. arXiv:физика / 0611268. Bibcode:2007PhyA..379..307G. Дои:10.1016 / j.physa.2007.01.002.
  16. ^ Гао, Вэй; Вонг, Кам-Фай (2006). Кластеризация естественных документов путем перколяции кликов в случайных графах. Конспект лекций по информатике. 4182. С. 119–131. Дои:10.1007/11880592_10. ISBN  978-3-540-45780-0.
  17. ^ Хеймо, Тапио; Сарамяки, Яри; Оннела, Юкка-Пекка; Каски, Киммо (2007). «Спектральные и сетевые методы в анализе корреляционных матриц доходности акций». Physica A: Статистическая механика и ее приложения. 383 (1): 147–151. arXiv:физика / 0703061. Bibcode:2007PhyA..383..147H. Дои:10.1016 / j.physa.2007.04.124.
  18. ^ Reid, F .; McDaid, A .; Hurley, N .; Вичек, Тамас (2012). «Перколяционные вычисления в сложных сетях». 2012 IEEE / ACM Международная конференция по достижениям в анализе социальных сетей и майнинге. С. 274–281. arXiv:1205.0038. Дои:10.1109 / ASONAM.2012.54. ISBN  978-1-4673-2497-7.
  19. ^ Kumpula, Jussi M .; Кивеля, Микко; Каски, Киммо; Сарамяки, Яри (2008). «Последовательный алгоритм быстрой перколяции кликов». Физический обзор E. 78 (2): 026109. arXiv:0805.1449. Bibcode:2008PhRvE..78b6109K. Дои:10.1103 / PhysRevE.78.026109. PMID  18850899.
  20. ^ Грегори, Энрико; Лензини, Лучано; Майнарди, Симоне (2013). "Параллельный k-Clique Community Detection в крупномасштабных сетях » (PDF). Транзакции IEEE в параллельных и распределенных системах. 24 (8): 1651–1660. Дои:10.1109 / TPDS.2012.229.
  21. ^ Грегори, Энрико; Лензини, Лучано; Орсини, Кьяра (2011). «Сообщества K-кликов в топологическом графе уровня AS в Интернете». 2011 31-я Международная конференция по распределенным вычислительным системам, семинары. С. 134–139. Дои:10.1109 / ICDCSW.2011.17. ISBN  978-1-4577-0384-3.