Модульность (сети) - Modularity (networks)

Пример измерения модульности и раскраски на безмасштабная сеть.

Модульность является одним из показателей структуры сети или же графики. Он был разработан для измерения силы разделения сети на модули (также называемые группами, кластерами или сообществами). Сети с высокой модульностью имеют плотные связи между узлами внутри модулей, но редкие связи между узлами в разных модулях. Модульность часто используется в методах оптимизации для обнаружения структура сообщества в сетях. Однако было показано, что модульность страдает пределом разрешения и, следовательно, не может обнаруживать небольшие сообщества. Биологические сети, в том числе мозг животных, обладают высокой степенью модульности.

Мотивация

Многие научно важные проблемы могут быть представлены и эмпирически изучены с помощью сетей. Например, биологические и социальные паттерны, всемирная паутина, метаболические сети, пищевые сети, нейронные сети и патологические сети - это проблемы реального мира, которые можно математически представить и топологически изучить, чтобы выявить некоторые неожиданные структурные особенности.[1] Большинство этих сетей обладают определенной структурой сообщества, которая имеет существенное значение для понимания динамики сети. Например, тесно связанное социальное сообщество подразумевает более высокую скорость передачи информации или слухов между ними, чем слабо связанное сообщество. Таким образом, если сеть представлена ​​рядом отдельных узлов, соединенных связями, которые обозначают определенную степень взаимодействия между узлами, сообщества определяются как группы плотно связанных узлов, которые лишь редко связаны с остальной частью сети. Следовательно, может быть необходимо идентифицировать сообщества в сетях, поскольку сообщества могут иметь совершенно разные свойства, такие как степень узла, коэффициент кластеризации, промежуточность, центральность.[2] и т. д., от средней сети. Модульность - одна из таких мер, которая при максимальном увеличении приводит к появлению сообществ в данной сети.

Определение

Модульность - это доля ребер, которые попадают в указанные группы, за вычетом ожидаемой доли, если ребра были распределены случайным образом. Значение модульности для невзвешенных и неориентированных графиков лежит в диапазоне .[3] Положительно, если количество ребер в группах превышает число, ожидаемое на основе случайности. Для данного разделения вершин сети на несколько модулей модульность отражает концентрацию ребер внутри модулей по сравнению со случайным распределением связей между всеми узлами независимо от модулей.

Существуют разные методы расчета модульности.[1] В наиболее распространенной версии концепции рандомизация ребер выполняется так, чтобы сохранить степень каждой вершины. Рассмотрим график с узлы и ссылки (края ), так что граф можно разделить на два сообщества с помощью переменной принадлежности . Если узел принадлежит к сообществу 1, , или если принадлежит к сообществу 2, . Пусть матрица смежности для сети быть представлен , куда означает, что между узлами нет края (нет взаимодействия) и и означает, что между ними есть грань. Также для простоты мы рассматриваем ненаправленную сеть. Таким образом . (Важно отметить, что между двумя узлами может существовать несколько ребер, но здесь мы рассматриваем простейший случай).

Модульность затем определяется как доля ребер, которые попадают в группу 1 или 2, за вычетом ожидаемого количества ребер в группах 1 и 2 для случайного графа с тем же распределением степеней узлов, что и данная сеть.

Ожидаемое количество ребер должно быть вычислено с использованием концепции модель конфигурации.[4] Модель конфигурации - это рандомизированная реализация конкретной сети. Учитывая сеть с узлы, где каждый узел имеет степень узла , модель конфигурации разрезает каждое ребро на две половины, а затем каждую половину ребра, называемую заглушка, случайным образом перенаправляется с любым другим шлейфом в сети (кроме самого себя), даже позволяя петли (которые возникают, когда шлейф перенаправляется на другой шлейф из того же узла) и множественные ребра между теми же двумя узлами. Таким образом, даже если распределение степеней узлов графа остается неизменным, модель конфигурации приводит к полностью случайной сети.

Ожидаемое количество ребер между узлами

Теперь рассмотрим два узла v и ш, с узловыми степенями и соответственно, из случайно перепрограммированной сети, как описано выше. Мы вычисляем ожидаемое количество полных ребер между этими узлами.

Пусть общее количество шлейфов в сети будет :

 

 

 

 

(1)

Рассмотрим каждый из заглушки узла v и создать связанные индикаторные переменные для них, , с если i-й шлейф подключается к одному из заглушки узла ш в этом конкретном случайном графе. Если нет, то его значение равно 0. Поскольку i-я заглушка узла v можно подключиться к любому из оставшиеся заглушки с равной вероятностью, а так как есть заглушки, к которым он может подключаться, связанные с узлом ш, очевидно

Общее количество полных ребер между v и ш просто , поэтому математическое ожидание этого количества равно

Затем во многих текстах делаются следующие приближения для случайных сетей с большим количеством ребер. Когда м большой, они отбрасывают вычитание 1 в знаменателе выше и просто используют приближенное выражение для ожидаемого количества ребер между двумя узлами. Кроме того, в большой случайной сети количество петель и множественных ребер исчезающе мало.[5] Игнорирование петель и множественных ребер позволяет предположить, что между любыми двумя узлами имеется не более одного ребра. В таком случае, становится двоичной индикаторной переменной, поэтому его ожидаемое значение также является вероятностью того, что оно равно 1, что означает, что можно приблизительно оценить вероятность наличия края между узлами v и ш в качестве .

Модульность

Следовательно, разница между фактическим количеством ребер между узлами и и ожидаемое количество ребер между ними равно

Суммирование по всем парам узлов дает уравнение модульности: .[1]

 

 

 

 

(3)

Важно отметить, что Уравнение 3 годится только для разделения на два сообщества. Иерархическое разделение (то есть разделение на два сообщества, затем два подсообщества далее разделены на два меньших подсообщества только для максимального увеличения Q) - это возможный подход к идентификации нескольких сообществ в сети. Кроме того, (3) может быть обобщено для разделения сети на c сообщества.[6]

 

 

 

 

(4)

куда еij - доля ребер с односторонними вершинами в сообществе я а другой в сообществе j:

и ая это доля концов ребер, которые прикреплены к вершинам в сообществе я:

Пример обнаружения множественных сообществ

Мы рассматриваем неориентированную сеть с 10 узлами и 12 ребрами и следующей матрицей смежности.

Рис 1. Пример сети, соответствующей матрице смежности с 10 узлами, 12 ребрами.
Рис. 2. Сетевые разделы, увеличивающие Q. Максимальное значение Q = 0,4896.
ID узла12345678910
10110000001
21010000000
31100000000
40000110001
50001010000
60001100000
70000000111
80000001010
90000001100
101001001000

Сообщества на графике представлены кластерами узлов красного, зеленого и синего цветов на рис. 1. Оптимальные разделы сообщества показаны на рис. 2.

Формулировка матрицы

Альтернативная формулировка модульности, особенно полезная в алгоритмах спектральной оптимизации, выглядит следующим образом.[1] Определять Svr быть 1, если вершина v принадлежит к группе р и ноль в противном случае. потом

и поэтому

куда S - (неквадратная) матрица, имеющая элементы Svr и B это так называемая матрица модульности, в которой есть элементы

Сумма всех строк и столбцов матрицы модульности равна нулю, что означает, что модульность неразделенной сети также всегда равна нулю.

Для сетей, разделенных всего на два сообщества, можно альтернативно определить sv = ± 1, чтобы указать сообщество, которому узел v принадлежит, что затем приводит к

куда s вектор-столбец с элементами sv.[1]

Эта функция имеет тот же вид, что и Гамильтониан Изинга спин-стекло, соединение, которое использовалось для создания простых компьютерных алгоритмов, например, с использованием имитация отжига, чтобы максимизировать модульность. Общая форма модульности для произвольного числа сообществ эквивалентна спин-стеклу Поттса, и аналогичные алгоритмы могут быть разработаны и для этого случая.[7]

Предел разрешения

Модульность сравнивает количество ребер внутри кластера с ожидаемым количеством ребер, которое можно было бы найти в кластере, если бы сеть была случайной сетью с тем же количеством узлов, и каждый узел сохраняет свою степень, но в противном случае ребра присоединяются случайным образом. Эта случайная нулевая модель неявно предполагает, что каждый узел может быть присоединен к любому другому узлу сети. Это предположение, однако, неразумно, если сеть очень большая, поскольку горизонт узла включает небольшую часть сети, игнорируя большую ее часть. Более того, это означает, что ожидаемое количество ребер между двумя группами узлов уменьшается, если размер сети увеличивается. Итак, если сеть достаточно велика, ожидаемое количество ребер между двумя группами узлов в нулевой модели модульности может быть меньше единицы. Если это произойдет, единственное ребро между двумя кластерами будет интерпретировано модульностью как признак сильной корреляции между двумя кластерами, а оптимизация модульности приведет к слиянию двух кластеров, независимо от характеристик кластеров. Таким образом, даже слабо взаимосвязанные полные графы, которые имеют максимально возможную плотность внутренних ребер и представляют наилучшие идентифицируемые сообщества, были бы объединены путем оптимизации модульности, если бы сеть была достаточно большой.[8]По этой причине оптимизация модульности в больших сетях не решит проблемы небольших сообществ, даже если они четко определены. Это предубеждение неизбежно для таких методов, как оптимизация модульности, которые полагаются на глобальную нулевую модель.[9]

Методы с несколькими разрешениями

Есть два основных подхода, которые пытаются решить предел разрешения в контексте модульности: добавление сопротивления р к каждому узлу в виде петля, что увеличивает (г> 0) или уменьшается (г <0) отвращение узлов к формированию сообществ;[10] или добавление параметра γ> 0 перед термином нулевого регистра в определении модульности, который контролирует относительную важность между внутренними связями сообществ и нулевой моделью.[7] Оптимизируя модульность для значений этих параметров в соответствующих диапазонах, можно восстановить весь мезомасштаб сети, от макромасштаба, в котором все узлы принадлежат к одному сообществу, до микромасштаба, в котором каждый узел формирует свое собственное сообщество, отсюда и название методы с несколькими разрешениями. Однако было показано, что эти методы имеют ограничения, когда сообщества очень разнородны по размеру.[11]

Перколяция модульных сетей

Теория перколяции на модульных сетях изучалась несколькими авторами.[12][13]

Распространение эпидемии в модульных сетях

В последнее время распространение эпидемии было изучено в модульных сетях (сетях с сообществами).[14]Поскольку распространение болезни в одной стране может стать пандемией с потенциальными гуманитарными и экономическими последствиями во всем мире, важно разработать модели для оценки вероятности всемирной пандемии. Самый свежий пример - коронавирус, который возник в Китае (конец 2019 года) и распространился по всему миру. В этой статье,[14] предлагается модель распространения болезни в структурной модульной сложной сети (имеющей сообщества) и изучение того, как количество узловых мостов, соединяющих сообщества, влияет на распространение болезни и критерий объявления пандемии.

Смотрите также

Рекомендации

  1. ^ а б c d е Ньюман, М. Э. Дж. (2006). «Модульность и структура сообщества в сетях». Труды Национальной академии наук Соединенных Штатов Америки. 103 (23): 8577–8696. arXiv:физика / 0602124. Bibcode:2006ПНАС..103.8577Н. Дои:10.1073 / pnas.0601602103. ЧВК  1482622. PMID  16723398.
  2. ^ Ньюман, М. Э. Дж. (2007). Пэлгрейв Макмиллан, Бейзингсток (ред.). «Математика сетей». Новая энциклопедия экономики Палгрейва (2-е изд.).
  3. ^ Brandes, U .; Деллинг, Д .; Gaertler, M .; Горке, Р .; Hoefer, M .; Николоски, З .; Вагнер, Д. (февраль 2008 г.). «О модульности кластеризации». IEEE Transactions по разработке знаний и данных. 20 (2): 172–188. Дои:10.1109 / TKDE.2007.190689.
  4. ^ ван дер Хофстад, Ремко (2013). «Глава 7» (PDF). Случайные графы и сложные сети.
  5. ^ "NetworkScience". Альберт-Ласло Барабаши. Получено 2020-03-20.
  6. ^ Клаузет, Аарон и Ньюман, М. Э. Дж. И Мур, Кристофер (2004). «Поиск структуры сообщества в очень больших сетях». Phys. Ред. E. 70 (6): 066111. arXiv:cond-mat / 0408187. Bibcode:2004PhRvE..70f6111C. Дои:10.1103 / PhysRevE.70.066111. PMID  15697438.CS1 maint: несколько имен: список авторов (связь)
  7. ^ а б Йорг Райхард и Стефан Борнхольдт (2006). «Статистическая механика обнаружения сообществ». Физический обзор E. 74 (1): 016110. arXiv:cond-mat / 0603718. Bibcode:2006PhRvE..74a6110R. Дои:10.1103 / PhysRevE.74.016110. PMID  16907154.
  8. ^ Санто Фортунато и Марк Бартелеми (2007). «Предел разрешения при обнаружении сообщества». Труды Национальной академии наук Соединенных Штатов Америки. 104 (1): 36–41. arXiv:физика / 0607100. Bibcode:2007ПНАС..104 ... 36F. Дои:10.1073 / pnas.0605965104. ЧВК  1765466. PMID  17190818.
  9. ^ J.M. Kumpula; Я. Сарамяки; К. Каски и Дж. Кертес (2007). «Ограниченное разрешение при обнаружении сложных сетевых сообществ с использованием модели Поттса». Европейский физический журнал B. 56 (1): 41–45. arXiv:cond-mat / 0610370. Bibcode:2007EPJB ... 56 ... 41K. Дои:10.1140 / epjb / e2007-00088-4.
  10. ^ Алекс Аренас, Альберто Фернандес и Серхио Гомес (2008). «Анализ структуры сложных сетей на разных уровнях разрешения». Новый журнал физики. 10 (5): 053039. arXiv:физика / 0703218. Bibcode:2008NJPh ... 10e3039A. Дои:10.1088/1367-2630/10/5/053039.
  11. ^ Андреа Ланчинетти и Санто Фортунато (2011). «Пределы максимизации модульности в обнаружении сообществ». Физический обзор E. 84 (6): 066122. arXiv:1107.1155. Bibcode:2011PhRvE..84f6122L. Дои:10.1103 / PhysRevE.84.066122. PMID  22304170.
  12. ^ Шай, S; Kenett, D.Y; Kenett, Y.N; Фауст, М; Добсон, S; Хавлин, С. (2015). «Критический переломный момент, различающий два типа переходов в модульных сетевых структурах». Phys. Ред. E. 92: 062805. Дои:10.1103 / PhysRevE.92.062805. PMID  26764742.
  13. ^ Донг, Гаогао; Фань, Цзинфан; Шехтман, Луи М; Шай, Сарай; Ду, Жуйджин; Тиан, Лисинь; Чен, Сяосун; Стэнли, Х. Юджин; Хавлин, Шломо (2018). «Устойчивость сетей со структурой сообщества ведет себя так, как будто находится под внешним полем». Труды Национальной академии наук. 115 (27): 6911–6915. arXiv:1805.01032. Дои:10.1073 / pnas.1801588115.
  14. ^ а б Valdez, LD; Браунштейн, Луизиана; Хэвлин, С. «Распространение эпидемии в модульных сетях: страх объявить пандемию». Phys. Ред. E. 101 (3): 032309. arXiv:1909.09695. Дои:10.1103 / PhysRevE.101.032309.