Identifying Roles in an IP Network with Temporal and Structural Density

Tiphaine Viard and Matthieu Latapy

NetSciCom 2014

Captures of IP traffic contain much information on very different kinds of activities like file transfers, users interacting with remote systems, automatic backups, or distributed computations. Identifying such activities is crucial for an appropriate analysis, modeling and monitoring of the traffic. We propose here a notion of density that captures both temporal and structural features of interactions, and generalizes the classical notion of clustering coefficient. We use it to point out important differences between distinct parts of the traffic, and to identify interesting nodes and groups of nodes in terms of roles in the network.

Download

Measuring Routing Tables in the Internet

Élie Rotenberg, Christophe Crespelle and Matthieu Latapy

NetSciCom 2014

The most basic function of an Internet router is to decide, for a given packet, which of its interfaces it will use to forward it to its next hop. To do so, routers maintain a routing table, in which they look up for a prefix of the destination address. The routing table associates an interface of the router to this prefix, and this interface is used to forward the packet. We explore here a new measurement method based upon distributed UDP probing to estimate this routing table for Internet routers.

Download

Multi-ego-centred communities

Maximilien Danisch, Jean-Loup Guillaume and Bénédicte Le Grand

in « Complex Networks », pages 76-111, H. Cherifi (ed), Cambridge Scholars Publishing, 2014

The community structure of a graph is defined in various ways in the literature: partition, where nodes can belong to only one community. This vision is unrealistic and may lead to poor results because most nodes belong to several communities in real-world networks; overlapping community structure, which is the most natural view, but is often very difficult to identify in practice due to the complex structure of real-world networks and the huge potential number of such communities; egocentered community structure which focuses on individual nodes’ communities and seems to be a good compromise. In this chapter, the third vision is investigated; a new proximity measure based on opinion dynamics is proposed to score and select nodes according to their proximity to a node of interest. We call it the carryover opinion. In addition to be parameter-free, the carryover opinion can be calculated in a very time-efficient way and can thus be used in very large graphs. We also go further in the idea of egocentered communities by introducing the new concept of multi-egocentered communities, i.e., focusing on the communities of a set of nodes rather than of a single node. A key idea is that, although one node generally belongs to numerous communities, e.g., friends, colleagues, family, a small set of appropriate nodes can fully characterize a single community. We also show how to unfold all egocentered communities of a given node using this notion of multi-egocentered community.

Download

Multi-ego-centered communities in practice

Maximilien Danisch, Jean-Loup Guillaume and Bénédicte Le Grand

Social Network Analysis and Mining, Springer, 2014, 4 (1), pp.180.

We propose here a framework to unfold the ego-centered community structure of a given node in a network. The framework is not based on the optimization of a quality function, but on the study of the irregularity of the decrease of a proximity measure. It is a practical use of the notion of multi-ego-centered community and we validate the pertinence of the approach on benchmarks and a real-world network of wikipedia pages.

Download

Applications collaboratives dans les réseaux dynamiques : applications aux réseaux de véhicules

Bertrand Ducourthial

Jeudi 17 avril 2014 à 11h, salle 25-26/101

Slides

Dans cet exposé, nous présentons des travaux récents portant sur la conception d’algorithmes répartis dans les réseaux dynamiques. Ces réseaux présentent des connexions éphémères et des voisinages instables. Les réseaux véhiculaires en sont un exemple emblématique. Dans ces réseaux, les algorithmes et protocoles classiques sont généralement inadaptés. Notre travail porte sur la conception d’applications réparties embarquées. Nous aborderons les études de cas suivantes : communication entre deux noeuds mobiles, entre un mobile et l’infrastructure, collecte de données, fusion distribuée de données. Nous présenterons les algorithmes, les expériences réalisées avec des véhicules sur route ainsi que des démonstrations.

Influence de la structure du réseau des mouvements de commuting sur la diffusion de la grippe

Ségolène Charaudeau

Jeudi 20 mars 2014 à 11h, salle 25-26/101

Slides

Au cours de ce séminaire, je vous présenterai le travail que j’ai réalisé durant ma thèse à l’UMRS 707 de l’INSERM sur l’influence de la structure du réseau complexe formé par les mouvements de commuting entre les villes française sur la propagation d’une maladie infectieuse, en utilisant l’exemple de la grippe. Les phénomènes de diffusion dans un groupe social, entre communautés ou individus, d’une maladie ou d’une information par exemple, sont influencés par la structure des contacts individuels entre ces entités: pour analyser ces phénomènes, des modèles basés sur des réseaux reproduisant la structure des contacts sont fréquemment utilisés. Dans le cas de la propagation de maladies infectieuses, plusieurs types de réseaux entrent en jeu: les mouvements de population quotidiens créent notamment un réseau complexe de contacts entre villes, dont la structure impacte la diffusion de maladies transmissibles par contact, telle que la grippe. Si cette influence a été abondamment étudiée pour les réseaux internationaux, notamment par l’étude des déplacements aériens, elle n’a que peu été analysée à l’échelle nationale et régionale. Durant mon travail de thèse, je me suis attachée à l’étude de la diffusion de la grippe sur le réseau formé par les mouvements de commuting en France et de ses propriétés, en lien avec la structure du réseau: pour cela, j’ai développé un modèle simulant la propagation de la grippe sur un réseau de contacts. Afin de lier les propriétés observées pour la diffusion à la structure du réseau, j’ ai mis en place des outils permettant de comparer la propagation obtenue sur le réseau de commuting et sur des réseaux randomisés. Cette analyse a permis de mettre en évidence l’existence de communautés de villes ayant un comportement de propagation similaire et de chemins de propagation préférentiels entre ces communautés. Elle a également permis d’analyser la structure de ces communautés, pour la plupart centralisées autour d’un groupe de nœuds qui assurent la communication avec les communautés environnantes.

Coala : Co-evolution Assessment by a Likelihood-free Approach

Catherine Matias

Jeudi 22 mai 2014 à 11h, salle 25-26/101

Dans cet exposé, je présenterai tout d’abord les problématiques de co-évolution et de co-phylogénie qui portent sur la modélisation de l’évolution conjointe de deux systèmes biologiquement liés (hôtes-parasites ou gènes-espèces). La réconciliation cherche à fournir un scénario explicatif de la co-évolution entre deux phylogénies (arbres) liés, en prenant en compte un certain nombre d’évènements évolutifs comme la co-spéciation, la duplication, la perte et le transfert. Des algorithmes de réconciliation parcimonieuse existent pour une fonction de coût (de chacun des évènements ci-dessus) fixée, mais le résultat est évidemment très dépendant du choix de cette fonction. Une approche naturelle est de choisir pour ces coûts des fonctions inversement proportionnelles à la probabilité de chaque évènement sous un modèle co-évolutif. Je présenterai une méthode statistique qui permet d’estimer les paramètres d’un modèle de co-évolution entre deux arbres et donc des fonctions de coût associées. Il s’agit d’une méthode de type ABC (approximate Bayesian computation) qui n’utilise pas le calcul de la vraisemblance du modèle (likelihood-free method). J’illustrerai les résultats de la méthode sur données simulées et réelles.    

Social Networks as a Trade-Off Between Efficient Information Transmission and Reduced Disease Transmission

Cédric Sueur

Jeudi 27 mars 2014 à 11h, salle 25-26/101

Slides

Network optimality has been described in genes, proteins and human communicative networks. In the latter, optimality leads to the efficient transmission of information with a minimum number of connections. Whilst studies show that differences in centrality exist in animal networks with central individuals having higher fitness; network efficiency has never been studied in animal groups. Living in groups has many advantages but it also involves certain disadvantages such as increased disease transmission and the need to make collective decisions. In theory, the social network properties optimizing decision accuracy and the spreading of information should also increase the disease transmission rate, creating a trade-off between decision-making efficiency and infection risk. We aim to explore this trade-off by examining social network properties and investigating how they might interact to maximize decision accuracy and minimize infection risk. We studied several groups of primates and found that group size and neocortex ratio were correlated with network efficiency. Centralisation (whether several individuals are central in the group) and modularity (how a group is clustered) had opposing effects on network efficiency, showing that tolerant species have more efficient networks. Such network properties affecting individual fitness could be shaped by natural selection affecting bot information and disease transmission. The main question of interest is how social network properties and individual attributes within this network effect separately and at the same time the diffusion of transmission (tested through opening of a fruit box as a proxy for information and social learning) and of disease (tested through pseudoectoparasites). Two parallel diffusion experiments, tracking the two different flows at the same time through the same individuals, will be carried out on Japanese macaques at the Koshima field site of Kyoto University, Japan. Ultimately, through an innovative experimental approach, this study aims at understanding the relative influence of different factors inherent in social-living, both cultural (innovation) and ecological (infectious disease), on human sociality.

Deep Tags: Toward a Quantitative Analysis of Online Pornography

Antoine Mazières

Jeudi 13 mars 2014 à 11h, salle 25-26/101

Lors de ce séminaire, je vous présenterai le projet Sexualitics.org, ainsi que le papier associé publié dans le premier numéro de Porn Studies (à paraître en mars 2014). La pornographie en ligne et ce qu’elle représente de la sexualité n’a que très rarement fait l’objet d’approche quantitative. En effet, la pornographieest étudiée à travers des questions de genre, du féminisme, de l’identité sexuelle et de sa mise en scène, par le biais d’interviews, de questionnaires, etc. Notre approche visait à prendre avantage des données disponibles sur les plateformes hébergeant les vidéos – principalement les mots-clés de 2 millions de vidéos – et reconstruire réseaux, communautés et indices divers à plus grande échelle. Parmi les réalisations de cette recherche, on peut trouver un réseau sémantique des « catégories » dont les communautés rassemblent des éléments de mise en scène, de pratique, de nationalité, raciaux, etc. La capacité descriptive de certaines de ces catégories est remise en question et un « nicheness score » est élaboré pour mettre en avant les catégories qui discriminent un contenu spécifique. Aussi, un outil en ligne – Porngram – permet à chacun de représenter la fréquence des mots de leur choix sur 5 années. Les datasets et code source des outils sont disponible en ligne. Aucune image à caractère pornographique n’est montrée lors de la présentation ou le papier. Néanmoins, des mots-clés explicites apparaissent fréquemment sur les visualisations et lors des explications. Site du projet : http://sexualitics.org Pre-print du papier : http://hal.archives-ouvertes.fr/hal-00937745 Datasets : http://sexualitics.github.io/ Porngram : http://porngram.sexualitics.org

Motifs Distribution in Exchangeable Random Networks

Pierre-André Maugis

Vendredi 28 février 2014 à 11h, salle 25-26/101

In this talk I will show how the relationship between the local and global characteristics of random graphs can be used for statistical inference. There exists a long history of research on graphs/networks as mathematical objects. However, the need for methods allowing for statistical inference based on network data is but recent, and was prompted by the current boom in available network datasets along with their relevance to research in the social and biological sciences. The problem we face, set in the classical statistical paradigm, consists in seeing the networks as issuing from a random process, and in trying to infer from the observed network some characteristics of the said random process. The difficulty is both theoretical and practical: we only observe one realisation of the network (where statisticians usually assume they have a large number of repeated measurements), and networks are large objects, easily involving millions of connections, which raises computational issues. Studying networks through the local characteristics that are motifs (e.g. triangles, squares, cliques, …) offers a solution to both problems at once. Motifs are small (and hence computationally amenable), and occur multiple times throughout the network. Moreover, as we will show, under the assumption of exchangeability one can relate the random process from which the network ensued and the distribution of realised motifs. Using these results we will describe how one can use motifs to produce sound statistical inference on network data. This is a joint Work with Sofia Olhede and Patrick Wolfe.

Reconstruction des dynamiques multi-échelles de la morphogenèse animale

Emmanuel Faure

Jeudi 20 février 2014 à 11h, salle 25-26/101

La reconstruction des dynamiques multi-échelles de la morphogenèse des organismes vivants est devenue un enjeu majeur pour la bio-médecine. Le développement dun organisme multi-cellulaire est le résultat de phénomènes biomécaniques multi-échelles complexes. Léchelle cellulaire est un niveau dintégration fondamental aussi bien pour létude de la biomécanique que pour les processus de réactions-diffusions. La plateforme BioEmergences vise à reconstruire les dynamiques multi-échelles de la morphogenèse des organismes et à mesurer les différences et les similitudes entre les individus, aux différentes échelles, tout au long de leurs individuations. Depuis les données dimagerie obtenues par acquisition en microscopie multi-photons jusquà la modélisation des comportements cellulaires par lapproche des systèmes complexes, nos travaux se situent dans un cadre intrinsèque dinterdisciplinarité. Mon approche théorique propose la thèse que la reconstruction du lignage cellulaire vue comme un processus de branchement spatio-temporel fournit l’ensemble des morphodynamiques cellulaires. Jaborderai notamment lors de cette présentation une stratégie de reconstruction phénoménologique du lignage cellulaire fondée sur des méthodes probabilistes. De plus, à partir de différentes analyses de comportements cellulaires, je montrerai un modèle computationnel du développement du poisson zèbre au cours des phases précoces de lembryogenèse, fondé sur lensemble des caractéristiques mesurées.

Analyse et modélisation des dynamiques socio-épistémiques des communautés scientifiques

Elisa Omodei

Jeudi 06 février 2014 à 14h30, salle 26-00/101

Comment les structures sociales et épistémiques dune communauté scientifique contraignent-elles les dynamiques de recherche à venir ? Nous avons analysé deux grands corpus de publications scientifiques décrivant plus de 20 ans de recherche dans deux domaines très différents : la physique et la linguistique computationnelle. Nous avons pu extraire un réseau social de collaborations entre auteurs et un réseau épistémique de co-occurrences entre les concepts abordés dans les articles (donnés par les codes PACS pour ce qui concerne la physique, et par des mots-clés extraits à travers des méthodes automatiques pour la linguistique computationnelle). Nous mettons notamment en évidence que le réseau épistémique a une structure modulaire et une distribution des degrés hétérogène. La structure en communautés peut sans doute être expliquée par des processus de sélection locaux. Un examen empirique montre que les dynamiques épistémiques locales dépendent aussi bien des structures sociales et épistémiques passées. De plus, nous montrons que lévolution du réseau social dépend également de facteur épistémiques, ce qui semble indiquer que les deux réseaux évoluent lun avec lautre.

Modélisation et analyse à base de graphes de citations de textes de loi : histoire d’une collaboration entre mathématiciens et juristes

Romain Boulet

Jeudi 23 Janvier 2014 à 11h30, salle 25-26/105

Slides

La complexité juridique est de plus en plus présente et débattue ; cette complexité possède plusieurs aspects dont celui induit par les (très nombreuses) citations croisées de textes : c’est l’aspect que nous modéliserons et analyserons dans cet exposé grâce à la théorie des graphes et l’analyse des réseaux. L’exposé commencera par une rapide introduction sur les graphes et réseaux et la présentation des problématiques liées aux sciences juridiques que nous aborderons. En particulier, le texte de loi sera vu à deux niveaux de granularité : le code et l’article. Dans un premier temps, nous analyserons donc le réseau des codes juridiques. Chaque code constitue alors un nœud du réseau et les liens sont les liens de citations de textes entre les différents codes. Bien que ce réseau possède un petit nombre de sommets, il n’en demeure pas moins difficile à appréhender de par son fort nombre d’arêtes (et donc sa forte densité). En considérant chaque code comme un grand domaine juridique et en parvenant à extraire une structure de ce réseau, nous pouvons exhiber une cartographie des grands domaines juridiques. Dans un deuxième temps, nous changerons d’échelle et de granularité : le texte de loi considéré (et donc le nœud du nouveau réseau) sera l’article au sein du code de l’environnement. Nous comparerons la structure du réseau de citations des articles du code de l’environnement avec la structure choisie par la commission supérieure de codification (découpage du code de l’environnement en sept livres). Romain Boulet est actuellement Maître de Conférences en mathématiques à l’Université Lyon 3 ; les travaux présentés ont été faits en collaboration avec Pierre Mazzega (Directeur de Recherche à l’IRD) et Danièle Bourcier (Directrice de Recherche au CNRS) de 2009 à 2012.

Le contrôle de la forme des réseaux par leurs membres : le fils de discussion comme réseau d’interaction

Bernard Conein (1) & Alexandre Delanoë (2)

Jeudi 09 janvier 2014 à 11h, salle 25-26/101

Slides

En proposant d’explorer comment, en envoyant un message sur une liste de discussion, un contributeur peut contrôler la forme du réseau dans lequel il intervient, on montrera quun fil de discussion peut se décrire comme un réseau de répliques dont lextension (nombre de messages, nombre de contributeurs) est gouvernée par des dynamiques de contrôle propre à certaines séquences d’interactions. Slides disponibles à l’adresse suivante : B. Conein :http://www.complexnetworks.fr/?p=1750 A. Delanoë : http://alexandre.delanoe.org/academie/docs/2014-01_DelanoeConein.svg

Detecting events in the dynamics of ego-centred measurements of the Internet topology

Matthieu Latapy, Assia Hamzaoui, Clémence Magnien

Journal of Complex Networks 2(1): 38-59, 2014

Detecting events such as major routing changes or congestions in the dynamics of the Internet topology is an important but challenging task. We explore here an empirical approach based on a notion of statistically significant events. It consists in identifying properties of graph dynamics which exhibit a homogeneous distribution with outliers, corresponding to events. We apply this approach to ego-centred measurements of the  Internet topology (views obtained from a single monitor) and show that it succeeds in detecting meaningful events. Finally, we give some hints for   the interpretation of detected events in terms of network operations.

Download

Inadequacy of SIR Model to Reproduce Key Properties of Real-world Spreading Phenomena: Experiments on a Large-scale P2P System

Daniel Bernardes, Matthieu Latapy, Fabien Tarissan

In Journal of Social Network Analysis and Mining, 3(4):1195-1208,Springer, 2013.

Understanding the spread of information on complex networks is a key issue from a theoretical and applied perspective. Despite the effort in developing theoretical models for this phenomenon, gauging them with large-scale real-world data remains an important challenge due to the scarcity of open, extensive and detailed data. In this paper, we explain how traces of peer-to-peer file sharing may be used to this goal. We reconstruct the underlying social network of peers sharing content and perform simulations on it to assess the relevance of the standard SIR model to mimic key properties of real spreading cascades. First we examine the impact of the network topology on observed properties. Then we turn to the evaluation of two heterogeneous extensions of the SIR model. Finally we improve the social network reconstruction, introducing an affinity index between peers, and simulate a SIR model which integrates this new feature. We conclude that the simple, homogeneous model is insufficient to mimic real spreading cascades. Moreover, none of the natural extensions of the model we considered, which take into account extra topological properties, yielded satisfying results in our context. This raises an alert against the careless, widespread use of this model.

Download

On the relevance of the edge-Markovian evolving graph model for real mobile networks

Aurélie Faure de Pebeyre, Fabien Tarissan et Julien Sopena

IFIP Wireless Days conference (WD’13), Valencia, Spain, 2013

The development of wireless devices led the scientific community to focus more and more on systems of interaction composed of moving entities. In this context, different models have been proposed in an attempt to capture properties of the observed dynamics. Among those models, the edge-Markovian evolving graph model is appealing since it enables to highlight temporal dependencies in the evolution of the graphs. This model relies on two parameters accounting respectively for the creation and suppression of links in the graph. Thus it assumes that these two parameters are sufficient to characterise the dynamics during all the evolution of the graph. In this paper, we test this hypothesis by confronting the model to 6 datasets recording real traces of evolving networks. In particular, we study the proportion of created and deleted links over the time. The results show that 5 of the 6 case studies present an heterogeneous distribution of those fractions which contradicts the underlying hypothesis of the model. Besides, in order to understand the importance this might have as regard structural properties of real networks, we also study the impact the Markovian model has on the mean degree over the time. It turns out that even in the suitable case, the model fails to reproduce correctly this property which indicates its inadequacy for even more complex properties of real evolving networks

Download

Détection de communautés recouvrantes dans des réseaux de terrain dynamiques

Qinna Wang

Jeudi 12 Décembre 2013 à 14h,salle 25-26/101

Slides

Dans le contexte des réseaux complexes, la structure communautaire du réseau devient un sujet important pour plusieurs domaines de recherche. Les communautés sont en général vues comme des groupes intérieurement denses. La détection de tels groupes offre un éclairage intéressant sur la structure du réseau. Par exemple, une communauté de pages web regroupe des pages traitant du même sujet. La définition de communautés est en général limitée à une partition de lensemble des nœuds. Cela exclut par définition quun nœud puisse appartenir à plusieurs communautés, ce qui pourtant est naturel dans de nombreux (cas des réseaux sociaux par exemple). Une autre question importante et sans réponse est létude des réseaux et de leur structure communautaire en tenant compte de leur dynamique. Cettethèseporte sur létude de réseaux dynamiques et la détection de communautés recouvrantes. Nous proposons deux méthodes différentes pour la détection de communautés recouvrantes. La première méthode est appelée optimisationde clique. L’optimisation de clique vise à détecter les nœuds recouvrants granulaires. La méthode de l’optimisation de clique est une approche à grain fin. La seconde méthode est nommée détection floue (fuzzy detection). Cette méthode est à grain plus grossier et vise à identifier les groupes recouvrants. Nous appliquons ces deux méthodes à des réseaux synthétiques et réels. Les résultats obtenus indiquent que les deux méthodes peuvent être utilisées pour caractériser les nœuds recouvrants. Les deux approches apportent des points de vue distincts et complémentaires. Dans le cas des graphes dynamiques, nous donnons une définition sur la relation entre les communautés à deux pas de temps consécutif. Cette technique permet de représenter le changement de la structure en fonction du temps. Pour mettre en évidence cette relation, nous proposons des diagrammes de lignage pour la visualisation de la dynamique des communautés. Ces diagrammes qui connectent des communautés à des pas de temps successifs montrent lévolution de la structure et l’évolution des groupes recouvrantes., Nous avons également appliquer ces outils à des cas concrets.

Method of reliability and availability analysis – From the dynamic properties of routing and forwarding paths

Dimitri Papadimitriou, Davide Careglio, Fabien Tarissan and Piet Demeester

Proceedings of the International Workshop on Reliable Networks Design and Modeling (RNDM’13), 2013 (Invited paper)

Confronted to the increasing dynamic of Internet routing system and its underlying topology, we propose a reliability and availability analysis method based on the characterization of the dynamic properties (in particular, the stability properties) of routing paths and their corresponding forwarding paths. The key driver underlying this method is that transient but frequent changes in the spatio-temporal properties of routing paths can affect the performance and operating conditions of the corresponding forwarding paths; hence, their reliability. The results obtained by means of this method verify that, although the main cause of instability results from the forwarding plane dynamics, a second order effect relates forwarding and routing path instability events. Applying our analysis method reveals that the dominant source (main cause) of instability originates indeed from the forwarding plane. This result which confirms previous studies from 2003 further corroborates the assumption that the dynamic properties of routing system are mainly driven by its adaptation to the forwarding system (adaptive routing). However, even if the likelihood of forwarding instability becomes the prominent behavior (cause), about 50% of them induce routing path instability whereas the corresponding forwarding path remains unstable. This observation suggests that 50% of the reactive decisions performed by the BGP routing system (reactive routing) tend to further delay convergence of the forwarding paths. In turn, this observation provides the first indication that simple causal effects can’t explain anymore the occurrence of instability. Moreover, more elaborated analysis techniques (such as the one proposed in this paper) are required to explain the inter-dependent routing and forwarding paths dynamics which affects their reliability and availability.

Download

Un modèle pour les graphes bipartis aléatoires avec redondance

Émilie Coupechoux and Fabien Tarissan

4ème Journées Modèles et l’Analyse des Réseaux : Approches Mathématiques et Informatique (MARAMI’13), 2013

Current models of random graphs do not capture all the properties observed in realworld networks. In particular, two cliques in such models generally do not have more than one node in common, while it is intuitive that, in social networks for instance, two friends have more than one interest in common. The model presented here aims at capturing this kind of property. More precisely, we present a model for random tripartite graphs such that the bipartite projection has degree and redundancy distributions close to those of a given bipartite graph.

Download