Browsing Tag

ereputation

VISIBILITE

Vie privée et données personnelles : état des lieux

En novembre, l’agence 50A lance « Le mois de la donnée personnelle » avec le hashtag #SaveMyData. Dans ce cadre, plusieurs thématiques sur le sujet seront développées tout au long du mois, afin de nous interroger sur le devenir de nos données personnelles à l’ère du numérique.

Ce premier chapitre nous dresse un état des lieux, concernant la divulgation de nos données personnelles et de nos vies privées sur Internet. Comment se manifeste-t-elle ? Comment est-elle perçue par les internautes ?

PREAMBULE

Depuis 1948, la protection de la vie privée est un droit fondamental garanti par l’article 12 de la Déclaration universelle des droits de l’Homme des Nations unies. En France, la loi du 17 juillet 1970  protège ce droit dans l’article 9 du Code civil.

Avec le développement de l’informatique, la loi du 6 janvier 1978 vient renforcer ce droit en créant la Commission nationale de l’informatique et des libertés (CNIL). Cette commission est chargée de « veiller à ce que l’informatique soit au service du citoyen et qu’elle ne porte atteinte ni à l’identité humaine, ni aux droits de l’homme, ni à la vie privée, ni aux libertés individuelles ou publiques. » Qu’en est-il aujourd’hui ?

LE POUVOIR DE LA CNIL FACE AU WORLDWIDEWEB

Email, chat, réseaux sociaux, moteurs de recherche, achats, cloud, soumission de formulaires … tout ce que vous faites sur internet via n’importe quel support est soumis à un stockage de données. Qu’elles soient payantes ou gratuites, les plateformes récupèrent vos données, les trient et les classent suivant différents critères. Votre pouvoir d’achat, vos goûts, vos habitudes, vos déplacements et vos opinions sont étudiés dans le but d’identifier des typologies d’individus et de comportements. L’exploitation de ces données sont tellement diverses qu’elle offre une infinité de possibilités.

En tant que commission nationale, la CNIL peut bien être reine en son territoire mais face au WorldWideWeb, elle n’est qu’une île noyée dans un flot d’informations qui lui échappe. Lorsque les usagers des transports publics se plaignent du pouvoir de la puce moucharde du Passe Navigo successeur de la Carte Orange, la CNIL intervient en amont dans l’intérêt des plaignants. Mais face à des titans tels que Google et Facebook, la CNIL attaque, porte plainte, sanctionne mais n’altère pas réellement le pouvoir qu’ils ont déjà acquis.

cnil-google

Google avait choisi de publier la condamnation par la CNIL sur sa page d’accueil (Février 2014)

 

INTERNET : JE T’AIME, MOI NON PLUS

Une étude CSA réalisée pour Orange en février 2014 sur le thème  «Les Français & la protection des données personnelles» révèle que 81% des Français sont très préoccupés par la protection de leurs données personnelles. Ces craintes qui se cristallisent sur les risques de piratage des données bancaires et d’usurpation d’identité.

L’étude affirme que les Français manifestent largement leurs inquiétudes sur l’ensemble des risques encourus sur internet :

  • Près de neuf interviewés sur dix jugent préoccupant les risques de piratage d’informations et de documents personnels (90% « Préoccupant ») ou de données bancaires (88%, dont 52% « Très préoccupant »).
  • Les personnes interrogées expriment plus spécifiquement des inquiétudes quant à la protection des enfants contre les risques sur internet (81%).
  • Parmi tous ces sujets, c’est bien le piratage des données bancaires (n° carte bancaire, RIB…) qui est perçu comme le plus sérieux : près d’un Français sur deux considère qu’il s’agit du risque le plus important (47%). »

Nos vies sont copiées dans des bases de données, nous le savons, mais internet est tellement ancré dans nos habitudes qu’il nous est devenu difficilement possible de ne plus  :

  • Trouver des informations sur les moteurs de recherche
  • Echanger avec nos amis sur les réseaux sociaux
  • Faire des bonnes affaires sur les sites commerciaux
  • Participer à la vie citoyenne via l’ OpenGouvernance
  • Développer notre identité numérique via le référencement
  • Evaluer nos performances avec le QuantifiedSelf
  • Rentabiliser nos biens sur les sites de ventes entre particuliers
  • Participer à des événements ou trouver l’amour sur les sites de rencontres

Ces actions permettent de dresser des profils très précis d’utilisateurs. La France a d’ailleurs mis en place en juillet 2015 la Loi sur le renseignement qui définit un cadre dans lequel les services de sécurité d’Etat sont autorisés à utiliser des techniques de recueil de renseignements dont la captation de données informatiques avec accès aux réseaux des opérateurs de télécommunications afin d’identifier des individus présentant « une menace terroriste. »
Une loi plébiscitée par 69% des Français selon l’étude du Parisien d’avril 2015.

 

Le thème de l’anonymat sur le net sera le sujet du prochain chapitre. Restez connectés !

A découvrir aussi :

#SaveMyData / Article 2 : Anonymat et sécurité informatique sur le net

#SaveMyData / Article 3 : Surveillance de masse, l’après attentat

DIGITAL

SEO + SMO = E-réputation, conseils d’un ancien

Nicolas, le druide de 50A, expert SEO, vous explique les enjeux du SEO et l’importance de sculpter son référencement !

Qu’est ce que le SEO ?

Le SEO, c’est l’art de se positionner dans les premiers résultats de Google : sur la première page, en première position!  C’est un ensemble d’optimisations et pré requis (HTML, texte …) qui amélioreront la visibilité de votre site ou de votre page dans les moteurs de recherches, ce qui permettra une meilleure compréhension du contenu de vos pages par les moteurs de recherches.

Pourquoi est ce obligatoire ? Quel est mon intérêt à sculpter mon référencement ?

« Il a plusieurs fois été démontré que les internautes vont rarement sur la deuxième page. »

Il est donc important de bien référencer ses mots clés pour se retrouver en première page et faire face à ses concurrents ! Il faut être visible ! »

C’est un des premiers moyens pour vous de trouver de nouveaux clients et faire du chiffre d’affaire.

Par ailleurs, cela va servir pour plusieurs pans de l’entreprises :

  • pour la partie développement commercial
  • pour la communication à travers l’e-réputation : les mots clés qui correspondent à votre activité, et, en priorité, le fait de vous trouver directement lorsque l’on tape le nom de votre entreprise dans Google
  • pour la partie ressources humaines : en étant bien positionné dans Google, vous aurez sans doute plus de réponses quant à vos recherches d’emploi ou de stage

CONSEILS : ce que les moteurs de recherches adorent …

Les moteurs de recherches adorent le contenu. Attention, on parle de contenu original. Si vous reprenez du contenu d’actualité et qu’il est dupliqué, il va perdre de sa valeur. Tandis que si vous créez du contenu original, et que vous êtes identifiés comme le producteur de ce contenu, c’est cette fraîcheur qui va permettre aux robots de vous donner une sorte de ranking supérieur, par rapport à une page pour le même mot clé. Il est important d’écrire du contenu de qualité, soigné, riche en vocabulaire.

« Les médias sociaux sont sources de trafic »

Ce qui fonctionne aussi, c’est la popularité, c’est-à-dire le nombre de liens qui pointent vers votre site ou votre page. Cela va du nombre de clics, aux checks in et mentions, les notes et avis, et les contenus générés par les internautes.

Aujourd’hui, les moteurs de recherches aiment les liens qui proviennent des
réseaux sociaux (Twitter, Facebook, Instagram …). Les médias sociaux sont sources de trafic et Google prend en compte les indicateurs de ces médias dans ses algorithmes. Il est donc bénéfique pour vous de promouvoir votre contenu sur ses pages pour une meilleure indexation. Les « like », le nombre de fans, le nombre de « share » vont avoir un impact sur le poids des liens. L’architecture de votre site est aussi un point à ne pas négliger. Si elle répond à des critères de validation et de qualité, cela va optimiser le positionnement.

CONSEILS : ce que les moteurs de recherches détestent …

A l’inverse, les moteurs de recherches détestent les pages lourdes, celles qui se répètent, qui ont des liens morts, ou des photos qui n’apparaissent plus.
Attention, à bien insérer les bons mots clés.

Il faut se mettre à la place des internautes, comme le souligne Matt Cutts, il ne faut pas écrire, « Mt Everest Height » mais « How high is Mt Everest ? » !

 

Quels sont les avantages à être accompagné ?

Cela passe par le SEO, le SMO, l’optimisation de ses médias sociaux.

« L’avantage de faire appel à des experts du SEO va être de pouvoir mettre en place une stratégie globale de visibilité. »

On peut aussi passer par l’achat de mots clés qui peut pallier à des impossibilités d’atteindre certaines requêtes en temps réel.

Il faut aussi définir l’ensemble de la nébuleuse du site du client, et faire un plan d’action. L’entreprise qui fera appel à un prestataire SEO sera coachée en mettant des indicateurs de performances (ex. : aujourd’hui, vous en êtes là avec tant de mots clés, et demain, nous arriverons à cet endroit en ayant 30% de plus). Cela va garantir de la performance et du suivi, ainsi qu’une bonne méthode d’implantation cohérente sur l’ensemble des supports.

 P.S : On a mis des mots clés dans le titre !

Interview de Nicolas
Rédigé par Alice
Pimenté par Louis et David

 

ARCHITECTURE SOCIALE DIGITAL VISIBILITE

eRéputation : un barcamp pour une définition.

Définition de la Ereputation
Définition de la Ereputation

Visuel Définition de la Ereputation

En prévision du BarCamp eRéputation du 11 février (save the date !), nous vous livrons une première reflexion sur une tentative de méthodologie de travail visant à définir l’e-Réputation.

L’eRéputation (ou e-Réputation, eReputation, mais aussi réputation numérique, réputation sur le Web, réputation en ligne, réputation sur Internet, cyber-réputation… etc) est nullement définie, ne mesure on ne sait trop quoi mais si chacun sent à peu près ce qu’il veut dire (et en a sa propre définition), l’eréputation n’est finalement, en ce début 2012, qu’un concept assez fourre tout. Cela reste dommageable, alors que de nombreuses entreprises se prévalent d’une maîtrise totale du concept par exemple.

Ce billet a pour objet d’essayer de définir le concept ou tout au moins, de faire le point sur la connaissance que l’on peut en avoir et de tracer des pistes de réflexion, notamment pour le BarCamp co-organisé par 50A.

Si nous essayons de définir l’eRéputation avec les outils classiques, une première difficulté s’impose à nous : la notion d’eréputation n’est pas présente dans le dictionnaire : voir par exemple dans le Trésor de la langue Française ou dans le Centre National de Ressources Textuelles et Lexicales. D’ailleurs, on ne sait pas très bien quand ce terme est apparu : en terme de trends, Google ne sait rien (et on en est désolé).

Si l’on cherche un peu mieux, il semble (d’après la wikipedia), que le terme soit apparu pour la première fois dans ce manuscrit de chercheurs qui s’intéressait à la notion de réputation sur internet à travers un marché d’actions en étudiant la réputation des vendeurs comme une variable indépendante du prix final :

« We investigate how seller reputation affects bidding activity in an Internet auction market. We find that bidders reward higher reputation sellers with higher prices. Sellers have incentive to invest in reputation despite noise due to the ability of participants to shed reputations using cheap pseudonyms and disincentives to report negative outcomes »

qui amène ce genre d’équation :

équation multivariables.

le cas d’Ebay est également passé en revue même si l’on ne parle pas encore de notation sociale.

Mais la publication ne parle pas encore de eReputation (en tout cas le terme n’est pas cité) : à ce stade, des publications prenant en compte la notion de réputation se trouve déjà en 1993 par exemple, avec les formes de contrats qui renforcent la réputation, et le premier terme est trouvé (par mes soins, en 2004), dans une publication du norvégien Erik Dagfinn Wisløff:

« Consider the ePharmacy once again. What is the value for the pPharmacy (physical pharmacy) of setting up an ePharmacy? Book value of the server, software and leased lines is probably not the real answer. I don’t think you will find a pot of gold by going by the replacement cost of the equipment either. eReputation is probably closer to the bull’s eye than a number crunching discounted cash flow what-if-analysis is. Sadly, there is no fixed and correct answer to the question. Finding the True Value is difficult. In my experience, a good operational risk analysis should try to explore a different line of reasoning in the Quest for True Value. »

Si on essaie de perséver dans cette voie de définition, et que Google ou l’étymologie ne nous aident pas mieux que cela, on peut essayer de se rapprocher d’autres champs sémantiques ou d’autres ontologies : la wikipedia justement, ne la définit pas mais renvoie vers la notion d’opinion qui lui même renvoie vers une forme de jugement. Et la notion de jugement, renvoie en droit, comme en philosophie soit vers une décision de justice (reposant sur un corpus de règles de droit) soit vers une pensée qui décide de la valeur d’une proposition. Hum.

Sur Slideshare, on trouve quelques documents intéressants qui en parlent. On peut citer le document multiauteurs coordonné par Aref Jdey. La wiktionnary propose cependant que la définition de la cyber-réputation (/si.b’ ?e.py.ta.sj’?/) soit la réputation d’une entité (personne physique ou morale, marque, produit) en fonction des traces la concernant, trouvables sur le Web.

Bref, nous ne sommes pas très avancé ! Car en fait qui dit « eRéputation » dit « mesure », et qui dit mesure dit « indicateur(s) ». Or, les « traces sur le web », ça renvoie aussi beaucoup de flou…

Si on s’intéresse désormais à la racine, ce qui considère à expliquer que l’eRéputation est une réputation électronique (au sens de ’email’ : e-mail : electronic mail), la réputation elle, est bien définie : la réputation vient étymologiquement du latin impérial ‘reputatio’, « compte, considération, examen, réflexion ». La réputation est définie comme la renommée ou l’idée commune que l’on se fait de l’entité considérée.

Il y a tout de suite comme une notion de subjectivité qui se met en place. C’est à priori gênant car il semblerait donc que la réputation de quelqu’un ne soit pas une donnée absolue mais bien ‘quelque chose’ interprétée via un prisme personnel, que nous essayons justement de définir. Et les prismes personnels sont à priori très complexes : ils sont construits à partir de notre culture, de notre histoire, ou de notre éducation.

Mais poursuivons, car il reste éventuellement à comprendre dans quelle mesure ce prisme personnel interfère avec une réputation absolue, pour peu qu’elle existe.

D’un point de vue religieux, nous ne sommes pas beaucoup aidé non plus : on ne trouve rien dans le Coran, (je n’ai pas cherché dans les Hadiths), et dans la Bible, les quelques passages concernant la réputation envisage surtout le cas de ces femmes non vierges qui de fait portent atteinte à la réputation de leur futur mari (Deutéronome 22:13-15), voire même la surveillance de magasin qu’il faut faire de façon correcte (Néhémie 13:13) ; Quant au Tao, il en parle comme d’une vanité (Chapitre 13).

Si l’on poursuit notre recherche plus avant, sémantiquement, re penchons nous vers le dictionnaire qui nous indique que la réputation est :

(A) une opinion favorable ou défavorable attachée à quelqu’un ou à quelque chose.
(B) Le fait d’être connu pour.
(C) Honorabilité, renommée de bonne moralité.
(D) Notoriété, renom qui affecte une personne ou une chose.

Bref, encore une fois, difficile d’extraire des indicateurs fiables, stables, pertinents, …

Essayons donc une démarche scientifique. Pour cela, on peut essayer une méthode qui a fait ses preuves et qui nous permet d’installer notre réflexion et notre travail dans un cadre connu, aux régles elles mêmes biens établies : la méthode hypothético-déductive.

Et nous pouvons décliner cette méthode en deux sous méthodes : la première est une démarche plutôt inférente (c’est à dire : constructive) afin de déterminer la forme du modèle et les paramètres. Le principe est simple : on indique quels sont les indicateurs (après les avoir trouvés) et il ‘suffit’ alors de les ‘agréger’ afin de déterminer le modèle qui régit l’eRéputation.

Par exemple, si l’on sait que l’influence ‘i’ vaut deux fois plus que l’expertise ‘e’ alors notre réputation sera une fonction du genre Erep = f(i,e) avec la propriété que f(i/2, 2e) = f(i,e). On peut donc commencer à chercher quelles sont les fonctions de plusieurs variables vérifiant cette propriété. Peut être tomberons nous aussi sur un os : il n’existe peut être pas de telles fonctions.

Pour cela, il faut donc chercher les indicateurs et indiquer comment ils interagissent entre eux pour donner le résultat final qui est l’eréputation.

L’autre sous méthode est plutôt de type rétro engineering : donner les indicateurs et les résultats, et cette fois ci il faut trouver la loi à partir des résultats : une fois le modèle posé, il faut alors régler les paramètres. L’idée ici est de poser comme hypothèse quelle est l’eréputation de telle ou telle personne puis de considérer quels réglages des paramètres il faut adopter pour que le modèle soit cohérent.

Pour résumer, nous essayons :

  1. de définir l’eréputation, puis
  2. de donner un sens à une fonction pour calculer l’eréputation effectivement.

Pour ce faire, on utilise une démarche scientifique que nous prenons par les deux bouts si besoin :

  • soit nous prenons les paramètres, nous indiquons quelle loi utiliser et nous avons notre fonction de calcul, qui permet de dire que CocaCola(c) a une meilleure eRéputation que Nutella(c).
  • soit nous indiquons quelle fonction de calculs utiliser, quels résultats nous devons obtenir, et nous en déduisons quels sont les paramètres à prendre en compte. (Influence, Notoriété, …)

Voila de quoi travailler pour ce Barcamp eRéputation programmé pour être hautement intellectuel ! A vos neurones ! Il reste encore quelques places…

Article rédigé par Vincent Pinte Deregnaucourt (Directeur de Recherche de la cellule R&D 50A)

ARCHITECTURE SOCIALE

Nettoyeur du net pour 9,90′ : une e-reputation au rabais?

Nettoyeur du net pour 9,90′ : une e-reputation au rabais?

Depuis quelques temps on voit fleurir dans la presse et sur la toile quantité d’articles à propos des « nettoyeurs du net ». S’il est vrai que le terme choisi vise surtout à vulgariser notre profession, on ne peut pas s’empêcher d’être agacé par certains raccourcis. 50A souhaite prendre la parole et rétablir un peu la vérité sur ce qu’on essaye de vendre au grand public. Continue Reading

ARCHITECTURE SOCIALE

De Klout à iBrain

Introduction :

La révolution du net a démarré quand on a pris conscience du lien social que pouvait générer l’outil. Depuis Twitter et l’apparition des premiers Hashtag on ne cesse de s’entre-référencer. L’implication de l’internaute sur la toile s’est ainsi développée à mesure qu’il se définissait par rapport à sa communauté. A tel point que l’existence même d’un internaute ne peut se définir qu’à travers son lien social. A quoi bon avoir une adresse mail si ce n’est pour échanger avec son entourage et rester informé de ce qu’il se passe ? Un compte Facebook ? Des abonnements aux flux RSS ?

C’est ce lien social, cette appartenance numérique à un groupe donné qui est aujourd’hui mesurée, compilée, quantifiée. Klout s’engage à mesurer cette e-réputation à grande échelle applicable pour tous, par tous et gratuitement. Si l’outil de mesure est sujet à de nombreuses critiques, il apparaît comme une suite logique de l’évolution des m??urs sur Internet.

L’analyse de données pour en tirer un contenu exploitable étant un virage inéluctable de la société online, 50A s’intéresse également de près aux nombreuses possibilités d’exploitation de l’information. L’agence en a fait son projet de R&D, je vous présente: iBrain

Qu’est-ce que Klout ?

Créé il y a deux ans à San Francisco, Klout (Clout=influence en anglais) a pour but d’analyser votre activité et vos interactions sur les réseaux sociaux. Les calculs se font par pondération entre l’étendu de votre entourage, le Klout score de ce dernier et l’interaction qui en résulte. Plus vous êtes actifs et plus vos interventions sont reprises et plus votre score (noté sur 100) sera élevé.

Par intuition digitale, Klout vous attribue un des 16 titres définis par une matrice qui analyse vos résultats selon:

– votre participation aux débats

– la création ou le partage de contenu

– sa spécialisation

– sa régularité

Ainsi on retrouve 16 profils:

 

Curator: Met en avant les influenceurs, trouve le meilleur contenu et le partage

Broadcaster: Diffuse l’info en grande quantité, est régulièrement RT, commenté…

Taste Maker: Suit les tendances mais sait également les créer

Celebrity: Tout ce qu’il dit est repris en masse, probablement une célébrité IRL

Syndicator: Sait ce qui est à la mode et suit activement les influenceurs. Permet à ses followers d’être tout de suite au courant de sujets précis

Feeder : Délivre des informations de qualité à propos de sujet précis

Thougt Leader : Influenceur dans son domaine, il reconnait les messages important et donne son opinion

Pundit : Fait plus que partager l’info, il la crée. C’est une référence dans son domaine

Dabbler : Débutant sur la toile, il partage peu

Conversationalist : Aime se tenir informé des infos « hot » et échange sur différents sujets

Socializer : Réactif, il aime partager ses découvertes avec son entourage

Networker: Sait connecter les bonnes personnes entre elles et partage les informations importantes

Observer: Ne partage pas beaucoup mais suit de nombreuses personnes pour se tenir au courant

Explorer: Très engagé sur le web social, il est toujours à la recherche de nouveaux moyens d’interagir et d’être en réseau

Activist: Défend activement une cause ou une idée

Specialist: Ce n’est pas une célébrité mais son opinion est la deuxième plus recherchée concernant un sujet en particulier. Followers très engagés.

Si vous êtes Justin Bieber par exemple, votre score flirt avec la centaine et vous êtes une Celebrity. Si, en revanche,  vous êtes plutôt du genre early adopter on vous retrouvera Specialist ou Pundit entre 50 et 70 et ainsi de suite en fonction de votre implication sur les réseaux sociaux.

D’abord calculé à partir de Twitter et Facebook, Foursquare, Instagram, LinkedIn, Youtube, Flickr, Blogger, Last.fm et Tumblr sont vite venus rejoindre les rangs des réseaux sociaux à quantifier. Suivi tout récemment par Google + qui devrait rapidement se faire une place dans la Kloutosphère.

Vers un Klout Casting ?

A partir d’une influence laborieusement acquise avec le temps pour se créer un nouveau lien social, on en vient à mesurer son taux « d’influençabilité ». Quel intérêt peut-il y avoir à quantifier et classer les influenceurs ? Jusqu’ici on avait pu bénéficier par exemple du PeerIndex, moins sexy, ou de la WikioMap pour repérer les blogs les mieux fréquentés et en déduire une certaine influence sur les communautés.

Aujourd’hui, c’est avant tout pour des raisons marketing assez évidentes que Klout sort son épingle du jeu. Avec l’intérêt croissant des marques pour leur e-réputation, Klout est un merveilleux indice de notoriété quand il s’agit aux community manager de justifier leur choix envers tel ou tel influenceur.

Spotify et Subway y ont déjà eu recours en permettant aux meilleurs influenceurs de bénéficier d’invitations et de promotions, les perks, réservées à ceux dont les scores étaient par exemple supérieurs à 50 ou 60.

Que vaut-il ?

Qu’en est-il cependant de la légitimité que l’on peut accorder à un tel classement ?

S’il est vrai qu’une batterie de lignes de code et d’équations ont été nécessaires pour réaliser un classement si vaste avec autant de données, rien n’est exprimé quant aux valeurs données aux outils de mesure. Un RT est-il plus influent qu’un nouveau badge sur Foursquare ? Qui du Instagram shot ou du +1 rapporte le plus de points ? Pour le moment, et probablement pour des raisons historiques, Twitter conserve la première place dans le classement des actions les plus rentables.

Klout est donc un nouveau moyen de se classer et de se positionner les uns par rapport aux autres. Si l’intérêt semble évident pour faire émerger les plus grands influenceurs d’un domaine précis, son champ d’action est vite restreint dans les faits puisqu’il ne s’applique exclusivement qu’au classement. Outils de comparaison donc pour les professionnels et les internautes en mal d’ego, la dérive du classement devient l’obsession du positionnement, et, à raison, la participation inconsciente ou non à la compétition. On sait aujourd’hui les bienfaits d’un tel modus operandi dans le milieu professionnel et particulièrement sur les employés de certains grands groupes.

Le paysage virtuel change, il évolue constamment. Chaque nouvel appareil amène son lot de nouveaux logiciels, applications, plus puissants, plus précis et répondant à quantité de nouveaux besoins créés pour l’occasion. On s’imprègne de plus en plus de cette technologie, omniprésente, pour interagir les uns avec les autres, communiquer davantage et plus loin. Et s’il était temps de tout mettre en commun ?

Aussi critiquable soit Klout, « la référence de l’influence » a ouvert la question d’une nouvelle tendance, l’interaction de données, ou l’extraction d’informations afin de créer du contenu.

Avec la dispersion des informations, il fallait envisager toutes ces connaissances perdues et leur redonner une structure, un lien.

Chez 50A, cela fait maintenant un an que nous travaillons sur la question. Spécialisée dans le domaine des réseaux sociaux, l’agence s’est véritablement tournée vers la compréhension et la maîtrise des data. Inférence et probabilités bayésiennes, Datamining, Corrélation sémantique, la grande Aventure scientifique avait commencé !

Nous sommes en effet partis d’un postulat simple : la création de contenu à partir des données laissées sur le net. De là, est naît le projet iBrain : une machine ou entité qui permette d’aller chercher des infos sur différents réseaux sociaux ou sites internet (blog, forum), de les consolider et d’en produire de nouvelles à partir de données différentes déjà existantes.

Dans les faits, iBrain permettrait de consolider un avis. Par exemple avec un docteur : il pourra dire au patient si il a trop fumé ou si il n’a pas pris soin de sa santé grâce aux diffférents tweets ou messages provenant du malade et permettrait d’en conclure ce qu’il faut changer dans son comportement.

Un premier état de l’art nous a vite confirmé qu’un tel projet était une véritable innovation pour le net et sa compréhension.  Au vue des nombreux obstacles d’ordre mathématiques, technologiques et informatiques il nous a fallu demander de l’aide auprès de spécialistes.

C’est ainsi que nous avons crée le département de R&D 50A

Pourtant plus à même de travailler avec des groupes tels Thales ou Orange France Telecom, iBrain a décroché un partenariat avec le CNRS et l’UTC de Compiègne !

L’UTC et un de ses laboratoires, (HEUDIASYC, une Unité Mixte de Recherches CNRS 6599), qui travaillent sur les mêmes idées ont soumis la participation à la thèse CIFRE ayant pour titre : « Système d’analyse de systèmes sociaux : extraction et gestion d’informations pour l’élaboration d’un système multidimensionnel de connaissances corrélées ». Pierre Morizet, chercheur au CNRS, a immédiatement adhéré au projet. L’idée a également séduit de nombreux autres laboratoires  qui voulaient collaborer.

En se lançant dans un tel projet on passe par différentes sciences ou techniques comme les mathématiques, ou le traitement automatique du langage (TAL)

Pour fonctionner, iBrain s’appuie sur 7 grand groupes de données afin d’affiner ses choix :

  1. Les réseaux sociaux qui impliquent les liens relationnels publics et privés
  2. L’information pure au travers de sites d’informations liés à l’actualité ou thématique avec les blogs
  3. Les données privées : vos saisies sur simplenote ou agenda éléctronique par exemple
  4. Les données librements disponibles comme l’Open Data
  5. Les données à but commercial diffusées sur Foursquare, Nomao ou Pages Jaunes
  6. Données diverses
  7. Les données issues des logiciels de Quantified-self seront aussi exploitable mais encore en développement.

En exploitant toutes ces informations, nous avons repéré trois principales difficultés, autant d’étapes dans la réalisation du projet :

  1. La gestion des données et des informations en dépit des contraintes d’utilisation inhérentes à l’outil. Se connecter à 18h sur Twitter et remonter la timeline jusque 9h avec une centaine de followers actifs est impossible par exemple.
  2. Comprendre l’information dégagée à partir de données brutes. Comment exploiter et stocker différentes informations quelque soit leur provenance et en définir une corrélation ?
  3. Enfin, traduire ces informations retravaillées en un discours utile auprès du consommateur final

Il faudra du temps à 50A pour qu’iBrain soit viable, l’agence digitale s’est prévu 3 ans pour mettre au point son projet de R&D. D’ici là, alors que nous entrons déjà dans l’ère des technologies 2.5, iBrain sera à même de rivaliser avec les logiciels 3.0 : l’aventure vers l’intelligence artificielle continue !

Welcome dans le monde de la DATA et de l’influence !!