Thèmes

travail valeur données data bigdata formalisation simulateur message image centerblog belle autonomie

Rubriques

>> Toutes les rubriques <<
· Conférences (64)
· Compression de l'information (3)
· Veille Cyber LG (120)
· Publications (42)
· Interview (34)
· Intelligence Artificielle (31)
· Cyberdéfense (34)
· Robotique (31)
· Echo Radar (10)
· Hacking (20)

Rechercher
Derniers commentaires Articles les plus lus

· Compresser pour règner - Acte II/III
· Voir ou revoir « Cosmos » de Carl Sagan
· ProtonMail, le compte en Suisse
· Sea Hunter, le navire autonome qui révolutionne l'US Navy
· Université de la Singularité - Rapport d'impact 2014

· Eugène Goostman : « Ray Kurzweil m'a tué ! »
· La grenouille et le scorpion
· Conférence IANP2019 : J-7
· Polytechniciens sous la mitraille - Dossier EchoRadar
· Colloque "La donnée n'est pas donnée" 23 mars 2015
· Revue Diplomatie - Géopolitique du Cyberespace
· Jean Pic de la Mirandole : du libre arbitre à la modernité
· Interview Acteurs Publics Cyber et Territoires FIC2019
· RGN FIC 2018 Hyperconnexion et résilience
· Cloud souverain et cybernationalisme

Voir plus 

Abonnement au blog
Recevez les actualités de mon blog gratuitement :

Je comprends qu’en m’abonnant, je choisis explicitement de recevoir la newsletter du blog "cyberland" et que je peux facilement et à tout moment me désinscrire.


Statistiques

Date de création : 30.08.2013
Dernière mise à jour : 22.07.2021
541 articles


Les blogs EchoRadar :

CYBERSTRATEGIE Est-Ouest

EGEA

ELECTROSPHERE

LE CHARDON

LE FAUTEUIL DE COLBERT

LIGNES STRATEGIQUES

SECURITE DES SYSTEMES JURIDIQUES

SI VIS PACEM

DIAPORAMA

La valeur des données

Publié le 13/03/2014 à 23:38 par cyberland Tags : valeur données data bigdata formalisation simulateur message image centerblog belle
La valeur des données

 

 

 

 

A l'heure des technologies Big Data, des illusions d'anonymat dans le cyberespace, des polémiques  «  Snowdéennes » sur la captation et le vol de données, une question presque naïve émerge bien naturellement  : « Quelle est la valeur d'une donnée ? ».

Soyons d'abord un peu précis car cette question n'a pas le même sens lorsqu'elle est posée par un étudiant en mathématiques qui cherche à résoudre un problème et qui a besoin de la valeur d'une donnée pour terminer un calcul numérique.

La question mieux formulée devient donc « Que vaut, en euro par exemple, une donnée numérique ou non, disponible à la consultation ? ».

C'est plus explicite mais est-ce suffisant ?

Pas tout à fait car je comprends vite que la valeur d'une donnée peut être extrêmement volatile et qu'il faut l'observer comme une valeur instantanée Val T(D) où T désigne la variable temporelle.

Pour illustrer cette forte dépendance au temps et cette volatilité parfois extrême, il me suffit d'évoquer une belle opération de hacking réalisée il y a peu par l'Armée Syrienne Électronique (SEA), groupe de hackers et soutenant le régime syrien de Bachar al Assad.

Le 24 avril 2013, la SEA attaque le compte Twitter de l'agence Associated Press (AP), en prend momentanément le contrôle et publie à 13h07 le message D (comme donnée) suivant :

 

D = « Une explosion a eu lieu à la Maison Blanche, Barack Obama est blessé ».

 

600x302_tweet-AP-hacking.jpg

 

 

Les 1,9 millions d'abonnés au compte Twitter de AP ont reçu le message envoyé par la SEA.

La réaction des marchés a été presque immédiate : entre 13h08 et 13h10, l'indice principal de Wallstreet, le Dow Jones (DJIA) perd 145 points soit l'équivalent de 136 milliards de dollars (105 milliards d'euros) ; Microsoft, Apple, Mobil perdent plus de 1% en quelques minutes.

Quelques minutes plus tard, AP reprend le contrôle de son compte Twitter et publie immédiatement un tweet annonçant que le message précédent est un faux et qu'il résulte du piratage de son compte.

A cet instant, l'indice Dow Jones remonte avec l'ensemble des valeurs qui venaient de chuter et reprend son cours normal. Les réactions des marchés « sous la seconde » résultent de l'activité HFT (Trading Haute Fréquence) , des algorithmes de trading automatisés qui fonctionnent sous la milliseconde et qui réagissent aux messages D de façon autonome.

 

Quelle est la morale de cette petite histoire ? :

Ma donnée D possédait une valeur V1 à l'instant T1 potentiellement élevée à 13h08 (puisqu'elle a fait chuter le marché de 136 milliards de dollars) et une valeur V2 = 0 à l'instant T2 ,quelques minutes plus tard, lorsque l'agence AP a repris le contrôle de son compte et a « tué » cette donnée.

 

La variable temporelle est donc nécessaire dans la formulation de la valeur d'une donnée.

 

Mais ce n'est pas encore suffisant !

 

Il manque en effet deux ingrédients pour commencer à cerner le problème.

Le premier de ces ingrédients est le contexte que je noterai C (j'aime bien formaliser...)

Il s'agit du contexte dans lequel la donnée va être interprétée puis exploitée (par exemple, le contexte des salles de marchés)

Le second ingrédient est l'algorithme qui va traiter et/ou interprèter la donnée brute D.

Je note A cet algorithme qui en principe est lié au contexte.

 

Ainsi, la valeur de ma donnée D dépend de l'instant T, du contexte C et de l'algorithme qui va interpréter cette donnée.

Ce qui me donne, en bon français :

 

V = Val T(D / C , A)

 

et qui peut se lire comme la valeur de la donnée D à l'instant T selon le contexte C et l'algorithme d’interprétation A.

 

Passons maintenant à des considérations plus concrètes :

 

Le 12 juin 2013, le Financial Time a mis en ligne un simulateur qui permet de calculer la valeur de certaines de vos données.

 

On peut utiliser le simulateur du FT à cette adresse et faire des tests parfois déconcertants, toujours révélateurs et instructifs, avec les données que l'on fournit...

 

 

http://www.ft.com/cms/s/2/927ca86e-d29b-11e2-88ed-00144feab7de.html#axzz2vsSCPoWz

 

Bonnes simulations !