1 – FORMATION sur 6 mois

La formation DATA STRATÉGIE comprend 3 parties, composées de plusieurs modules, 18 au total (Cf. tableau “Blocs de Compétences” ci-dessous) :

Partie A

“Appréhender les STRATÉGIES”

Partie B

“ORGANISATION des ressources et des outils”

Partie C

“MANAGEMENT des projets”

Ces 3 parties représentent 60% de la note finale du diplôme.

2 – PROJET de fin de diplôme

Chaque stagiaire prépare un dossier technique sur un projet stratégique combinant des données scientifiques, des analyses et des publications sur une plateforme.

Le projet doit mettre en évidence, outre les modalités de construction de la plateforme, les objectifs de valorisation des données qui sont poursuivis (valorisation industrielle, économique, sociale, résultats de politiques publiques, mises en œuvre de brevets).

Ensuite, le projet décrira les résultats attendus : plan de développement quantitatif et qualitatif de ces résultats.

Le projet sera soutenu après 3 mois devant un jury international constitué à partir du corps enseignant du DU Data Stratégie.

Des « prix de projet » (innovation, qualité, management) seront décernés après soutenance des projets.

Ce projet représente 40% de la note finale du diplôme.

BLOCS DE COMPÉTENCES

Modules

Objectifs

1. Concevoir la mutation numérique de la science : partage et valorisation des données

Enseignant : Renaud Fabre

Durée : 8 heures

Entrer dans le sujet avec une vue stratégique construite des enjeux publics et d’entreprise de l’ouverture des données de la science, mais également des conditions nouvelles à réunir à l’amont dans la publication, le stockage et la diffusion des données publiques. Définir le “marché” : connaitre les ordres de grandeur des projets numériques de la science publique (participants, disciplines, journaux, enjeux économiques…). Analyser les principaux dispositifs français et européens, les législations, les chantiers en cours, en débouchant sur une connaissance construite du cadre et des objectifs de la valorisation des données scientifiques numériques. La première séance s’effectue en présence de la plus grande partie possible du corps enseignant du diplôme.

2. Entrer dans l’ère de la data : droit et stratégie

Enseignant : Alain Bensoussan

Durée : 8 heures

La science comme de nombreux secteurs s’inscrit dans un contexte global de révolution numérique. Big data, open data, robotique, intelligence artificielle, machine learning, réseaux neuronaux sont autant de technologies innovantes dans lesquelles les données sont la matière première. Aucun pays dans le monde n’a créé un droit de propriété sur les données. Or, la donnée est valeur, elle est stratégique. Quels sont les modèles conceptuels, juridiques, stratégiques envisageables sur de la donnée ? L’analyse comparée des évolutions sectorielles dans le monde permet d’établir des tendances juridiques et stratégiques.

3. Évoluer dans les publications et données scientifiques numériques : enjeux et méthodes de la métrique

Enseignant : Daniel Egret

Durée : 8 heures

L’approche numérique des savoirs se fonde sur des catalogues globaux qui répertorient les articles publiés dans 25 000 journaux scientifiques et rédigés par 2 millions d’auteurs qui utilisent les vocabulaires et règles de publications propres à leur discipline. Le traitement de ce gigantesque corpus évolue très rapidement, tout comme les services associés aux usages de ces bases, que ce soit pour l’exploration des connaissances ou pour l’évaluation de la production scientifique. Ces “gisements” peuvent faire l’objet de stratégies d’exploitation différenciées par leur qualité, leur fiabilité, leur impact sur la recherche et sa valorisation.

4. Comprendre comment data-ingénieurs, analystes et développeurs travaillent la donnée, pour collaborer plus efficacement avec eux

Enseignant : Louki-Géronimo RICHOU

Durée : 8 heures

Les nouvelles pratiques des données couvrent des champs très étendus. La majorité des entreprises et administrations en ont un besoin quotidien, souvent très intégré à leur business model. Le rôle des « spécialistes » de la data (ingénieurs, analystes, développeurs, programmeurs) occupe une place croissante, jusqu’à être indispensable à la vie de tout l’environnement de travail. Les « généralistes » (cadres de direction, responsables RH, commerciaux, marketing, communication) ont donc un besoin accru de comprendre comment fonctionnent ces « spécialistes » ; ce qu’ils font, comment, avec quels outils. Sans être une initiation à la programmation à proprement parler, ce module donnera aux élèves la possibilité de mieux saisir le vocabulaire spécifique à la data, et d’envisager plus sereinement et plus efficacement leurs relations avec leurs collaborateurs spécialisés.

5. Définir et afficher les compétences requises pour les projets scientifiques numériques

Enseignant : Pierrette PAILLASSARD

Durée : 4 heures

Les données de la recherche sont au cœur de la science ouverte : quelles sont-elles ? Pourquoi s’interroger sur leur gestion et leur préservation ? A quoi sert un Data Management Plan ? Pourquoi rendre ses données de recherche FAIR (Findable, Accessible, Interoperable, Reusable) ? Autant de questions auxquelles nous tenterons de répondre ensemble en alternant apports théoriques et ateliers pratiques.

Validation

  • Présentiel / ressources en ligne
  • Espace partagé avec documents de références
  • Vidéo mise en situation

Compétences acquises

Conception, construction de cadres légaux et contractuels de production et de valorisation de connaissances partagées

Modules

Objectifs

6. Maîtriser l’usage du droit numérique des données : nouvelles règles, nouveaux enjeux
Enseignant : Marie SOULEZ
Durée : 4 heures

La mise en place d’un projet data suppose, en amont, de maîtriser les cadres légaux et règlementaires susceptibles de s’appliquer aux données scientifiques à l’ère du numérique. L’effervescence du numérique depuis des années, et les évolutions de la règlementation a fait naître de nouveaux enjeux, notamment de stratégie juridique, pour la protection et la valorisation des données scientifiques : identification des données, édition, publication, sources, éthique du chercheur, action en contrefaçon, respect de la paternité du travail, réutilisation des données, rôle des intelligences artificielles… Il est donc nécessaire, dans le cadre de ce diplôme universitaire, de donner les outils juridiques à la compréhension de ces nouveaux enjeux.

7. Co-intégrer et mettre en œuvre les démarches numériques du travail de la science : journée d’actions d’applications et d’analyse (TDM, Recherche d’information, Bibliométrie)
Enseignant : Patrice BELLOT
Durée : 4 heures

Co-intégrer les principaux outils numériques de la science (Fouille de textes et de données TDM, Analyse de contenus, Recherche d’information et recommandation de lectures, Bibliométrie alternative…) nécessite une vue d’ensemble et des disciplines nouvelles qui, toutes ensemble, constituent les bases de travail de la science à l’heure numérique. Cette journée prendra ainsi la dimension d’une transition vers le choix d’un projet et vers la réalisation effective des enseignements du DU, dans des configurations diverses de projets qui ont tous en commun de produire et/ou de valoriser des données de la recherche.

8. Maîtriser l’usage analytique des données : acteurs et principes

Enseignant : Vincent GIACOBBI

Durée : 8 heures

Les données issues des usages privés et publics constituent l’amont de toutes les valorisations, publiques et privées, dans des conditions d’évolution forte des pratiques, des normes et standards de partage. Ceux qui maîtrisent aujourd’hui l’analyse de ces vastes ensembles de données, impénétrables à l’œil nu, ont entre leurs mains une ressource tant économique qu’anthropologique immense. Ce module vise à étudier les principaux acteurs de l’analyse des données, et la stratégie que la puissance publique tente de mettre en place dans le contexte où la stratégie des acteurs privés est déjà bien définie et puissante.

9. Concevoir, construire, explorer, interpréter les corpus de textes et de données: le TDM scientifique en action

Enseignant : Claire NEDELLEC

Durée : 4 heures

Les possibilités croissantes d’accès aux sources documentaires rendent pressante la mise en oeuvre de moyens automatisés pour extraire automatiquement des informations, les structurer et les intégrer avec d’autres sources d’information. La description des informations par des référentiels partagés en facilitent l’accès, la réutilisation, la mutualisation et l’interopérabilité de leurs analyses. Le text-mining grâce aux évolutions récentes des méthodes de l’intelligence artificielle rend possible le développement de nouveaux services sémantiques pour des besoins spécifiques en réduisant l’effort d’adaptation. Ce module vise à donner des éléments de compréhension des enjeux et méthodes du text-mining dans le cadre de la “FAIRisation” des données.

10. Définir et mobiliser les services numériques d’appui à la science

Enseignant : Emmanuelle JANNES-OBER

Durée : 4 heures

La variété des services à la recherche est fonction des évolutions technologiques et des pratiques de la recherche ; elle est aussi fonction de spécificités disciplinaires ou thématiques et parfois de spécificités locales qui doivent devenir compatibles avec les besoins de mutualisation et de convergence tant au niveau européen que national où l’interopérabilité et la complémentarité des dispositifs d’appui est désormais une nécessité.

L’association EPRIST offre une démarche originale de vision stratégique de l’information scientifique et technique par un partage d’expériences l’échelle de tous les organismes de recherche, et contribue à l’élaboration d’outils communs au sein de l’ESR pour accompagner la science à l’heure numérique, tout en apportant sa pierre dans le processus d’élaboration d’une IST nationale

11. La data et les nouvelles technologies

Enseignant : Sébastien Fanti

Durée : 4 heures

La data est une matière première notamment pour les outils de traitement de la donnée, mais également une création en tant que contenu généré par les utilisateurs. Ce module propose un tour d’horizon de la data dans les nouvelles technologies, de leur qualification et de leur régime juridique.

Validation

  • Présentiel / ressources en ligne
  • Espace partagé avec documents de références

Compétences acquises

Conduite de projets sur plateformes intégrant les services numériques aux comportements et règles numériques : principes, phases et conditions de construction

Modules

Objectifs

12. Droit positif et prospectif de l’IA

Enseignant : Jérémy Bensoussan

Durée : 4 heures

A un certain niveau de sophistication technique, les traitements de données relèvent du champ de l’intelligence artificielle (IA). Les frontières techniques de cette discipline sont dynamiques, ce qui constitue un défi pour sa régulation et sa pérennité dans le temps. La régulation de l’IA se trouve aux confluents de plusieurs corpus normatifs et éthiques. Elle a pour base commune le droit de la donnée – lui-même protéiforme (e.g. droit des données personnelles, des données industrielles, de l’open data) – auquel il faut adjoindre la réglementation spécifique à une technologie ou à une situation données (e.g. reconnaissance faciale, drone aérien civil, voiture à délégation partielle ou totale de conduite) et l’ensemble du droit commun pertinent (e.g. régime de responsabilité). L’Union européenne, dans le sillage d’une réflexion éthique de plusieurs années, formalise actuellement plusieurs projets de règlements qui, comme pour celui sur les données personnelles (RGPD), sont susceptibles de devenir des standards et voir leur champ d’application, par effet d’adhérence, dépasser les frontières communautaires. L’impact sociétal de l’IA – e.g. médecine, justice, mobilité – s’intensifie à mesure que la mixité homme-machine se généralise. Dans ce contexte, le droit demeure une valeur refuge tant pour les utilisateurs (objectif de protection) que pour les acteurs privés et publics (objectif de prévisibilité) qui n’a pour l’heure pas d’équivalent

13. L’entreprise et la stratégie data : démarches, méthode, projet

Enseignant : Gontran PEUBEZ

Durée : 4 heures

14. Droit de la data : quelques spécificités

Enseignant : Julia PETRELUZZI

Durée : 4 heures

15. Droit de la propriété intellectuelle et données

Enseignant : Arnaud Latil

Durée : 8 heures

Ce module porte sur l’étude des techniques juridiques de réservation des données par les droits de propriété intellectuelle (droit des bases de données, droit d’auteur, brevet) et par le droit des obligations (contrat, responsabilité civile, secret des affaires).

Cet enseignement traite aussi des limites apportées aux techniques de réservation des données, tant à travers le droit de l’accès aux données publiques, le droit de la concurrence et, plus généralement, par la reconnaissance récente de la liberté de circulation des données.

16. Fiscalité des investissements de la recherche et du numérique

Enseignant : Sophia Hamoudi-Riche

Durée : 8 heures

17. Concevoir et Maitriser les dispositifs de partage et de  gestion des données 

Enseignant : Paolo LAI

Durée : 12 heures

La conception et la réalisation des logiciels et infrastructures de données est le vecteur opérationnel de tous les projets numériques actuels de valorisation des résultats scientifiques. L’Institut de l’Information scientifique et Technique (INIST) du CNRS développe vers toute la recherche une offre de services qui atteint sa maturité. Le Module 9.B présentera cette offre et initiera les stagiaires, sur deux jours, aux modalités opérationnelles de ces outils stratégiques décisifs pour les nouveaux projets.

Validation

  • Présentiel / ressources en ligne
  • Espace partagé avec documents de références

Compétences acquises

Conduite de projets à base de données de recherche : règles et pratiques de valorisation des données et résultats scientifiques

Modules

Objectifs

18. Outils et usages numériques d’accompagnement du travail de la science : quelles directions de développement pour la valorisation et le partage des données ?

Enseignant : Joachim Schöpfel

Durée : 4 heures

Le module présentera une analyse des évolutions en cours des dispositifs pour le partage et l’archivage des données de recherche. Quels sont les enjeux actuels et à venir ? Quelles sont les développements prévisibles et quels en sont les déterminants ? Quels sont les facteurs-clés de succès, quels sont les risques ?

SUPERVISION DE PROJET Durée : 3 mois (septembre à décembre 2021) Suivi et appui à l’élaboration des projets individuels

Enseignants : Laurent Bouvier-Ajam, Renaud Fabre et experts A, B, C

RAPPORT DE PROJET / REMISE DE DIPLOME

(décembre 2021) Validation par un jury international. Remises de prix sur la méthode et l’innovation.

Validation

  • Présentiel / ressources en ligne
  • Espace partagé avec documents de références

Compétences acquises

Réalisations appliquées de stagiaires du DU en situation d’intervention : encadrement international et national dans l’industrie comme dans les laboratoires publics. Jury des projets, valorisation des résultats