• xmlui.mirage2.page-structure.header.title
    • français
    • English
  • Help
  • Login
  • Language 
    • Français
    • English
View Item 
  •   BIRD Home
  • LAMSADE (UMR CNRS 7243)
  • LAMSADE : Publications
  • View Item
  •   BIRD Home
  • LAMSADE (UMR CNRS 7243)
  • LAMSADE : Publications
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Browse

BIRDResearch centres & CollectionsBy Issue DateAuthorsTitlesTypeThis CollectionBy Issue DateAuthorsTitlesType

My Account

LoginRegister

Statistics

Most Popular ItemsStatistics by CountryMost Popular Authors
Thumbnail - No thumbnail

Inférence de Schémas pour Données JSON Massives

Baazizi, Mohamed-Amine; Ben Lahmar, Houssem; Colazzo, Dario; Ghelli, Giorgio; Sartiani, Carlo (2016), Inférence de Schémas pour Données JSON Massives, 32ème Conférence sur la "Gestion de Données — Principes, Technologies et Applications" (BDA 2016), 2016-11, Poitiers, France

Type
Communication / Conférence
External document link
https://hal.archives-ouvertes.fr/hal-01502373
Date
2016
Conference title
32ème Conférence sur la "Gestion de Données — Principes, Technologies et Applications" (BDA 2016)
Conference date
2016-11
Conference city
Poitiers
Conference country
France
Metadata
Show full item record
Author(s)
Baazizi, Mohamed-Amine

Ben Lahmar, Houssem

Colazzo, Dario
Laboratoire d'analyse et modélisation de systèmes pour l'aide à la décision [LAMSADE]
Ghelli, Giorgio

Sartiani, Carlo
Abstract (EN)
Ces dernières années ont connu une large adoption de JSON en tant que format de représentation de données massives. Les données JSON sont généralement dépourvues de schémas puisqu'elles sont produites et gérées de manière flexible. Malgré cet avantage, l'absence de schéma présente de nombreux inconvénients : la correction des requêtes et des programmes ne peut être vérifiée de manière statique comme c'est la cas traditionnellement, les utilisateurs ne disposent d'aucun moyen le permettant de découvrir la structure des données sous-jacentes et, de manière plus générale, les techniques d'optimisations basées sur les schémas ne peuvent être appliquées.Dans ce travail nous nous intéressons à l'inférence de schémas pour des données JSON massives. Notre première contribution consiste à proposer un langage de types pour JSON permettant de représenter la structure complexe des données analysées. Notre seconde contribution concerne le développement d'un algorithme d'inférence distribué et de son implantation dans Spark afin de garantir une exécution efficace sur des données volumineuses. Les résultats obtenus suite à une première étude expérimentale permettent de conclure que notre approche est satisfaisant en terme de temps d'exécution et de concision de schémas inférés.
Subjects / Keywords
JSON

Related items

Showing items related by title and author.

  • Thumbnail
    Parametric schema inference for massive JSON datasets 
    Baazizi, Mohamed-Amine; Colazzo, Dario; Ghelli, Giorgio; Sartiani, Carlo (2019) Article accepté pour publication ou publié
  • Thumbnail
    Human-in-the-Loop Schema Inference for Massive JSON Datasets 
    Baazizi, Mohamed-Amine; Berti, Clément; Colazzo, Dario; Ghelli, Giorgio; Sartiani, Carlo (2020) Communication / Conférence
  • Thumbnail
    A Type System for Interactive JSON Schema Inference (Extended Abstract) 
    Baazizi, Mohamed-Amine; Colazzo, Dario; Ghelli, Giorgio; Sartiani, Carlo (2019) Communication / Conférence
  • Thumbnail
    Schemas And Types For JSON Data 
    Baazizi, Mohamed-Amine; Colazzo, Dario; Ghelli, Giorgio; Sartiani, Carlo (2019) Communication / Conférence
  • Thumbnail
    Schemas and Types for JSON Data: From Theory to Practice 
    Baazizi, Mohamed-Amine; Colazzo, Dario; Ghelli, Giorgio; Sartiani, Carlo (2019) Communication / Conférence
Dauphine PSL Bibliothèque logo
Place du Maréchal de Lattre de Tassigny 75775 Paris Cedex 16
Phone: 01 44 05 40 94
Contact
Dauphine PSL logoEQUIS logoCreative Commons logo