Show simple item record

dc.contributor.authorNguyen, Benjamin
HAL ID: 6858
dc.contributor.authorDudouet, François-Xavier
HAL ID: 742309
ORCID: 0000-0002-4025-3489
dc.contributor.authorColazzo, Dario
dc.contributor.authorVion, Antoine
HAL ID: 2733
ORCID: 0000-0002-5672-7909
dc.contributor.authorManolescu, Ioana
HAL ID: 742652
ORCID: 0000-0002-0425-2462
dc.contributor.authorSenellart, Pierre
HAL ID: 11778
ORCID: 0000-0002-7909-5369
dc.date.accessioned2011-09-26T14:37:59Z
dc.date.available2011-09-26T14:37:59Z
dc.date.issued2011
dc.identifier.issn0759-1063
dc.identifier.urihttps://basepub.dauphine.fr/handle/123456789/7023
dc.description.abstractfrDans cet article, nous présentons les lignes directrices d'une approche basée sur XML pour l'étude sociologique des données Web tels que l'analyse des listes de diffusion ou bases de données disponibles en ligne. L'utilisation d'un entrepôt XML est une solution flexible pour le stockage et le traitement de ce type de données. Nous proposons une solution déjà mise en place et montrons des applications possibles avec notre étude de profils d'experts impliqués dans des actions normatives W3C. Nous illustrons l'utilisation de bases de données sociologiques semi-structurées en présentant notre schéma XML pour le stockage de listes de diffusion. Un schéma XML permet de nombreuses adjonctions ou croisements de sources de données, sans modifier les données déjà stockées, tout en permettant de possibles évolutions structurelles. Nous montrons également que l'existence de données cachées implique une complexité accrue pour les utilisateurs SQL traditionnels. Le stockage par XML permet l'entreposage totalement exhaustif et de requêtes récursives dans le contenu, avec beaucoup moins de dépendance au stockage initial. Nous présentons enfin la possibilité d'exporter les données stockées vers des logiciels avancés couramment utilisés et consacrés à l'analyse sociologique.
dc.language.isoenen
dc.subjectMailing List Analysis
dc.subjectGestion de données sur le Web
dc.subjectHumanities and social sciences/Sociology
dc.subjectComputer sciences/Databases
dc.subjectWeb Data Management
dc.subjectAnalyse des listes email
dc.subjectXML
dc.subject.ddc300en
dc.titleXML content warehousing : Improving sociological studies of mailing lists and web data
dc.typeArticle accepté pour publication ou publié
dc.description.abstractenIn this paper, we present the guidelines for an XML-based approach for the sociological study of Web data such as the analysis of mailing lists or databases available online. The use of an XML warehouse is a flexible solution for storing and processing this kind of data. We propose an implemented solution and show possible applications with our case study of profiles of experts involved in W3C standard-setting activity. We illustrate the sociological use of semi-structured databases by presenting our XML Schema for mailing-list warehousing. An XML Schema allows many adjunctions or crossings of data sources, without modifying existing data sets, while allowing possible structural evolution. We also show that the existence of hidden data implies increased complexity for traditional SQL users. XML content warehousing allows altogether exhaustive warehousing and recursive queries through contents, with far less dependence on the initial storage. We finally present the possibility of exporting the data stored in the warehouse to commonly-used advanced software devoted to sociological analysis.
dc.relation.isversionofjnlnameBMS : Bulletin de méthodologie sociologique
dc.relation.isversionofjnlvol112
dc.relation.isversionofjnlissue1
dc.relation.isversionofjnldate2011
dc.relation.isversionofjnlpages5-31
dc.relation.isversionofdoihttp://dx.doi.org/10.1177/0759106311417540
dc.description.sponsorshipprivateouien
dc.relation.isversionofjnlpublisherSage
dc.subject.ddclabelSociologie : généralitésen
dc.description.ssrncandidatenon
dc.description.halcandidateoui
dc.description.readershiprecherche
dc.description.audienceInternational
dc.relation.Isversionofjnlpeerreviewedoui
dc.date.updated2018-02-14T15:21:10Z


Files in this item

FilesSizeFormatView

There are no files associated with this item.

This item appears in the following Collection(s)

Show simple item record