Ma Photo

Syndication de contenu

Recherche sur site


URFIST de Nice

URFIST de Rennes

URFIST de Lyon

Colloques & Evénements internationaux

Ecoles & Laboratoires

Contact Weblog

Une école d'été autour des réseaux sociaux

Dans la série "cahiers de vacances" réservés aux élèves studieux, signalons la tenue  d'une école d'été, courant juillet, du 6 au 10,  organisée par le cluster ISLE et la région Rhône-Alpes autour des incontournables "Réseaux sociaux" (réseaux sociaux informatiques, faudrait-il préciser). Au programme, convergence entre Web sémantique et Web 2.0, étude de ces réseaux du point de vue des système complexes multi-agents, analyse des usages et de la sécurité, etc. 


Pour en savoir plus, il suffit de consulter le programme à cette adresse
L'inscription, quant à elle, se fait ici

AMo

Formation permanente des bibliothécaires aux technologies émergentes, merci Marlène!

"Les technologies émergentes changent le rapport des gens à l'information. Les bibliothécaires doivent comprendre leur fonctionnement pour pouvoir les utiliser  et mieux servir leurs usagers. Les outils en ligne changent plus rapidement que ce que les programmes de formation traditionnels peuvent suivre. Il est essentiel que les bibliothécaires deviennent des apprentis permanents et se forment constamment à ces nouveaux outils."

Marlène Delhaye traduit de larges extraits de l'intervention donnée par Kathryn Greenhill, bibliothécaire à l'Université de Murdoch, à la conférence Educause Australasia 2009. C'est à lire absolument: un argumentaire impeccable en 21 raisons pour répondre à ceux qui nous disent:

⁃    Je n'ai pas le temps
⁃    J'ai trop de travail pour jouer
⁃    Je ne comprend pas comment utiliser de nouvelles technologies dans mon travail actuellement
⁃    Je préfère juste lire des articles sur les nouvelles technologies
⁃    Il n'y a pas d'étude validée par les pairs sur la pertinence de ces nouvelles technologies
⁃    Je veux qu'on me dise quels outils sont pertinents et n'apprendre à me servir que de ceux-ci.

La première raison est tellement évidente qu'elle en aveugle pas mal:

Notre mission de base est la mise en relation de gens et d'informations. De nouvelles façons de le faire, plus efficaces, existent, et nous devons les connaître.

MR

Université d'été de l'édition électronique ouverte


Pour ceux qui souhaiteraient passer un mois de septembre studieux (De gustibus et coloribus non est disputandum), une autre université d'été se tiendra, quelques jours avant celle de Paris 1, du 7 au 11 septembre, à Marseille, sous l'égide du Cléo (Centre pour l’édition électronique). De nombreux intervenants aux noms familiers (Lou Burnard, Hadrien Gardeur, Pierre Mounier, Virginie Clayssen, Alain Pierrot et Hubert Guillaud, Cherifa Boukacem (Université Lille 3), Milad Doueihi (University of Glasgow), Marin Dacos (Cléo/Revues.org) et Philippe Aigrain, entre autres...) débattront de la notion d’édition électronique, couramment utilisée, et qui " renvoie à des pratiques relativement différentes en même temps qu’elle témoigne, par l’usage qui en est fait, de l’émergence de nouvelles compétences dans les métiers de l’édition".

Attention, là encore, la date limite d'inscription approche à grands-pas (18 juin 2009).

Le descriptif complet est accessible à l'adresse suivante : http://www.digitalhumanities.cnrs.fr/wikis/edelec-shs/index.php/Accueil


AMo

Ecole d'été : « Les nouveaux outils numériques et les sciences humaines »


L'université Paris I Panthéon Sorbonne organise cette année une école d'été, du 14 au 19 septembre, à Roscoff, intitulée « Les nouveaux outils numériques et les sciences  humaines ».

Insérée dans les programmes de la formation permanente du CNRS, il s'agit d'une "initiation approfondie et intensive à l'utilisation de  l'informatique dans la recherche en sciences de l'homme, même si les  exemples seront pris majoritairement dans le domaine historique." Les informations complémentaires sont à lire dans le programme détaillé de l'événement.

Attention, c'est aujourd'hui, lundi 15 juin, la date limite pour s'inscrire !

MàJ : La date limite pour postuler en vue d'une inscription est finalement fixée au 30 juin. 


AMo


Programme de l'école d'été

Les nouveaux outils numériques pour l'histoire et les sciences humaines
Roscoff, 14-19 septembre 2009 (hébergement et repas sur place)

Comité scientifique :

Philippe Cibois, Jean-Philippe Genet, Alain Guerreau, Damon Mayaffre,  Philippe Rygiel

Comité d'organisation :

Julien Alerini, Georges-Xavier Blary, Alain Dallo, Benjamin Deruelle,  Jean-Philippe Genet, Stéphane Lamassé, Philippe Rygiel.

Les enjeux pour les doctorants

Le véritable enjeu n'est pas l'informatique en soi, mais l'utilisation  scientifique des méthodes pour l'emploi desquelles celle-ci est un  point de passage obligé. Les pratiquants des sciences humaines  
(l'école d'été est animée en majorité par des historiens mais elle est  conçue pour être utile à tous les « littéraires », philosophes,  historiens de l'art, et politistes, même si ceux-ci sont normalement déjà plus ouverts sur les méthodologies informatiques) sont restés  largement étrangers aux nouveaux outils qui ont transformé le travail  d'autres disciplines, notamment la sociologie et la géographie. En  témoigne l'absence de l'existence d'un cursus de formation au-delà du  C2I (dont le niveau d'exigence est trop faible pour déboucher sur la  recherche) dans les départements des sciences humaines (et souvent  même des sciences sociales) des universités françaises.
Un autre fait préoccupant est le « recul méthodologique » constaté  dans beaucoup de thèses récentes qui, alors que les outils sont de  plus en plus nombreux et faciles à utiliser, restent très timides en  matière d'innovation et d'expérimentation méthodologiques : il n'y a  guère de doute que cela est du à l'énorme pression qui pèse sur les  doctorants, poussés à terminer des thèses qu'ils veulent de plus en  plus longues, de plus en plus fouillées et accomplies (la concurrence  
au niveau des débouchés oblige) et ce dans un temps de plus en plus  réduit, ce qui leur interdit tout investissement sérieux dans les  apprentissages qu'exigent les nouvelles méthodologies. D'où les  difficultés rencontrées par les formations dans le cadre des écoles  doctorales, très exigeantes en termes de temps et de régularité dans  l'engagement.
Cette première école d'été a été conçue comme, sinon une initiation,  du moins comme une ouverture à des méthodologies récentes avec une  remise à niveau sur les logiciels les plus utilisés aujourd'hui. Si  cette initiative rencontre le succès, d'autres écoles seront  organisées, avec des comités d'organisation et scientifique modifiés :  elles porteront sur l'analyse spatiale (GIS, cartographie etc.),  l'édition et la mise en ligne des données, et enfin les statistiques.  La pédagogie envisagée (voir le détail du programme) aura dès cette  première école un aspect interdisciplinaire.

Les objectifs de formation

Le choix du dispositif de formation tient à la volonté de faire passer  concrètement les savoirs acquis dans la pratique des personnes suivant  l'école : d'où la bipartition de la journée en matinées de conférences  et de discussions et en après-midi d'ateliers consacrés aux  applications pratiques. La première étape que constitue cette première  école vise à sensibiliser les participants à la notion de métasource  (mise en forme de la donnée historique) comme pierre angulaire de la  
construction des bases de données et à l'introduction de la mesure  dans la critique historique, que les données soient par nature  quantitatives ou non. Autrement dit, nous voulons que les participants  à l'école repartent autant que possible dotés de nouveaux savoirs leur  permettant d'infléchir leurs pratiques en toute autonomie, même s'ils  pourront avoir ensuite recours à un suivi pour les aspects techniques  les plus pointus (auprès de nous ou d'autres).

Public concerné

Les chercheurs et les ingénieurs du C.N.R.S.
Les enseignants du supérieur et les post-doctorants.
**** Les doctorants.

Pré-requis

Le seul véritable pré-requis est celui d'une « alphabétisation »  informatique. Pour le reste, nous envisageons au niveau des ateliers  de distinguer deux groupes de niveau, avec une quinzaine de personnes.  S'il le faut, nous en ferons trois, car nous pensons importante  l'homogénéité des groupes de travail. Inscription avant le 15 juin 2009

Le prix du stage est de 150 euros, tout compris sauf le voyage. Pour les doctorants de Paris I, un droit d'inscription forfaitaire de  30 euros est demandé : les doctorants des E.D. d'histoire de l'art,  philosophie et sciences politiques sont dispensés du paiement du reste  ; pour les historiens, ils doivent demander à leur laboratoire de  régler cette somme. Pour les autres doctorants, le prix est de 150 ¤, à charge pour eux de  le faire prendre en compte par leur équipe ou leur laboratoire.

Inscription auprès de Madame Françoise BORNES
fbornes@univ-paris1.fr
LAMOP, UFR d'Histoire, 17 rue de la Sorbonne, 75005 PARIS
Chèque établi à l'ordre de Madame l'Agent Comptable Secondaire CNRS IDF Est

Programme de travail

Lundi 14 septembre, 14 h.-18 h.
Présentation du programme de travail
Présentation des logiciels utilisés :
Bases de données :        Open Office
                        MySQL
Textométrie
                        Lexico 3
                        Hyperbase
Analyse factorielle et traitements quantitatifs :
                        Tri 2
                        Analyse.

Mardi 15 septembre, 9 h.-12 h 30.
Théorie de la base de donnée et du corpus
- De la source à la métasource.
- Typologie des bases de données.
- Initiation à la modélisation des bases de données.
- Textes et corpus : la corpus comme base de donnée linguistique.

Mardi 15 septembre, 14 h.-18 h.
Pratique : création des bases de données et des corpus
Application sur machines : construction des bases, codages et  
recodages ; saisie et mise en forme des corpus.

Mercredi 16 septembre, 9 h.-12 h 30.
De la requête au rapport
Connaissance et exploration des bases de données.
Théorie de la requête : fonction et syntaxe.
Production des rapports.

Mercredi 16 septembre, 14 h.-18 h.
Pratiques : les opérations préliminaires
Bases de données
Requête I : la rédaction de la requête.
Textométrie
Lemmatisation
Production des dictionnaires

Jeudi 17 septembre, 9 h.-12 h 30.
Approches pluridisciplinaires : sociologie et linguistique
L'enquête.
Les bases de données collaboratives.
Initiation à la sémantique.

Jeudi 17 septembre, 14 h.-18 h.
Bases de données
Requête II : recodage, champs calculés, créations de tables
Textométrie
Co-occurrences ; polyoccurrences ; champs sémantiques.

Vendredi 18 septembre, 9 h.-12 h 30.
Mesure et structure des données
L'approche statistique.
Les principes de l'analyse factorielle.
Les contraintes de la statistique lexicale.

Vendredi 18 septembre, 14 h.-18 h.
Bases de données
Mise en oeuvre des méthodes factorielles et commentaire des résultats.
Textométrie
Mise en oeuvre des méthodes factorielles et commentaire des résultats.

Samedi 19 septembre, 9 h.-11 h.
Bilan de l'école.



SavedURI :Show URL

Un juge rejete l'accusation de "reverse engineering" de EndNote par zotero

Bonne nouvelle

Thomson n'a pas été suivi dans son accusation de copie de EndNote par Zotero.

Ceci devrait soulager l'équipe de développement de ce logiciel open source.

Mais Zotero fait beaucoup d'ombre au monopole de fait très lucratif de EndNote. Il faut s'attendre à une réplique de la part de Thomson.

JPL

Un compte Twitter pour l'Urfist de Paris


Chaque jour qui passe renforce un peu plus son satut de source pertinente d'informations. Asile de nombreux commentateurs issus (bien souvent) de la blogosphère, Twitter s'invite à l'Urfist de Paris qui se dote, pour l'occasion, d'un compte destiné à signaler liens et ressources ayant attiré notre attention sur le Web. Une veille active appelée à tirer parti des caractéristiques de cette nouvelle sphère informationnelle, plus proche, paraît-il, du wiki, que de la messagerie instantanée. A vous de juger.

http://twitter.com/UrfistParis

A.Mo.

P.S. : avec, actualité oblige, en une, le rejet de la loi HADOPI par le Conseil constitutionnel.

P.P.S. : déjà 39 "followers" (moins de 24 heures plus tard) ! Merci pour votre confiance.


SavedURI :Show URL

canalbib historique

Presque 16 ans après son ouverture la liste Biblio-fr s'arrête... c'était hier et déjà bien longtemps... un grand merci à cette liste...ses participants...et ses modérateurs Sara Aubry et Hervé Le Crosnier : "Comprenez que nous n'avons pas encore évalué tout ce qui pouvait se passer, et que cette fermeture d'une aventure est aussi une nouvelle aventure. Nous déciderons ensemble de ce qu'il conviendra de faire au mieux."
GG

Des livres sur Revues.org

Revues.org vient d'annoncer l'ouverture d'une plateforme dédiée cette fois aux monographies électroniques, Les Livres de Revues.org.
Seront ainsi accessibles en ligne "des livres de sciences humaines et sociales publiés par des éditeurs, des sociétés savantes, ou institutions de recherche".
L'initiative est lancée avec les collections électroniques de l'IFPO (Institut Français du Proche-Orient) et avec les éditions Agone, qui proposent dans leur collection "Banc d'essais" une sélection d'ouvrages de philosophie. Mais d'autres partenaires devraient  bientôt rejoindre la plateforme, dont la librairie Droz.
D'ores et déjà, une dizaine d'ouvrages peuvent être consultés, soit directement en ligne, soit en format PDF.

MLM

Rencontres Formist

Les 9èmes Rencontres FORMIST auront lieu le jeudi 18 juin 2009, de 9h à 17h à l'ENSSIB à Villeurbanne, sur le thème : "La bibliothèque, lieu de formation ?"

"Le lieu bibliothèque : ce lieu, cet espace est-il perçu par nos étudiants comme un lieu de formation, d'apprentissage. Qu'en attendent-ils ? Comment se le représentent-ils ? Que veut-dire être un lieu de formation, quelles en sont les implications ? Le monde virtuel peut-il être pensé comme un espace de formation ? Et concrètement, quelles pistes sont mises en place pour organiser nos bibliothèques afin de favoriser l?apprentissage de nos étudiants ?

Au programme des 9es Rencontres :
         * 9h : Accueil
         * 9h30 - 9h45 : Ouverture de la Journée, Anne-Marie Bertrand, conservateur des bibliothèques, directrice de l'Enssib
         * 9h45 - 10h10 : Quelles évolutions pour FORMIST ?  Elisabeth Noël, conservateur des bibliothèques, responsable du service Diffusion des savoirs, enssib
         * 10h10 - 10h55 : Le « lieu bibliothèque » comme représentation,  Isabelle Fabre, Documentaliste à l'ENFA, Toulouse
         * 10h55 -11h25 : Pause
         * 11h25 - 12h15 : À quelles conditions les lieux virtuels peuvent-ils être des espaces de formation ?,  Nathalie Deschryver, responsable TICE IFeL, Suisse
         * 12h15 - 12h45 : L'aménagement de salles de formation en bibliothèque : du projet à la réalité, à travers l'expérience du SCD Paris 7.  Arlette Pailley-Katz, conservateur des bibliothèques, directrice du SCD Paris 7

         * 12h45 - 14h15 : Repas libre

         * 14h15 -15h : Du savoir montré au savoir utilisé, comment l'espace induit-il les apprentissages ?,   Pierre-Philippe Bugnard, Historien de l'éducation, Université de Fribourg
         * 15h10 - 15h40 : Pause
         * 15h45 - 16h45 : Les learning centers,   Graham Bulpitt, Director of Library Services, Kingston University
         * 17h00 : Clôture des Rencontres

      Inscription gratuite mais obligatoire sur le site de l'ENSSIB.

AS

Débat au CNAM sur les enjeux de l'organisation de l'IST en France

La Chaire d'Ingénierie documentaire du CNAM, avec l'appui d'acteurs français de l'IST, propose un débat public sur les enjeux de l'organisation de l'Information scientifique et technique aujourd'hui et de sa politique publique nationale d'encadrement.

A l'heure de la e-science, de l'internationalisation de la recherche et de l'enseignement, du déploiement des politiques de l'open access, cet échange vise à débattre avec les acteurs nationaux des enjeux majeurs , des difficultés rencontrées, des projets qu'il conviendrait de mener ensemble.
Le débat s'articulera autour des thématiques suivantes, sans pour autant le limiter :

  • Coordination des acteurs nationaux et impulsion des projets : faut-il un JISC français ?
  • Architecture distribuée ou centralisée de l'IST aujourd'hui ? conditions ?
  • Qualité des services : coordination, non-redondance, complémentarités ?
  • Public/privé : partage des rôles et équilibre à trouver

Organismes de recherche et d'enseignement supérieur, professionnels de l'information et de l'édition, responsables de services d'IST, de plateformes sont attendus (seront présents des représentants du CCSD, du Cléo/revues.org, de Persée, de Cairn, des Urfists, des universitaires, etc.)

Les personnes intéressées par ce débat sont invitées à se rendre le 2 juin de 14h à 17h au CNAM-Paris. Lieu : Amphi 1 (G. Planté) , 2 rue Conté, 75003 Paris (plan)
Merci d'envoyer un message pour signaler votre présence à elodie.ozanne@cnam.fr

AM

Mediadoc, Bernard Stiegler et l'éducation aux médias

La FADBEN  (Fédération des enseignants-documentalistes de l'Education Nationale) a consacré le dernier numéro de sa revue Médiadoc, à un thème particulièrement brûlant :  "Education aux médias et culture de l'information".

Numéro dense, comprenant de nombreuses contributions théoriques, à commencer par l'entretien avec le philosophe Bernard Stiegler,  entretien que nous avons mené, Ivana Ballarini et moi, le 6 mars dernier.  La revue Mediadoc n'est pas en ligne, mais on peut trouver la version complète de l'entretien  sur le site de la Fadben.
Bernard Stiegler  est l'un des rares philosophes à poser la question des médias, anciens et nouveaux, et de l'éducation aux médias, dans toute son ampleur, philosophique et politique ;  question de la technique, rôle des supports de la mémoire (les hypomnemata), processus de grammatisation, nécessité d'une formation des enseignants à l'histoire et à la pensée des supports et des technologies de l'intelligence... : toutes ces notions, familières aux lecteurs de Stiegler, sont abordées et développées au cours de cet entretien passionnant.

Au sommaire  également de ce numéro de Médiadoc : les contributions de Pascal Duplessis, Jacques Kernéis et Olivier Le Deuff, trois membres éminents du GRCDI (;),  le texte de Julien Gautier de la revue Skhole.fr (qui sera d'ailleurs prochainement en ligne sur le site de la revue), d'Olivier Dhilly, du CLEMI (dont on peut trouver également la communication au colloque de l'ERTé sur ArchiveSic), de Thierry Adnot, Marion Carbillet et Dany Hamon.

Au total, un numéro qui fera sans doute date, par sa richesse et sa qualité !
A lire absolument et à commander à la FADBEN pour la modique somme de 10 € !

AS

PS : sur la pensée de Stiegler, je me permets de signaler le texte de mon intervention au dernier séminaire du GRCDI de septembre 2008, disponible sur le site

Pubology à propos de la searchology ;-)

Parution du livre L'entonnoir

Disponible ici : http://cfeditions.com
(avec cadeau de l'éditeur C&F pour toute commande reçue avant la parution du 2 juin)
Extrait de l'ouvrage
Le flyer

Table des matières
Préface :
La vie numérique par le petit bout de l’entonnoir, p.9
Hervé Le Crosnier

Introduction, p.19
Gabriel Gallezot
Brigitte Simonnot

I - Pratiques, p.28
De l’usage des moteurs de recherche par les étudiants, p.31
Brigitte Simonnot

Les sources cachées du journalisme : Étude du rôle des moteurs de recherche dans
l’approvisionnement des entreprises de presse, p.59
Nicolas Pélissier
Mamadou Diouma Diallo

Apparté :
Du bon usage de Google, p.83
Olivier Le Deuff

II - Méthodes, p.90
Outils de recherche : la question de la formation, p.93
Alexandre Serres
Olivier Le Deuff

PageRank : entre sérendipité et logiques marchandes, p.113
Olivier Ertzscheid
Gabriel Gallezot
Éric Boutin

Apparté :
Tout ce qui brille n’est pas Chrome, p.139
Olivier Ertzscheid

III  - Discours 148
Le googling, un branchement sur l’imaginaire de l’internet, p.151
Philippe Dumas
Daphné Duvernay

Le grand avaleur, p.183
Jacques Araszkiewiez

La rhétorique selon Google. De l’argumentation métaphorique à la création de valeurs,le discours paradigmatique de google, p.207
Céline Masoni-Lacroix
Paul Rasse

En guise de postface
Scroogled, p.229
Cory Doctorow



En GRAND merci à C&F éditions ... pour son travail de fourmis (c'est le F)  et de cigale (c'est le C)
GG

Searchology

Sur google us vous trouverez en action les annonces de google à searchology
SearchOption

Wonderwheel Timeline Relatedsearch

il faut avec ces fonctionnalités ajouter Squared  (voir techcrunch) qui extrait les résultats sous forme de tableur et Rich Snippets :  "give users convenient summary information about their search results at a glance"

GG

Adwords sur papier glacé

Google Adwords expliqué aux entrepreneurs ... sur papier glacé !!


Image 1
Image 2
Image 3
GG

Zotero v2 !!

La version 2.0b3 de Zotero est tout juste arrivée (une mise à jour intervenue au cours de la soirée). Plus de nouvelles prochainement avec, en particulier, le test des fonctionnalités WebDAV. Stay Tuned.

AMo.

OAI CERN Workshop : Who’s in ?

Il reste encore quelques jours pour s’inscrire au CERN Workshop on Innovations in Scholarly Communication (OAI6) qui aura lieu du 17 au 19 juin à l’Université de Genève (inscriptions jusqu’au 15 mai)

Ce séminaire s’adresse à toute personne impliquée dans le développement d’archives ouvertes et susceptible d’influencer ce développement à un niveau local, national ou international. Il permet à de nombreux acteurs de se rencontrer et d’échanger.

Par curiosité, je suis allée voir qui y participait puisque la liste est disponible en ligne et je vous fais part de cette lecture (très) rapide mais néanmoins instructive de la liste des inscrits (près de 180 inscrits à la date de consultation).

La plus grande partie des participants est originaire d’Europe (155) : 24 pays sont représentés (dont la Russie, 1 participant), les principaux étant la Suisse (c’est le lieu de la conférence, 35 participants), les Pays-Bas (28), le Royaume-Uni (26), l’Allemagne (17), l’Espagne (10), la Belgique et l’Italie (8), le Danemark (6), l’Autriche et la France (4), La Suède, la Finlande, la Pologne (2), les autres pays n’ayant qu’un seul participant (Russie, Estonie, Lituanie, Slovénie, Roumanie, Hongrie, Croatie, Grèce, Chypre, Ireland, Portugal).
La grande majorité des participants viennent de bibliothèques universitaires, bibliothécaires ou ingénieurs informatiques. Parmi les participants suisses, sont représentés le CERN (dont le projet Scoap3), la bibliothèque nationale suisse, RERO (le Réseau des bibliothèques de Suisse occidentale), l’Académie suisse des sciences humaines et… Philip Morris International. Les universités allemandes sont très présentes (bibliothèques notamment, parmi lesquelles la Max Planck Digital Library) ainsi qu’un représentant de DRIVER. Si la Belgique est surtout représentée par les bibliothèques universitaires, l’Espagne et l’Italie sont aussi représentées par le CSIC (Consejo Superior de investigaciones Cientificas, l’équivalent du CNRS ?) et l’ISTI (Istituto di scienza e tecnologie dell’informazione, l’équivalent de l’INIST ?), ainsi que des organismes de services d’enseignement et de documentation à distance pour l’Espagne (l’UNED par exemple). Le Danemark aussi participe à travers des organismes nationaux (the Royal Library, et la Danish Agency for Science, Technology and Innovation par exemple). Il en va de même pour certains pays qui ne sont représentés que par une ou deux personnes : s’il s’agit pour une grande part de personnes venant d’universités ou d’organismes locaux, on trouve aussi des représentants d’organismes nationaux ou ayant un rôle prépondérant pour la recherche et l’information scientifique (Ireland : Science Foundation ; Pologne : Poznan Supercomputing and Networking Center par exemple).

Les deux pays les plus significatifs en termes de « libre accès à l’IST » sont les Pays-Bas et le Royaume-Uni. Outre de nombreuses universités, organismes de recherche et services scientifiques nationaux (JISC, EDINA, UKOLN), on y trouve aussi un certain nombre d’organisations représentatives du monde européen de l’information scientifique en général (LIBER, EBLIDA) et du libre accès en particulier (SHERPA, SPARC Europe, SURFoundation). Deux éditeurs, et non des moindres, sont représentés (Nature Publishing Group, Elsevier).
Quant à la France, elle est surtout représentée par l’INRIA (3 inscrits) et une personne de l’Université de Rennes 2.
Pour le reste du monde, il faut noter la présence de l’Australie (2 participants), du Canada (2 participants), du Pakistan (1 participant), et de l’Afrique (12 participants, dont 6 du Nigeria, originaires de projets locaux, d’associations, d’entreprises de développement informatique et de réseaux ou d’organismes publics).
Enfin, une mention particulière pour les Etats-Unis d’Amérique puisque les personnes qui font le voyage transatlantique représentent des organismes qui sont loin d’être inconnus dans le monde de l’information scientifique et du libre-accès : the Los Alamos National Laboratory, SLAC Library, Johns Hopkins University, Palmer School of Library and Information Sciences, Open Society Institute, OCLC et … Microsoft Corporation.

Que d’échanges fructueux en perspective ! Dommage peut-être que la France n’y soit pas plus présente ?

AM

Journée d'étude sur la "Diversité des pratiques documentaires dans les champs scientifiques"

L'ENSSIB, le réseau des URFIST et l'INTD/CNAM organisent conjointement une journée d'étude consacrée à la "Diversité des pratiques documentaires numériques dans les champs scientifiques", le 2 juillet 2009, à l'ENSSIB (Lyon).

Programme et inscription : http://pratiquesnum.enssib.fr/

AM

Sea, Se...arch and Fun.

Retour, comme convenu, sur le VoCampIbiza2009, événement informel à mi-chemin entre travail collaboratif et prise de contact IRL.

Sous l'égide de Peter Mika, chercheur chez Yahoo! Research Barcelona et spécialiste des Webs (dit) 2.0 et Sémantiques (notamment auteur d'un article intitulé Ontologies Are Us, remarqué), ce VoCamp, sponsorisé par Yahoo!, s'étalait sur deux jours. Contrairement aux précédentes éditions, il aura vu la balance entre réflexion et action balancer largement du côté de la réflexion, du fait, sans doute, de la personnalité de ses participants.

Au menu des discussions, SearchMonkey, applications phare de Yahoo! (il en était question à la Cantine il y a un an et le 29 avril dernier), unique en son genre pour ce qui concerne les grands moteurs, programmée pour extraire du RDF des pages Web. Seulement, comment les parser quand le balisage est disons... de qualité inégale. Si le Web sémantique est aussi un Web de données (Web of data), il faudra s'attendre à voir pulluler les encodages de qualités diverses voire simplement douteuses. Toutes les pages HTML sont-elles conformes au standard du W3C ? Cela se saurait. Faudra-t-il en définitie mesurer le succès populaire à l'aune du développement de pratiques plus relâchées et moins professionnelles ? En fin de compte, les développeurs font face à des problématiques qui rappellent furieusement les discussions autour de l'interprétation des standards HTML par les navigateurs. Du Web de documents au Web sémantique, les évolutions n'offusquent pas les continuités inattendues.

Vint ensuite une discussion sur la place du tagging sémantique1. Alors qu'une initiative récente, à laquelle participe Alexandre Passant, le spécialiste français en la matière, vient de voir le jour, et qu'à chaque instant de nouveaux services viennent ajouter un peu de structure au tagging en tirant partie des possibilités ouvertes par les technologies du Web sémantique, se pose toujours la question de la plus-value qu'en retirent les utilisateurs. Tant que le semantic tagging offrira moins de possibilités que le tagging tout court (quant au choix des libellés, à la latitude laissée aux utilisateurs, etc.) il y aura lieu de douter de sa pertinence. Ce constat, partagé par tous, témoigne d'un souci motivé par la recherche d'applications sachant faire la preuve de leur utilité. Comme le remarquait Peter Mika, publier ses données sur le Web est une bonne chose mais cela ne créera pas, ipso facto, des applications indispensables. En guise d'exemple de "killer app" nous mentionnâmes Nico Nico Douga, le site de partage et de création de vidéos en ligne, site japonais (il convient de le noter, le Japon ayant en partie échappé à la déferlante Web 2.0) dont l'originalité se mesure aux modifications drastiques qu'il a su apporter au tagging. Liberté de jouer avec les interfaces ouvrant sur une conception inventive et élargie du tagging, prise en compte des utilisateurs... une feuille de route pour le tagging sémantique ?

Nous eûmes droit, dans la continuité des ces débats, à des présentations de Freebase, grâce à Jamie Taylor, et RDFmonkey par Davide Eynard. Nous y reviendrons à l'occasion de futurs billets.

RDFmonkey

Cela fait beaucoup de monkeys me direz-vous ? Il faut tout simplement y lire un hommage implicite (confirmé Peter Mika en off) à l'excellent Greasemonkey, add-on pour Firefox susceptible de modifier n'importe quelle page visitée sur le Web.

Venu de Hambourg en Allemagne, Thomas Lörtsch nous a pour sa part entretenu de sa tentative en cours de convertir des microformats en RDF (http://vocamp.org/wiki/AMicroformat). Quant à Paola Di Maio, elle présenta une application en ligne, FOAFX, inspiré de FOAF, l'ontologie légère des profils sur le Web, destinée à prendre en compte le degré d'expertise des personnes (avec toute les subtilités que cela suppose).

Tout ceci est bel et bon me direz-vous mais après la discussion, la boisson l'action.

Boisson

Le principe de tout Vocamp est de contribuer à produire des ontologies. Ou plutôt, des vocabulaires. Pas question de confondre un VoCamp avec un OntoCamp. La question ici n'est pas de savoir si le mot ontologie, avec ses connotations philosophiques, est approprié. L'enjeu pratique prime. Surtout lorsqu'on ne dispose que de deux jours. Inutile donc de s'attarder sur ces débats... complexes et litigieux. Les mêmes causes appelant les mêmes conséquences, les vocabulaires élaborés dans ce cadre ont nécessairement une portée limitée. Indéniablement, les ontologies dites « légères » sont ici les plus prisées. Après délibération, notre choix s'arrêta donc sur l'ontologie des heures d'ouverture d'un magasin et sur l'ontologie du document – ou plutôt, car le sujet est vaste, des sections des articles de Wikipedia , le moteur de Yahoo! les affichant désormais parmi les résultats d'une recherche (deux choix plutôt sérieux si l'on se souvient que le VoCamp d'Oxford avait débouché - entre autres choses - sur une ontologie du whiskey, la Whisky ontology, demeurée dans les mémoires). Tom Heath de Talis, à l'origine du site Revyu.com, et Peter Mika, animèrent respectivement ces deux groupes de travail.

Il n'est pas si facile que cela de modéliser des horaires d'ouverture et de fermetures Faut-il modéliser l'un ou l'autre ? Et lequel ? L'un et l'autre ? Surgit alors une difficulté dirimante à laquelle nul n'échappera : assurer une parfaite cohérence au plan logique entre les deux volets de la modélisation sous peine d'aboutir à des contradictions acculant le système à la faute. Ontologie des événements récurrents contre ontologie de la disponibilité, topologie et intervalles difficiles à encoder sous OWL... un simple vocabulaire recèle parfois des chausse-trappes inattendues.

Availability1

 

Au final, le résultat dûment formalisé par les soins de Tom Heath est malgré tout disponible à l'adresse suivante : http://tomheath.com/tmp/availability.ttl

Pour ce qui est de la méthode, que les partisans des approches formelles (et non seulement formalisées) interrompent leur lecture immédiatement. Au programme, brainstorming dans un premier temps (pas d'ontologie ou de sémantique formelle !), avant de passer au dessein sur papier d'un graphe pensé pour épouser les potentialités – et les limites – de RDF : les bonnes vielles méthodes conservent une bonne part de leur séduction.

Availability2

Quant à l'ontologie du document, ou plus exactement, d'une section d'un document, je proposai pour ma part de nous inspirer de la TEI pour l'encoder. Malheureusement, RDFa n'est pas aussi souple que le meilleur standard XML prévu à cet effet et nous dûmes nous tourner vers HTML5 pour pallier ses limitations. Ce constat d'échec partiel appelle sans doute des révisions afin de lui permettre à la fois de modéliser des ressources, car tel est la fonction qu'il hérite de RDF, mais aussi d'épouser la structure des documents dans lesquels il s'intègre, à la manière des microformats dont il étend les capacités. Les spécifications de RDFa ont obtenu en octobre dernier le statut de recommandation du W3C. Gageons cependant que des améliorations interviendront au cours des mois et années à venir.

D'autres discussions agrémentèrent la seconde journée. Deux d'entre elles furent lancées sous l'impulsion de Harry Halpin, philosophe et praticien de l'Internet bien connu de tous ceux qui s'intéressent à ces questions.

Non-information_resource

Déjà auteurs d'articles remarqués et remarquables, seul ou en collaboration avec des personnalités aussi prestigieuses que Patrick Hayes (In Defense of Ambiguity) ou Henry Thompson (Web Proper Names: Naming Referents on the Web), Halpin proposa une ontologie pour évaluer la pertinence des résultats des différents outils de recherches opérant à partir des "stores" de triplets RDF (linked data search engines ontology). Il s'agirait, selon cette proposition, d'évaluer les outils en présence  en s'appuyant sur une analyse d'aspects aussi variés que le temps pris pour accomplir une requête, le nombre d'URIs disponibles mais aussi la manière d'accéder aux données : recherche de documents RDF (et des triplets qu'ils contiennent),   "résolution" des URIs, possibilité de les parcourir ("crawler")... les options ne manquent pas. En somme, et comme le notait Gautier Poupeau voici deux ans déjà, il s'agit "de mettre au point une procédure normalisée de benchmark pour les triple store RDF"2.

L'autre ontologie présentée, réalisation en cours, fruit d'une collaboration avec Valentina Presutti (qui n'avait finalement pu se rendre à Ibiza), tente de modéliser la notion pour le moins abstraite, tout autant qu'ubiquitaire sur le Web, de "ressource". Donc d'URI. Partant du principe qu'il existe deux types d'URIs, les URI du Web sémantique en tant que sous-classe des URIs "normales", peut-on distinguer des ressources non-informationnelles par opposition à des ressources dites informationnelles ? Le débat, avant d'être, hélas, trop rapidement interrompu, commençait à prendre une orientation clairement philosophique avec, en guise de perspective, la question du caractère informationnelle de notre ontologie (au sens fort/philosophique du terme).

Ce ne sont donc pas deux approches ontologiques qui se le disputent, comme le pensait Halpin, mais bel et bien trois, à commencer par une ontologie des spécifications, reflétant une approche "ingénieriale", modélisation de leurs présupposés et implications avec, comme horizon, celui délimité par Tim Berners-Lee dans sa fameuse déclaration : "...we are not analyzing a world, we are building it. We are not experimental philosophers, we are philosophical engineers. We declare "this is the protocol". When people break the protocol, we lament, sue, and so on. But they tend to stick to it because we show that the system has very interesting and useful properties."3

Comme l'a bien résumé Harry Halpin, selon cette approche, qui prévaut à l'heure actuelle : “nous modélisons l'esprit de Tim”.

A l'autre extrémité du spectre ontologique s'élaborent des ontologies formelles type Dolce. Problème, aucun consensus ne se dégage sur les catégories formant le socle de notre univers (est-ce une raison pour abandonner la recherche ? En philosophie, certes non, mais le Web suit un tout autre rythme que la réflexion philosophique - même lorsqu'il s'empare de ses objets).

La troisième ontologie est celle à laquelle nous fîmes tantôt allusion. Si tant est, comme semblait le penser H.Halpin, que la distinction entre ressource informationnelle et non-informationnelle ne fasse pas sens, se devine à l'arrière-plan une conception très générale fondée sur une ontologie de l'information aussi compréhensive et englobante que n'importe quelle ontologie catégoriale, véritable Aufhebung de la frontière on/off-line qui régit encore nombre de nos conceptions. Ces débats-là, aussi, sont au cœur du Web. Et de notre avenir à tous.

On notera enfin que de nombreux outils servant à produire des vocabulaires furent testés.  D'ailleurs, des information complémentaires sur ce point précis ainsi que tous ceux qui ont été développés ici sont disponibles sur le wiki du Vocamp : http://vocamp.org/wiki/Main_Page.

Rappelons pour finir qu'aucun événement de ce type n'a encore eu lieu en France. Un manque à combler, cela ne fait pas l'ombre d'un doute...


AMo.

1En un sens, le tagging sémantique existe depuis les débuts du tagging. Depuis les rel tags de Technorati (reposant sur des microformats très simples indiquant qu'un lien est un tag) ou xFolk, autre microformat adapté à l'environnement des folksonomies, les tentatives visant à enrichir l'encodage des tags de manière à y incorporer davantage d'informations se succédèrent. Le principe retenu dans Entity describer de Connotea ou MOAT d'Alexandre Passant consiste à associer le libellé d'un tag à une URI pour en préciser la signification. Sémantisation des tags ou sémiotisation de ceux-ci (une URIs renvoyant généralement un document du point de vue d'un être humain), cette question constituait l'essentiel de notre intervention au cours du Workshop "Future Of Web Search" qui suivait le VoCamp, auquel certains de ses intervenants prirent part et qui était, lui aussi, sponsorisé par Yahoo!. CF. http://grupoweb.upf.es/fows09/program.html

2 http://www.lespetitescases.net/node/988

3 http://lists.w3.org/Archives/Public/www-tag/2003Jul/0158.html

(Photos : tommyh)

P.S. : en bonus track, la chanson des développeurs de SearchMonkey (Thanks Peter!)


SavedURI :Show URLShow URLSavedURI :