Pourquoi LINCS ?

11 août 2020 · 10 minutes de lecture

LINCS Project Lead

Le cœur du projet Linked Infrastructure for Networked Cultural Scholarship (LINCS) est la proposition simple de créer Données ouvertes liées (LOD) parmi les éléments que les universitaires utilisent pour comprendre et analyser la culture feront la différence. LINCS espère faire une différence dans la façon dont nous pouvons donner un sens au passé et au présent humains. Il vise à permettre un tel travail dans et au-delà des contextes académiques et, ce faisant, à améliorer la façon dont les choses culturelles peuvent être présentées et diffusées sur le World Wide Web.

Je dis trucs et choses pour démystifier la notion de données. Ceux qui font la culture se considèrent rarement comme des créateurs de données, pas plus que ceux qui collectent, célèbrent, organisent et analysent des objets, des processus et des événements culturels. Mais tout ce que nous faisons et faisons peut être représenté sous forme de données et diffusé sur le Web, et une grande partie de la culture contemporaine est la culture Web...

Le sens de l'opposition entre culture et technologie a une longue histoire (Keep, 2003), et il y a de bonnes raisons de remettre en question les notions simplistes de données avec l'idée de capta, qui reconnaît que toutes les données sont médiatisées et situées (Drucker, 2011). De nombreuses études démontrent comment la technologie peut perpétuer les torts passés et présents et soulignent les dangers d'ignorer les implications humaines et culturelles de la technologie (voir Chun, 2016 ; Nakamura, 2002 ; Noble, 2018). La pandémie de COVID-19 et le mouvement #BlackLivesMatter ont clairement montré que la démocratie participative nécessite de bonnes données. Parce que la production et l'impact des données sont massivement affectés par les contextes et les histoires culturelles (Wernimont, 2019), il est d'autant plus crucial d'agréger les informations en ligne de manière transparente, responsable et digne de confiance.

Les données ouvertes liées utilisent les technologies et les normes Web pour tisser un sens dans le tissu même du Web. Il relie des éléments connexes provenant de différents sites Web afin que les humains et les machines puissent parler des mêmes choses dans les mêmes termes, et puissent faire progresser les connaissances et débattre de ces choses en collaboration.

Les articles, ateliers et événements ultérieurs exploreront les données ouvertes liées et leur fonctionnement plus complet. Pour l'instant, je noterai simplement que LINCS est motivé par la promesse que Les données liées (LD) peuvent aider à :

briser les silos en séparant les documents sur le même sujet de différents sites Web
enrichir et contextualiser le contenu Web à partir de sources sur le Web
faciliter la recherche de contenu et se concentrer sur ce qui est le plus pertinent
analyser ensemble le contenu de différentes sources
promouvoir le partage et la réutilisation, et permettre la production collective de connaissances
révéler les connexions entre les choses grâce à la visualisation
prendre en charge de meilleures requêtes pour ** répondre à des questions plus complexes ** sur le contenu Web
activer les ** inférences ** et ainsi ajouter plus que la somme de ses parties

astuce

Nouveau sur les données liées ?

Cette vidéo de 4 minutes de Europeana donne un excellent aperçu. Pour un point de vue de chercheur, consultez cette introduction de Programming Historian par Jonathan Blaney. Si vous recherchez des définitions rapides pour des termes tels que ontologie, consultez le Glossaire LINCS en cours.

Pour voir Linked Open Data en action, consultez les interviews de musiciens légendaires sur Linked Jazz, les profils de [Virginia Woolf](https://reasonator.toolforge.org/? q=Q40909) ou Douglas Adams tiré de plusieurs sources, un rassemblement d'œuvres d'art, ou explorez Wikidata à l'aide de la démo Metaphactory.

Les données ouvertes liées bien faites aident à construire le Web sémantique (voir Shadbolt, Hall, & Berners-Lee, 2006). Mais bien que basées sur des normes ouvertes et destinées au bien public, Les données liées sont de plus en plus motivées par des intérêts commerciaux. Uber, Facebook et l'éditeur à but lucratif Elsevier, par exemple, ont d'énormes ensembles de données liées, ou ce qu'on appelle maintenant souvent graphiques de connaissances. Les résultats générés par le graphe de connaissances propriétaire de Google, puisant dans de nombreuses données liées ouvertes, apparaissent dans les cases à droite de nombreux écrans de résultats de recherche.

LINCS répond au besoin de créer un contenu Web lié qui sert les intérêts universitaires et publics plutôt que les intérêts des entreprises, et il reconnaît que la complexité des technologies impliquées signifie que cela ne peut se produire sans une infrastructure partagée et ouverte. LINCS est un projet de cyberinfrastructure financé par la Fondation canadienne pour l'innovation, les gouvernements provinciaux, les universités et d'autres partenaires pour convertir les documents culturels et universitaires existants de nombreuses disciplines des sciences humaines en Données liées, et fournir de la documentation et de la formation afin que les chercheurs puissent utiliser, améliorer et créer davantage de données de ce type pour soutenir leurs travaux futurs.

LINCS a officiellement débuté en avril 2020. Son approche progressive commence par des ensembles de données dont la structure est plus proche des données liées, telles que des feuilles de calcul et des bases de données, et progresse vers des ensembles plus complexes tels que ceux impliquant le langage naturel. Les décisions sur la façon de construire l'infrastructure se déroulent en dialogue avec notre communauté, grâce à un comité de recherche actif. Nous interviewons actuellement des universitaires et formons des groupes d'intérêt, et nos présentations et ateliers en ligne sur tout, des introductions de base aux choix technologiques, aux outils et aux méthodes, seront ouverts à tous.

LINCS est un projet ouvert. Si vous êtes un chercheur qui souhaite en savoir plus sur les données liées, mobiliser votre propre ensemble de données ou tester des choses ; un designer ou un développeur intéressé à rejoindre des designfests ou des hackfests ; ou vous représentez un projet ou une institution qui souhaite se connecter avec LINCS en tant qu'organisation, veuillez nous contacter. Inscrivez-vous à notre newsletter, demandez une invitation à notre chaîne d'annonces Slack ou suivez notre référentiel GitLab pour rester au courant des nouveaux développements.

« Pourquoi LINCS ? » peut cependant être résolue de manière tout à fait différente, en invoquant un collègue plutôt qu'un concept.

Stéfan Sinclair

Stéfan Sinclair, responsable du site LINCS à McGill.

Comme beaucoup de membres de la communauté DH dans le monde pleurent notre perte, je tiens à souligner à quel point ce projet lui est et lui sera toujours redevable.

À bien des égards, le germe remonte à un cours sur les outils numériques pour l'histoire littéraire que Stan Ruecker et moi avons enseigné en 2009 au DHSI. Les participants ont exploré et discuté d'un certain nombre d'approches et d'outils, y compris un nouvel outil d'analyse de texte accessible sur navigateur appelé "Voyeur". C'était super facile à mettre en place et a donné des résultats immédiats. Dire qu'il a séduit le groupe est un euphémisme : c'était la star du parcours. J'avais alors goûté à l'enivrant mélange de conception et de développement itératifs grâce à la collaboration avec Stéfan, Stan et Milena Radzikowska sur des outils tels que la table dynamique des contextes et le navigateur Mandala. Mais ce cours m'a fait prendre conscience de la puissance et du potentiel des outils DH accessibles sur le Web.

Cette plate-forme est devenue un modèle de ce que le tiercé gagnant de la création, de la collaboration et de la communauté peut accomplir. Il était fondé sur le partenariat intellectuel durable entre Stéfan et Geoffrey Rockwell, dont j'ai été témoin de la joie à d'innombrables reprises, notamment peut-être dans le dialogue qu'ils ont joué à DH2007 à l'UIUC (voir Rockwell & Sinclair, 2007). Et ce dialogue collaboratif s'étendait à tous ceux qui s'y intéressaient. Alors que nous commencions à explorer comment nous pourrions construire un pont entre leur outil et le Canadian Writing Research Collaboratory (CWRC) nouvellement financé, je me souviens d'être assis au LEVA Café d'Edmonton et d'avoir soulevé la préoccupation que s'ils voulaient que les femmes utilisent l'outil, il y avait des problèmes avec les connotations de son nom ainsi que les résultats de Google "Voyeur". Malgré leur penchant pour un nom qui ressemblait déjà à une marque, il fut rapidement changé en "Voyant". Ce genre d'écoute est rare.

Ce fut un privilège de voir Voyant devenir l'outil incontournable pour l'enseignement de la DH et l'exploration de textes, l'outil le plus utilisé sur le Cloud de Calcul Canada. Voyant est un "travail d'amour" entre deux collaborateurs—un moyen évolutif de penser à travers les technologies du texte pour ses créateurs qui a permis à d'autres de faire le même. Issu de la fascination de Stéfan pour le mouvement OuLiPo, Voyant propose des outils qui incluent Bubbles' torsion exubérante sur la datafication et [Bubblelines](https ://voyant-tools.org/docs/#!/guide/bubblelines) étrange beauté. Après tout, dit-il, « les outils sont des terrains de jeux qui structurent des scènes d'interprétation » (voir Rockwell, 2007).

Lorsque le programme Cyberinfrastructure a été annoncé et que la communauté DH canadienne a commencé à se consulter, Stéfan et moi pensions tous les deux postuler. Avec une générosité typique, il a suggéré que nous combinions sur une seule candidature de McGill, puis divers facteurs ont conduit à postuler à partir de Guelph à la place. L'orientation s'est déplacée au fur et à mesure que nous développions une première puis une deuxième application, mais Stéfan a toujours été au cœur de la vision de ce projet sur la façon dont l'infrastructure numérique doit être fondée sur l'engagement intellectuel et la communauté, et des outils pleinement intégrés dans « le cycle de recherche » ( Rockwell et Sinclair, 2022).

En tant que développeur principal de Voyant, Stéfan était l'infrastructure personnifiée : discrète, omniprésente, essentielle. Engagé dans le service et le soutien à la recherche d'une manière souvent sous-reconnue, il a insufflé au code de Voyant sa compréhension astucieuse de la relation dialectique entre la façon dont nous façonnons les outils et la façon dont les outils nous façonnent. Les hommages rendus à Stéfan qui affluent aujourd'hui mettent en évidence ses contributions brillantes, multiformes et diverses au Humanités numériques (DH). Il a démontré un engagement envers la communauté à tous les niveaux, depuis l'accueil chaleureux des nouveaux arrivants à la conférence et le mentorat d'étudiants proches et lointains, en dirigeant à la fois de manière proéminente et en guidant par derrière, jusqu'à l'innovation, l'entretien et la réparation de nombreuses infrastructures, y compris mais s'étendant bien au-delà. Voyant.

LINCS sera le plus pauvre de la perte de Stéfan, mais ce qu'il a fait et qui il était sera toujours au cœur de ce projet et son inspiration continue.

remarquer

Remerciements particuliers à Geoffrey pour avoir publié le dialogue “Reading Tools, or Text Analysis Tools as Objects of Interpretation”, présenté avec Stéfan à DH2007.

Ouvrages cités

Chun, Wendy Hui Kyong. Mettre à jour pour rester le même : nouveaux médias habituels. Presse du MIT, 2016.

Drucker, Johanna. "Approches des sciences humaines à l'affichage graphique." Digital Humanities Quarterly 5, no. 1 (2011): 1–22. https://dhq-static.digitalhumanities.org/pdf/000091.pdf.

Tenez, Christophe. "Des machines à écrire et des savants-tsiganes." ESC 29, non. 1–2 (2003): 55–66. https://ojs.lib.uwo.ca/index.php/esc/article/view/10181/8278.

Nakamura, Lisa. Cybertypes : race, ethnicité et identité sur Internet. Routledge, 2002.

Noble, Safiya Umoja. Algorithmes d'oppression : comment les moteurs de recherche renforcent le racisme. Presse universitaire de New York, 2018.

Rockwell, Geoffrey. « Hommage à Stéfan Sinclair : Un dialogue de 2007. » Theoreti.ca. 11 août 2020. https://theoreti.ca/?p=7599

Rockwell, Geoffrey & Stéfan Sinclair. Hermeneutica : interprétation assistée par ordinateur dans les sciences humaines. MIT Press, 2022. https://mitpress.mit.edu/9780262545891/

Rockwell, Geoffrey & Stéfan Sinclair. « Outils de lecture ou outils d'analyse de texte comme objets d'interprétation - Dialogue avec Stéfan Sinclair et Geoffrey Rockwell. Scénario présenté à Digital Humanities. Université de l'Illinois, Urbana-Champaign. Juin 2007. https://doi.org/10.7939/r3-9vkj-k220.

Shadbolt, Nigel, Wendy Hall et Tim Berners–Lee. « Le Web sémantique revisité ». IEEE Computer Society (2006) : 96–101. https://eprints.soton.ac.uk/262614/1/Semantic_Web_Revisted.pdf.

Wernimont, Jacqueline. Des vies numérotées : la vie et la mort dans les médias quantiques. MIT Press, 2019. https://mitpress.mit.edu/books/numbered-lives.

Ouvrages cités​

Ouvrages cités