Le web collaboratif : des captchas à Duolingo, la keynote de Luis von Ahn à la conférence The Next Web 2013

Comme l’année dernière, je me suis rendue fin août à la conférence The Next Web, qui réunissait la plupart des acteurs du web et des techs latino-américains. Je ne vais pas en faire un compte-rendu détaillé car cela est un peu laborieux et surtout vous pourrez en trouver le détail sur le site de l’événement, avec notamment la présentation des startups finalistes qui ont eu l’occasion de pitcher devant le public. De plus, j’ai été un peu moins assidue aux conférences que l’année dernière, puisque cette fois je connaissais pas mal de monde, et j’ai eu l’occasion de rencontrer plein de personnes intéressantes, notamment des partenaires pour Girls in Tech Brasil.

Cependant, une keynote a particulièrement retenue mon attention : celle de Luis von Ahn, le créateur des captchas et l’actuel cofondateur de Duolingo. Luis est un chercheur passionné par « l’human computation« , c’est à dire, des méthodes permettant de combiner la puissance du raisonnement humain à celle des ordinateurs pour résoudre des problèmes que ni les humains, ni les ordinateurs ne peuvent résoudre seuls. Abstrait ? Pas tant que ça puisque cela prend la forme d’éléments que nous utilisons quasiment au quotidien : les captchas. Il s’agit des éléments textuels que l’on trouve souvent au sein d’un formulaire de validation sur internet comme ceci :

captcha

L’objectif de ces captchas ? Vérifier que la personne qui remplit le formulaire est bien un humain et non pas un programme informatique. Cela est utilisé notamment pour vérifier l’inscription à une newsletter ou bien pour poster un message sur un forum, mais on les retrouve de plus en plus souvent.

Le lien avec l’human computation ? C’est l’application qui en est faite. En effet, Luis van Ahn, suite à la mise en place des captchas, a réfléchi à la façon dont cette « intelligence » humaine déployée pour lire ces petits textes pouvait être utilisée, et comment cette étape un peu rébarbative pouvait devenir plus amusante. Il a ainsi mis au point le système de reCAPTCHA, qui permet d’améliorer le processus de numérisation des livres, en utilisant l’intervention humaine pour retranscrire un mot, là où échouent les systèmes de reconnaissance optique de caractères. Concriètement, ce ne sont pas un mais deux mots qui sont présentés à l’utilisateur :

recaptcha-example

L’un eux est un captcha habituel, dont la réponse est connue par l’ordinateur : l’autre est issu de la numérisation d’un livre, et dont la signification n’est pas connue par l’ordinateur. Ainsi, si les utilisateurs résolvent correctement le captcha habituel, alors on considère que l’autre est déchiffré correctement. L’opération est répétée plusieurs fois jusqu’à ce que plusieurs réponses correspondent, et le mot est alors clairement identifié.

Et cela fonctionne très bien : selon Luis von Ahn, 1,1 millions de mots sont identifiés tous les jours, ce qui permet de numériser environ 2 millions de livres par an. De quoi rendre possible la numérisation complète du savoir humain. Plus d’un milliard de mots ont ainsi déjà été identifiés, et près de 15% de la population mondiale a déjà réalisé un captcha permettant d’améliorer la numérisation d’un livre.

Cette technologie a été revendue à Google en 2009, qui l’utilise pour son projet de bibliothèque Google Books, ainsi que pour reconnaître les textes présents sur les photos de Google View.

Mais Luis von Ahn ne s’est pas arrêté là : il travaille depuis deux ans sur un projet similaire, Duolingo. Parti du constat que 1,2 milliards de personne dans le monde sont en train d’apprendre une langue, il a cherché un moyen de fournir un outil favorisant l’apprentissage, et qui soit en même temps utile pour la société. Il a donc créé l’application Duolingo, gratuite, qui permet de manière très ludique d’apprendre une langue progressivement, en 10 minutes d’exercices par jours. La progression est assez rapide, et l’objectif bien sûr est d’arriver au stade où de nouveaux bouts de texte qui n’ont encore jamais été traduits, seront soumis à des utilisateurs capables d’aider à la traduction. Ces traductions sont ensuite vendues à des entreprises à un coût extrêmement compétitif puisque issues d’une intelligence collective. On peut imaginer également que ce type de système permette d’améliorer les traductions parfois hasardeuses de Google Traduction.

duolingo dashboard

La plupart des utilisateurs sont encore débutants, mais pour avoir essayer l’application, on se prend vite au jeu : l’application est extrêmement bien faite, et s’adapte à la progression de l’utilisateur. Parfait pour réviser mes bases d’espagnol qui ont été mises à mal par le portugais !

Bref, il s’agissait d’une conférence particulièrement inspirante, parfaite pour démarrer les deux jours de The Next Web. Celles qui ont suivie étaient non moins intéressantes mais plus classiques (sur les tests A/B, sur la publicité omniprésente et ciblée, par exemple). Il faut cependant reconnaître aux organisateurs de The Next Web la capacité à attirer de très bons conférenciers et c’est toujours un plaisir d’y participer.

Publicités

Commenter

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s