Algo Google : les 30 dernieres ameliorations
Allez, on ne commencera pas l’année sans tenir nos bonnes résolutions… Voici la traduction du billet publié par Google le 5 janvier dernier et qui revient sur les dernières améliorations apportées au moteur de recherche…
Trente points d’amélioration de la qualité de recherche (avec noms de code !) : décembre
5/1/12 | 9h00
Dans ce numéro, nous continuons notre série mensuelle avec une description détaillée des nombreuses améliorations apportées au moteur de recherche. Pour le mois de décembre, vous trouverez une liste de 30 améliorations, dont 9 ont déjà fait l’objet d’un billet. Par ailleurs, pour nous (et vous…) amuser un peu, nous avons inclus quelques exemples de noms de code en regard de la liste.
Les noms de code permettent de mémoriser et de revenir plus facilement sur les modifications apportées, et peuvent aussi être très amusants. Vous vous rappelez sûrement de « Panda » et de « Caffeine », mais vous avez probablement déjà oublié les infos du mois dernier sur la « réécriture du code de sélection des résultats de rang élevé ». C’est la raison pour laquelle la plupart des améliorations que nous apportons à la qualité de recherche ont des noms de code internes.
Pour vous donner juste un exemple, notre ancienne fonctionnalité de recherche par questions-réponses avait le nom de code « DAFFIE », qui était l’acronyme de « Database of All Fact Fiction Information and Exaggeration » (littéralement : « base de données de l’ensemble des faits, illusions, informations et exagérations »). En 2010, l’équipe a effectué une remise à plat complète du système et sorti une nouvelle fonctionnalité de réponses brèves. En pensant à Daffy Duck, Amit Singhal a décidé de donner le nom de code « Porky Pig » au nouveau système, parce que Porky Pig essayait de tuer Daffy Duck dans le dessin animé. L’équipe a bien rigolé en pensant qu’Amit se trompait (tout le monde sait que c’est Elmer Fudd le chasseur). Mais bien sûr, comme d’habitude, Amit avait raison. Dans la version originale du dessin animé où Daffy Duck faisait sa première apparition, sortie en 1937, c’était bien Porky Pig qui chassait Daffy.
Voici la liste pour le mois de décembre :
- Signaux de qualité sur la page de renvoi en recherche d’images (« Image Search »). [nom de code de lancement, « simple »] Il s’agit d’une amélioration qui analyse différents signaux de page de renvoi en recherche d’images. Nous voulons non seulement nous assurer que les images que nous vous montrons sont les plus pertinentes, mais aussi vous diriger vers les pages source de meilleure qualité.
- Sitelinks plus pertinents. [nom de code de lancement, « concepts » ; nom de code de projet « Megasitelinks »] Nous avons amélioré notre algorithme de sélection des sitelinks. Le résultat… des sitelinks plus pertinents – par exemple, nous pouvons afficher les sitelinks spécifiques à votre région métropolitaine, que vous pouvez contrôler avec votre paramètre régional.
- Détection d’erreurs de type « soft 404 ». Les serveurs web renvoient généralement un code de statut HTTP 404 lorsqu’un internaute demande une page qui n’existe pas. Cependant, certains sites sont configurés pour renvoyer d’autres codes de statut, même si le contenu de la page peut indiquer que la ressource n’a pas été trouvée. Nous parlons alors de « soft 404 » (ou de « crypto 404 ») et ces renvois de code peuvent s’avérer problématiques pour les moteurs de recherche qui ne savent plus s’ils doivent ignorer les pages concernées. Cette modification renforce les capacités de détection de codes « soft 404 », notamment en russe, allemand et espagnol. Quant aux webmasters, nous leur conseillons de toujours utiliser le code de réponse approprié.
- Recherches limitées par pays plus précises. [nom de code de lancement, « greencr »] Sur les domaines autres que .com, les internautes ont la possibilité d’afficher uniquement les résultats pour leur propre pays. Il s’agit d’un nouvel algorithme qui utilise plusieurs signaux pour déterminer de façon plus précise l’origine des documents web, ce qui améliore d’autant la précision de cette fonctionnalité.
- Plus de « rich snippets« . Nous avons amélioré notre processus pour détecter les sites remplissant les conditions requises pour l’affichage d’extraits de présentations commerciales, de recettes et d’avis. Vous devriez désormais voir plus de sites avec des « rich snippets » dans les résultats de recherche.
- Infrastructure améliorée pour la saisie semi-automatique. Il s’agit d’une modification infrastructurelle de notre algorithme de saisie semi-automatique visant à améliorer la gestion des corrections orthographiques sur les préfixes de requête (la première partie d’une recherche).
- Détection plus efficace des spams en recherche d’images (Image Search). [nom de code de lancement, « leaf »] Cette modification améliore la détection des spams en recherche d’images en étendant les algorithmes déjà utilisés pour les résultats de recherche principaux.
- Améliorations de la fonction de recherche instantanée Google Instant en japonais. Pour les langues qui utilisent des caractères non romains, la plupart des internautes emploient un éditeur IME (Input Method Editor) pour saisir leurs requêtes. Grâce à cette modification, les navigateurs compatibles IME peuvent gérer plus efficacement les requêtes saisies en japonais dans Google Instant.
- Dates d’annotation plus fidèles. [nom de code de lancement, « foby »] Nous avons apporté quelques améliorations aux principes de détermination de la date associée à un document. Les dates d’annotation des résultats de recherche seront désormais plus fidèles.
- Résultats en direct pour la NFL et la ligue de football américain universitaire. [nom de code de projet « Live Results »] Nous avons ajouté de nouveaux résultats en direct pour NFL.com ainsi que les résultats de la NCAA sur ESPN. Ces résultats donnent désormais les derniers scores, calendriers et classements pour vos équipes de football (américain) favorites.
- Jeu de données amélioré pour les requêtes connexes. Nous utilisons désormais un jeu de données optimisé sur les relations terminologiques pour trouver des requêtes connexes. Nous incluons parfois les résultats de requêtes apparentées à votre recherche initiale, et cette amélioration conduit à la présentation de résultats de requêtes connexes plus pertinents.
- Améliorations des requêtes connexes. [nom de code de lancement, « lyndsy »] Parfois, nous renvoyons des résultats pour des requêtes qui sont apparentées à la requête initiale, mais qui contiennent moins de mots. Nous avons apporté plusieurs modifications à nos algorithmes pour les rendre moins « prudents » et moins susceptible d’introduire des résultats sans mot de requête.
- Meilleurs résultats en recherche de paroles. [nom de code de lancement, « baschi » ; nom de code de projet, « Contra »] Cette modification améliore la qualité des résultats renvoyés en recherche de paroles de chanson.
- Peaufinage du bouton +1 sur la page de résultats. Dans le cadre de nos efforts constants pour améliorer et simplifier l’expérience utilisateur sur les produits Google, nous avons apporté une modification subtile au mode d’affichage du bouton +1 sur la page de résultats. Désormais, le bouton +1 n’apparaît que lorsque vous pointez un résultat avec la souris ou lorsque la fonction +1 a déjà été appliquée au résultat.
- Correction orthographique plus efficace en vietnamien. [nom de projet, « Pho Viet »] Nous avons lancé un nouveau modèle d’orthographe vietnamien qui nous permettra d’affiner les prédictions orthographiques pour les requêtes saisies en vietnamien.
- Liste des événements prévus par lieu. Nous avons amélioré le très récent places panel pour les lieux de manifestation. Pour les lieux de premier plan, nous affichons désormais les trois prochains événements prévus sur la droite de la page. Faites l’essai avec [staples center los angeles] ou [paradise rock club boston].
- Améliorations du signal de taille d’image. [nom de code de lancement, « matter »] Il ‘agit d’une amélioration apportée aux principes d’utilisation de la taille des images comme signal de classement en recherche d’images (Image Search). Cette modification devrait vous permettre de voir les images dans leur version pleine taille grand format.
- Amélioration des synonymes en hébreu. [nom de code de lancement, « SweatNovember » ; nom de code de projet, « Synonyms »] Cette mise à jour affine le mode de traitement des synonymes hébreux sur un large éventail de langues. Comme le contexte joue un rôle essentiel en traduction, cette modification évite d’utiliser des synonymes traduits qui ne sont pas pertinents au regard du contexte de la requête.
- Recherche plus sûre. [nom de code de lancement, « Hoengg » ; nom de code de projet, « SafeSearch »] Nous avons mis à jour l’outil SafeSearch de façon à renforcer le filtrage sur certaines requêtes lorsque la fonction de filtrage strict de SafeSearch est activée.
- Fonctionnalité de recherche chiffrée disponible sur de nouveaux domaines régionaux. Google propose désormais la recherche chiffrée par défaut sur google.com pour les utilisateurs inscrits, mais ce n’est pas l’option par défaut sur les autres domaines régionaux (par ex. : google.fr pour la France). Désormais, les utilisateurs du Royaume-Uni, d’Allemagne et de France peuvent opter pour la recherche chiffrée en accédant directement à une version SSL de la page de recherche Google sous leurs domaines respectifs : https://www.google.co.uk, https://www.google.de, et https://www.google.fr.
- Navigation sur mobile plus rapide. [nom de code de lancement, « old possum » ; nom de code de projet, « Skip Redirect »] De nombreux sites web redirigent les utilisateurs de smartphones sur une autre page qui est optimisée pour les navigateurs mobiles. Cette modification utilise l’adresse url de destination finale du smartphone dans les résultats de recherche mobile, vous permettant d’éviter les pages de redirection et de charger la page cible plus rapidement.
Pour être complet, voici un récapitulatif des améliorations qui ont déjà fait l’objet d’un billet depuis la dernière fois :
- Résultats de recherche d’informations sur les vols sur google.com <http://itasoftware.blogspot.com/2011/11/see-flight-results-right-on-googlecom.html>
- Calculatrice graphique <http://insidesearch.blogspot.com/2011/12/showing-some-love-to-math-lovers.html>
- Google Goggles 1.7 <http://googlemobile.blogspot.com/2011/12/continuous-improvements-with-google.html>
- Résultats de recherche d’images sur tablette présentés en vue carrousel <http://googlemobile.blogspot.com/2011/12/tablet-image-results-in-new-carousel.html>
- Mise à jour des cartes pour le Royaume-Uni, l’Allemagne, la Finlande et la Suède <http://google-latlong.blogspot.com/2011/12/updating-maps-of-united-kingdom-germany.html>
- Recherche de films accélérée sur mobile <http://googlemobile.blogspot.com/2011/12/now-playing-faster-movie-search-on.html>
- Rhabillage de l’outil Public Data Explorer <http://insidesearch.blogspot.com/2011/12/making-public-data-more-accessible-on.html>
- Des statistiques à destination des auteurs sont désormais disponibles sur la page des outils pour les webmasters <http://googlewebmastercentral.blogspot.com/2011/12/clicks-and-impressions-for-authors.html>
- Version mobile des googlebots pour smartphones <http://googlewebmastercentral.blogspot.com/2011/12/introducing-smartphone-googlebot-mobile.html>
