Algo Google : les 30 dernieres ameliorations
Allez, on ne commencera pas l’année sans tenir nos bonnes résolutions… Voici la traduction du billet publié par Google le 5 janvier dernier et qui revient sur les dernières améliorations apportées au moteur de recherche…
Trente points d’amélioration de la qualité de recherche (avec noms de code !) : décembre
5/1/12 | 9h00
Dans ce numéro, nous continuons notre série mensuelle avec une description détaillée des nombreuses améliorations apportées au moteur de recherche. Pour le mois de décembre, vous trouverez une liste de 30 améliorations, dont 9 ont déjà fait l’objet d’un billet. Par ailleurs, pour nous (et vous…) amuser un peu, nous avons inclus quelques exemples de noms de code en regard de la liste.
Les noms de code permettent de mémoriser et de revenir plus facilement sur les modifications apportées, et peuvent aussi être très amusants. Vous vous rappelez sûrement de « Panda » et de « Caffeine », mais vous avez probablement déjà oublié les infos du mois dernier sur la « réécriture du code de sélection des résultats de rang élevé ». C’est la raison pour laquelle la plupart des améliorations que nous apportons à la qualité de recherche ont des noms de code internes.
Pour vous donner juste un exemple, notre ancienne fonctionnalité de recherche par questions-réponses avait le nom de code « DAFFIE », qui était l’acronyme de « Database of All Fact Fiction Information and Exaggeration » (littéralement : « base de données de l’ensemble des faits, illusions, informations et exagérations »). En 2010, l’équipe a effectué une remise à plat complète du système et sorti une nouvelle fonctionnalité de réponses brèves. En pensant à Daffy Duck, Amit Singhal a décidé de donner le nom de code « Porky Pig » au nouveau système, parce que Porky Pig essayait de tuer Daffy Duck dans le dessin animé. L’équipe a bien rigolé en pensant qu’Amit se trompait (tout le monde sait que c’est Elmer Fudd le chasseur). Mais bien sûr, comme d’habitude, Amit avait raison. Dans la version originale du dessin animé où Daffy Duck faisait sa première apparition, sortie en 1937, c’était bien Porky Pig qui chassait Daffy.
Voici la liste pour le mois de décembre :
- Signaux de qualité sur la page de renvoi en recherche d’images (« Image Search »). [nom de code de lancement, « simple »] Il s’agit d’une amélioration qui analyse différents signaux de page de renvoi en recherche d’images. Nous voulons non seulement nous assurer que les images que nous vous montrons sont les plus pertinentes, mais aussi vous diriger vers les pages source de meilleure qualité.
- Sitelinks plus pertinents. [nom de code de lancement, « concepts » ; nom de code de projet « Megasitelinks »] Nous avons amélioré notre algorithme de sélection des sitelinks. Le résultat… des sitelinks plus pertinents – par exemple, nous pouvons afficher les sitelinks spécifiques à votre région métropolitaine, que vous pouvez contrôler avec votre paramètre régional.
- Détection d’erreurs de type « soft 404 ». Les serveurs web renvoient généralement un code de statut HTTP 404 lorsqu’un internaute demande une page qui n’existe pas. Cependant, certains sites sont configurés pour renvoyer d’autres codes de statut, même si le contenu de la page peut indiquer que la ressource n’a pas été trouvée. Nous parlons alors de « soft 404 » (ou de « crypto 404 ») et ces renvois de code peuvent s’avérer problématiques pour les moteurs de recherche qui ne savent plus s’ils doivent ignorer les pages concernées. Cette modification renforce les capacités de détection de codes « soft 404 », notamment en russe, allemand et espagnol. Quant aux webmasters, nous leur conseillons de toujours utiliser le code de réponse approprié.
- Recherches limitées par pays plus précises. [nom de code de lancement, « greencr »] Sur les domaines autres que .com, les internautes ont la possibilité d’afficher uniquement les résultats pour leur propre pays. Il s’agit d’un nouvel algorithme qui utilise plusieurs signaux pour déterminer de façon plus précise l’origine des documents web, ce qui améliore d’autant la précision de cette fonctionnalité.
- Plus de « rich snippets« . Nous avons amélioré notre processus pour détecter les sites remplissant les conditions requises pour l’affichage d’extraits de présentations commerciales, de recettes et d’avis. Vous devriez désormais voir plus de sites avec des « rich snippets » dans les résultats de recherche.
- Infrastructure améliorée pour la saisie semi-automatique. Il s’agit d’une modification infrastructurelle de notre algorithme de saisie semi-automatique visant à améliorer la gestion des corrections orthographiques sur les préfixes de requête (la première partie d’une recherche).
- Détection plus efficace des spams en recherche d’images (Image Search). [nom de code de lancement, « leaf »] Cette modification améliore la détection des spams en recherche d’images en étendant les algorithmes déjà utilisés pour les résultats de recherche principaux.
- Améliorations de la fonction de recherche instantanée Google Instant en japonais. Pour les langues qui utilisent des caractères non romains, la plupart des internautes emploient un éditeur IME (Input Method Editor) pour saisir leurs requêtes. Grâce à cette modification, les navigateurs compatibles IME peuvent gérer plus efficacement les requêtes saisies en japonais dans Google Instant.
- Dates d’annotation plus fidèles. [nom de code de lancement, « foby »] Nous avons apporté quelques améliorations aux principes de détermination de la date associée à un document. Les dates d’annotation des résultats de recherche seront désormais plus fidèles.
- Résultats en direct pour la NFL et la ligue de football américain universitaire. [nom de code de projet « Live Results »] Nous avons ajouté de nouveaux résultats en direct pour NFL.com ainsi que les résultats de la NCAA sur ESPN. Ces résultats donnent désormais les derniers scores, calendriers et classements pour vos équipes de football (américain) favorites.
- Jeu de données amélioré pour les requêtes connexes. Nous utilisons désormais un jeu de données optimisé sur les relations terminologiques pour trouver des requêtes connexes. Nous incluons parfois les résultats de requêtes apparentées à votre recherche initiale, et cette amélioration conduit à la présentation de résultats de requêtes connexes plus pertinents.
- Améliorations des requêtes connexes. [nom de code de lancement, « lyndsy »] Parfois, nous renvoyons des résultats pour des requêtes qui sont apparentées à la requête initiale, mais qui contiennent moins de mots. Nous avons apporté plusieurs modifications à nos algorithmes pour les rendre moins « prudents » et moins susceptible d’introduire des résultats sans mot de requête.
- Meilleurs résultats en recherche de paroles. [nom de code de lancement, « baschi » ; nom de code de projet, « Contra »] Cette modification améliore la qualité des résultats renvoyés en recherche de paroles de chanson.
- Peaufinage du bouton +1 sur la page de résultats. Dans le cadre de nos efforts constants pour améliorer et simplifier l’expérience utilisateur sur les produits Google, nous avons apporté une modification subtile au mode d’affichage du bouton +1 sur la page de résultats. Désormais, le bouton +1 n’apparaît que lorsque vous pointez un résultat avec la souris ou lorsque la fonction +1 a déjà été appliquée au résultat.
- Correction orthographique plus efficace en vietnamien. [nom de projet, « Pho Viet »] Nous avons lancé un nouveau modèle d’orthographe vietnamien qui nous permettra d’affiner les prédictions orthographiques pour les requêtes saisies en vietnamien.
- Liste des événements prévus par lieu. Nous avons amélioré le très récent places panel pour les lieux de manifestation. Pour les lieux de premier plan, nous affichons désormais les trois prochains événements prévus sur la droite de la page. Faites l’essai avec [staples center los angeles] ou [paradise rock club boston].
- Améliorations du signal de taille d’image. [nom de code de lancement, « matter »] Il ‘agit d’une amélioration apportée aux principes d’utilisation de la taille des images comme signal de classement en recherche d’images (Image Search). Cette modification devrait vous permettre de voir les images dans leur version pleine taille grand format.
- Amélioration des synonymes en hébreu. [nom de code de lancement, « SweatNovember » ; nom de code de projet, « Synonyms »] Cette mise à jour affine le mode de traitement des synonymes hébreux sur un large éventail de langues. Comme le contexte joue un rôle essentiel en traduction, cette modification évite d’utiliser des synonymes traduits qui ne sont pas pertinents au regard du contexte de la requête.
- Recherche plus sûre. [nom de code de lancement, « Hoengg » ; nom de code de projet, « SafeSearch »] Nous avons mis à jour l’outil SafeSearch de façon à renforcer le filtrage sur certaines requêtes lorsque la fonction de filtrage strict de SafeSearch est activée.
- Fonctionnalité de recherche chiffrée disponible sur de nouveaux domaines régionaux. Google propose désormais la recherche chiffrée par défaut sur google.com pour les utilisateurs inscrits, mais ce n’est pas l’option par défaut sur les autres domaines régionaux (par ex. : google.fr pour la France). Désormais, les utilisateurs du Royaume-Uni, d’Allemagne et de France peuvent opter pour la recherche chiffrée en accédant directement à une version SSL de la page de recherche Google sous leurs domaines respectifs : https://www.google.co.uk, https://www.google.de, et https://www.google.fr.
- Navigation sur mobile plus rapide. [nom de code de lancement, « old possum » ; nom de code de projet, « Skip Redirect »] De nombreux sites web redirigent les utilisateurs de smartphones sur une autre page qui est optimisée pour les navigateurs mobiles. Cette modification utilise l’adresse url de destination finale du smartphone dans les résultats de recherche mobile, vous permettant d’éviter les pages de redirection et de charger la page cible plus rapidement.
Pour être complet, voici un récapitulatif des améliorations qui ont déjà fait l’objet d’un billet depuis la dernière fois :
- Résultats de recherche d’informations sur les vols sur google.com <http://itasoftware.blogspot.com/2011/11/see-flight-results-right-on-googlecom.html>
- Calculatrice graphique <http://insidesearch.blogspot.com/2011/12/showing-some-love-to-math-lovers.html>
- Google Goggles 1.7 <http://googlemobile.blogspot.com/2011/12/continuous-improvements-with-google.html>
- Résultats de recherche d’images sur tablette présentés en vue carrousel <http://googlemobile.blogspot.com/2011/12/tablet-image-results-in-new-carousel.html>
- Mise à jour des cartes pour le Royaume-Uni, l’Allemagne, la Finlande et la Suède <http://google-latlong.blogspot.com/2011/12/updating-maps-of-united-kingdom-germany.html>
- Recherche de films accélérée sur mobile <http://googlemobile.blogspot.com/2011/12/now-playing-faster-movie-search-on.html>
- Rhabillage de l’outil Public Data Explorer <http://insidesearch.blogspot.com/2011/12/making-public-data-more-accessible-on.html>
- Des statistiques à destination des auteurs sont désormais disponibles sur la page des outils pour les webmasters <http://googlewebmastercentral.blogspot.com/2011/12/clicks-and-impressions-for-authors.html>
- Version mobile des googlebots pour smartphones <http://googlewebmastercentral.blogspot.com/2011/12/introducing-smartphone-googlebot-mobile.html>
Les 10 derniers changements sur l’algo Google (traduction)
- Affinement des résultats de requête apparentés : Parfois, nous renvoyons des résultats de requête qui se rapprochent de la recherche effectivement saisie. Cette modification rend moins probable que ces résultats obtiennent un bon classement si l’un des mots rares de la requête initiale était supprimé dans la requête de remplacement. Par exemple, si votre recherche porte sur [widgets rouges rares], les pages qui ne mentionnent que des « widgets rouges » sont susceptibles de moins vous intéresser.
- Indexation plus exhaustive : Cette modification permet d’augmenter le nombre de documents long-tail (de longue traine) disponibles dans notre index, et donc la probabilité qu’ils soient retournés en réponse à des requêtes pertinentes.
- Nouveau classificateur de « domaines parqués » : Il s’agit d’un nouvel algorithme pour détecter automatiquement les domaines parqués. Un domaine parqué (« parked domain » en anglais) est un site fictif qui est rarement utilisé et souvent rempli d’annonces publicitaires. Comme le contenu de ces sites est généralement de peu de valeur pour nos utilisateurs, nous préférons ne pas les afficher.
- Plus de prédictions en saisie semi-automatique : Concernant la saisie semi-automatique, nous essayons de trouver un juste équilibre entre souplesse des prédictions et respect de vos intentions. Cette modification permet de renforcer la souplesse de notre algorithme de prédiction pour certaines requêtes sans trahir votre intention initiale.
- Des résultats de recherche de blogs plus actuels et plus complets : Nous avons modifié notre index de recherche de blogs dans une optique d’optimisation de l’actualité et de l’exhaustivité de sa couverture.
- Contenu original : Nous avons ajouté des signaux pour renforcer notre capacité à prédire quelle est l’originale entre deux pages web similaires.
- Résultats en direct des rencontres de la Major League Soccer et de la Canadian Football League : Cette modification permet d’afficher les derniers résultats et calendriers des matches de ces ligues, avec accès rapide aux résumés des rencontres et aux sommaires officiels.
- Actualité des résultats en images : Nous avons modifié notre façon de déterminer l’actualité des images en réponse à des requêtes portant sur les dernières nouvelles. Cette modification nous permettra de trouver plus souvent les images les plus récentes.
- Présentation pour tablettes : Nous avons apporté quelques changements mineurs de couleur et de présentation pour renforcer la convivialité sur les appareils type tablettes.
- Réécriture du code de sélection des résultats de rang élevé : Ce code exécute un traitement supplémentaire sur le groupe de résultats apparaissant en premier. Par exemple, il veille à ce que nous n’affichions pas trop de résultats provenant d’un même site (« host-crowding »). Nous avons réécrit le code pour le rendre plus simple à comprendre, plus facile à gérer et plus flexible en vue d’extension future.
Google recapitule les dix derniers changements de son algorithme
Matt Cutts (oui encore lui) vient d’annoncer via Twitter que Google listerait de façon régulière les dernière modifications apportées à son algorithme. Et de joindre la parole à l’acte en nous offrant un lien direct vers le Google Blog officiel.
Alors si Google prend l’engagement de publier de façon régulière ses modifications, Azerty-media prend l’engagement d’en publier une traduction française au même rythme. Chiche
!
Edit : la version française sera en ligne mardi matin au plus tard. Plus de réactivité lors des prochaines annonces.
ereputation : Cora dans la tourmente
« Cora et moi, la confiance est là »… Le logo qui orne la page Facebook des supermarchés Cora est aujourd’hui largement démenti par les contributions outrées des internautes qui viennent exprimer leur colère et leur indignation. Sujet de la grogne : la menace de licenciement brandie par l’hypermarché de Mondelange à l’encontre d’une employée accusée d’avoir récupéré un ticket de caisse donnant droit à un hamburger gratuit…
Entre noms d’oiseaux et appels au boycott, c’est donc sur la page Facebook de l’enseigne que les internautes viennent exprimer leur indignation. La page hongroise, une des premières à apparaitre lors de la requête Cora sur le réseau social, en prend elle aussi pour son grade et enregistre des commentaires négatifs par centaines, voire par milliers. D’un point de vue marketing, on frise la parfaite hérésie, la marque hébergeant elle-même – et malgré elle – le buzz négatif généré par la médiatisation de l’affaire.
L’occasion, sans doute, pour la marque, qui a d’ores et déjà annoncé qu’elle renonçait à la procédure de licenciement, de s’interroger sur la finalité de ses outils de communication. Avoir une fenêtre sociale sur le Web, c’est oser prendre le risque d’engager le dialogue avec ses clients / consommateurs. C’est aussi prendre le risque d’héberger une communication que l’on ne maitrise pas forcément, et qui peut, du jour au lendemain, prendre des proportions inattendues…
EDIT 1/11/11 : Cora a mis en ligne via sa page Facebook une vidéo « virale » baptisée « témoignage des collaborateurs de Cora ». Un peu d’huile sur le feu qui génère de nouveau un buzz négatif – quelques 550 réactions indignées supplémentaires. Un article de Ouest-France nous apprend par ailleurs que l’administrateur de la page Facebook serait le responsable sécurité de la marque. Une information qui, si elle est avérée, souligne l’ambiguïté ambiante : s’il est de bon ton d’avoir « son média social », ce dernier est encore souvent laissé aux mains de personnes de bonne volonté – mais qui ne maitrisent pas tous les codes de la communication en ligne. Avec possible effet boomerang à la clé.
Azerty-media sponsor de la Newsletter Actu-moteurs d’Abondance
2012 sera SEO ou ne sera pas
Naturellement concernée par l’importance du contenu éditorial, Azerty-media renforce ses compétences en matière de référencement naturel. Nouveaux outils, nouveaux indicateurs, nouveaux tableaux de bord, nouveaux collaborateurs sont au programme de cette rentrée 2011. Pour marquer ce parti-pris, Azerty-media sponsorise l’édition publique de la très sérieuse lettre d’informations Actu-moteurs du site Abondance.com.
Les 10 derniers changements sur l’algo Google (traduction)
Comme convenu, voici la traduction du billet de Matt Cutts sur les 10 dernières...Google recapitule les dix derniers changements de son algorithme
Matt Cutts (oui encore lui) vient d’annoncer via Twitter que Google listerait de...ereputation : Cora dans la tourmente
« Cora et moi, la confiance est là »… Le logo qui orne la...2012 sera SEO ou ne sera pas Naturellement concernée par l’importance du...


