24 septembre 2008 — Moteurs de recherche, Outils Google

Après l’indexation de vidéos, l’indexation de maps et d’autres posts de blogs, avec GAudI qui est sorti le 15 septembre dernier dans Google Labs, Google se lance dans l’indexation de contenus audio.
On se demande tout de suite ce que cela veut dire : parler dans son micro et avoir un résultat ? moteur de recherche de podcasts ? et bien non. GAudI (nom d’un célèbre artiste espagnol) fournit à partir d’une requête tapée par clavier une liste de vidéos. Dans la barre de progression de lecture, on peut y voir les moments précis où la requête est prononcée (rectangle 1 sur l’image). Sous la vidéo choisie, une liste de liens suivis de la phrase écrite comprenant la requête permet de se positionner directement au moment où cette phrase est prononcée (rectangle 2 sur l’image).

Actuellement, GAudI n’indexe que les discours politiques, on peut imaginer que d’ici quelques années, ce nouveau moteur de recherche verticale pourra s’étendre à d’autres domaines et même indexer des podcasts.
En quoi Google Audio Indexing pourrait être intéressant pour les professionnels ?
Et bien par exemple pour l’e-réputation (brand management), cela permettrait de savoir ce qui se dit d’une marque sur des médias Internet dont le contenu n’est pas crawlé actuellement tels que les vidéos Youtube, dailymotion, etc. Cela pourrait également être utile pour des médias autres qu’Internet : la télé ou la radio, encore faudrait il que ces médias publient leurs contenus sur Internet (ce qui se fait de plus en plus).
Pour l’optimisation des vidéos, GAudI donnerait une marche à suivre dans un premier temps : placer des mots-clés dans ses contenus audio/vidéo… Je vois tout de suite les adeptes du SEO blackhat qui se remuent les mains en se disant qu’ils testeront des vidéos avec le même mot répété 50 fois à la suite en les faisant passer pour de l’art contemporain…
Toujours pour cette histoire de recherche universelle, imaginons que les vidéos (et peut être podcasts) issus de GAudI apparaissent dans l’index principal de Google, il serait nécessaire d’y porter une réelle attention…
A quand donc la démocratisation des blogs et des sites audio et vidéo ? (même si cela existe déjà). GAudI amorce-t-il une nouvelle manière de rechercher sur le web ?
A surveiller…
23 août 2008 — Optimisation SEO
De nos jours, l’optimisation des images est de plus en plus importante lorsque l’on parle SEO.
Pourquoi optimiser ses images pour le référencement ?
- Une image, c’est du contenu alternatif.
- Ça apparaît dans des moteurs de recherche verticaux (moteurs spécialisés dans un type de contenu : images, vidéo, maps…) tels que Google images.
- C’est un impact visuel fort pour les utilisateurs/visiteurs/clients
- Ça peut apparaître en recherche universelle (j’en parle dans mon article sur Google Image Labeler)
- Il faut penser au visual rank !
Visual rank ?
Le visual rank, c’est l’équivalent du page rank pour les images. L’ami Google ne l’a pas encore mis en place mais a clairement annoncé qu’il travaillait dessus. Si le poids de cet indicateur est aussi important que celui du PR, il ne faudra pas le négliger; alors pourquoi ne pas préparer ses contenus tout de suite.
Les règles de base d’optimisation des images pour le référencement :
- Placer l’image dans une balise <img> en html. Cela peut paraître bête mais certains utilisent le css pour afficher leurs images dans des <div>, évidemment, ce genre de contenu n’est pas crawlé.
- Utiliser l’attribut “alt” de la balise <img> pour insérer du contenu alternatif (contenu qui n’est pas affiché dans le navigateur) et si possible y insérer des mots-clés (Attention tout de même à ne pas en abuser). L’attribut “alt” doit contenir une brève description de l’image elle même et non du site ou du contenu de l’article où elle apparait.
- Vérifier que l’image est en rapport avec le contenu de la page dans laquelle elle apparaît. Cela n’est pas forcément obligatoire mais c’est mieux, ça permet d’homogénéiser les mots-clés. Une image qui apparait au milieu d’un contenu en rapport direct avec elle sera surement mieux positionnée.
- Nommer son image de manière pertinente. Un nom tel que img007989.jpg n’est pas optimal, c’est une donnée qui apparaît dans l’url de l’image, c’est donc sûrement crawlé et pris en compte.
- Héberger l’image sur le même domaine que le contenu dans lequel elle apparaît. Une image hébergée en externe, ça prend moins de place, ça pourrait apporter du trafic (je pense à l’externalisation sur Flickr par exemple) mais ça ressort moins bien qu’une image placée dans le même domaine que l’article en termes de référencement sur les moteurs de recherche verticaux.
- Placer les fichiers d’image dans un même dossier pour une url claire et simple du type www.nomdedomaine.com/img/nomdelimage.jpg. Je ne suis pas certain que google crawl les dossiers d’image mais je le pense. On ne sait jamais, peut être qu’il existe des bots spécialisés dans la recherche verticale qui cherchent ce genre de dossiers de médias exclusivement, il existe bien des bots spécialisés dans l’indexation des flux rss… à méditer donc.
Un exemple d’optimisation d’image perso :
Récemment je me suis intéressé aux données Google Analytics d’un petit blog que j’avais mis en ligne il y a 6 mois et qui contient quelques articles. Je ne publie plus dessus depuis quelques mois, je m’attendais donc à avoir entre 0 et 1 visite par jour. A mon grand étonnement, ce blog génère un bon nombre de visites par jours grâce à… une image!
L’image en question est le logo de Deezer, elle est présente en quatrième position sur la requête “Deezer” sur Google images France, deuxième sur “Logo Deezer” sur Google images France et première sur les requêtes “logo deezer” et “deezer logo” sur Google images US.

Résultat sur Google images :

- On remarque que l’alt de l’image apparaît (”Logo du site Deezer”), sa taille, son poids, et le domaine sur lequel elle apparaît (pas forcément celui sur lequel elle est hébergée).
Résultat lorsque l’on clic dessus :

- L’url d’hébergement et donc le nom de l’image apparaissent.
N’hésitez pas à réagir, surtout si vous avez d’autres tuyaux !
21 août 2008 — Outils Google

Ce matin en utilisant Google images version américain (via google.com) , je suis tombé complètement par hasard sur ce “jeu” Google. Ne vous inquiétez pas, le géant américain de la recherche en ligne ne se lance pas encore dans le jeu vidéo (même si Google Lively a été annoncé récemment), mais dans un petit jeu qui pourrait lui être très utile.
Google Image et sa pertinence douteuse :
Je n’apprends à personne que la pertinence actuelle de la recherche verticale par Google image est loin d’être optimale. Un petit exemple néanmoins pour les plus sceptiques :

L’importance de la recherche universelle :
Aujourd’hui avec le développement de la recherche universelle (réunir les résultats de google images, youtube, google actu etc. dans les pages de recherche générales du moteur) et le boum des recherches verticales (images, vidéos, maps, actualités, blogs) il est important pour le plus gros moteur de recherche de la planète de corriger cela. L’optimisation des contenus multimédia des sites Internet se développe car la recherche universelle ouvre de nouvelles perspectives stratégiques en termes de visibilité (l’impact visuel par exemple…).

Human Labor ou comment utiliser l’homme pour améliorer sa pertinence :
Google image labeler est donc un jeu qui consiste à donner des labels (des courtes descriptions) à des images qui défilent en un temps limité. Petite particularité, lorsque l’on joue, c’est avec un autre internaute. Je pense que vous aurez compris le principe : c’est très simple, plutôt que de développer un algorithme compliqué qui détermine la pertinence d’une image en rapport avec une requête, pourquoi ne pas utiliser deux humains et se dire que si les deux sont d’accord (labels identiques), la description est forcément pertinente… malin l’ami Google! Il y a même un classement des meilleurs contributeurs.
A vous de jouer : Google Image Labeler