Pep nous signale l'extension du format sitemap proposé par Google. En fait il s'agit de l'ajout d'un namespace "news" contenant trois champs supplémentaires ("publication_date", "keywords", et "stock_tickers").

Petites remarques en vitesse :

  • Avec le champ supplémentaire "stock_tickers" , je pense qu'il s'agira avant tout pour Google d'indexer les informations financière plus que les blogs. Mais cette extension du format reste à surveiller.
  • Même si l'extension du namespace est prévue dans le standard 0.9, le code donné par Google avec son xmlns:news="http://www.google.com/schemas/sitemap-news/0.9", appliqué sur un namespaces version 0.84, ne donne pas vraiment un bon exemple de standardisation ! Doit-on en déduire que la version 0.84 du protocol aura sa vie propre ?
  • Dans le document cité, il est mentionné The <loc> tag must be a URL to an article page.. Faut-il penser à une quelconque référence au nomage URL ? Dans ce cas il faudra oublier les slash en fin d'URL.
  • Les sitemap's ainsi créés ne peuvent concerner qu'une seule source de publication (bien que celle-ci ne soit pas explicitement mentionnée)
  • Enfin, ces sitemap's sont limités en taille à 1000 URL maximum. Google conseille de générer ce flux fréquemment et de n'y faire apparaître que les dernières mise à jour! (C'est peu être le début de la définition d'un nouveau format pour remplacer RSS et ATOM ?)

Alors une petite inquiétude quand même. Si chacun (de la bande des trois) rajoute un petit bout de définition dans le sitemap qu'il exploite, où va t'on ? Allons nous voir d'ici peu, une extension "news" (from msn), et une autre "news" (from Yahoo), elle aussi concurrente et sans doute 'presque' compatible ?