après vérification, les pages telerama qui sont récupérées par tv_grab_fr_telerama ne fournissent pas ces chaines.
Il n'y a donc rien à faire à part attendre qu'ils les mettent à disposition pour l'application iPhone, puisque c'est de là que le grabber récupère les infos.
c'est mis à jour de mon côté
]]>J'ai commis une version 1.20 dans cet autre fil
]]>j'utilise tv_grab_fr_iphone qui n'a pas reconnu cette émission "no data" mais il n'a pas planté. J'ai des données pour 11 jours (mon réglage)
]]>J'ai fait une nouvelle version 1.19.
Comme d'habitude:
Elle est déjà dispo là : http://www.number6.ch/tools/tv_grab_fr_telerama
et normalement dès cette nuit sur le mirroir de mythtv-fr
Avant j'utilisait
use Unicode::MapUTF8 qw(to_utf8 from_utf8 utf8_supported_charset);
Ce qui jouait sûrement le même rôle, mais induisait un dépendence difficile à obtenir.
Le
# coding: utf-8
ne semble pas fonctionner sur mon éditeur (emacs), seuls les accents le font déterminer un encoding, sinon, il reste en ascii
]]>Éventuellement, on pourrait ajouter quelque chose comme :
# coding: utf-8
au début du fichier. La plupart des éditeurs interprète cela comme étant l'encodage utilisé pour le fichier.
Je vois aussi qu'on peut forcer perl à interpréter les chaînes en utf-8 par
use encoding 'utf8';
mais, en même temps, je ne trouve pas la doc perl très claire sur ce point.
J'ai cru comprendre que par défaut perl utiliserait un encodage ISO 8859-1 (Latin-1).
Ça semble incohérent avec le fait que j'avais remplacé 'Ann.e' par 'Année' pour que ça marche.
Le but était surtout pour le réalisateur qui ne marchait plus, et comme j'ai tendence à me méfier des accents j'ai fait la même chose pour l'année, j'ai mis ".+" comme ça au moins un caractère est pris en compte, c'est ce plus qui manquait dans touts les regexp avant.
Mon éditeur se débrouille très bien en UTF8, mais par principe, j'évite toujours d'avoir un code dépendant de l'encodage on ne sait jamais, mais si ça te pose un quelconque problème, pas de souci, on peut mettre des accents.
]]>Étonnant, pour la regexp de "Année", j'avais fait la modif inverse il n'y a pas longtemps.
Théoriquement, puisque maintenant les page de telerama.fr sont bien converties de Windows-1252 à UTF-8, il n'y a plus besoin d'utiliser des regexp pour les caractères accentués.
En tout cas ça marche sans chez moi (Linux).
Utiliserais-tu, pour le script, un éditeur qui ne sauve pas les fichiers en UTF8 ? Ou y aurait-il un autre soucis ?
]]>Elle est déjà dispo là : http://www.number6.ch/tools/tv_grab_fr_telerama
et normalement des cette nuit sur le mirroir de mythtv-fr