Vous n'êtes pas identifié(e).
Merci ça fonctionne, j'ai pu tester et j'ai 2 remarques :
- peux-tu inverser dans la description la season et l'épisode (pour une meilleure lisibilité) ?
- les numéro d'épisode et de season ne sont pas en accord entre la description et le champ ExxSxx ???? C'est la même chose pour tv_grab_iphone.fr.
<title>Affaires non classées</title>
<sub-title>Secrets de famille</sub-title>
<desc lang="fr">Episode : 3/8 - Saison : 3 - Gemma Boyd, 17 ans, est retrouvée morte au bas de l'escalier d'une maison inhabitée, mise en vente par sa mère et son beau-père, des agents immobiliers. Meurtre ou accident ? La police et Sam Ryan mènent l'enquête. Rapidement, de sombres vérités sur la famille de la jeune victime sont mises au jour : sa mère, Suzy, l'a en effet mise à la porte lorsqu'elle a découvert qu'à 13 ans, Gemma était enceinte...</desc>
<credits>
<actor>Amanda Burton (Sam Ryan)</actor>
<actor>William Armstrong (Trevor Stewart)</actor>
<actor>Victoria Gay (Gemma Boyd)</actor>
<actor>Nick Bagnall (Lee Bennett)</actor>
<actor>Sudha Bhuchar (Jan Picton)</actor>
<actor>Jesse Birdsall (Paul Franklin)</actor>
<actor>Lesley Manville (Suzy Franklin)</actor>
<actor>Marcelle Duprey (Kate Franklin)</actor>
</credits>
<category lang="fr">série</category>
<category lang="fr">série policière</category>
<icon src="http://guidetv-iphone.telerama.fr/verytv/procedures/images/2012-03-18_1_02:35.jpg" />
<episode-num system="xmltv_ns">2.2/8.</episode-num>
<video>
EDIT dans ce cas, il semble qu'il s'agit de l'épisode 2 de la série 3. Un beau mélange .....mais je ne sais pas dire si ça vient de la source ou du grabbeur.
Apparemment ce n'est pas un problème de grabbeur mais de source car beaucoup de séries n'ont pas de problème
Dernière modification par gilles74 (18/03/2012 00:40:22)
Hors ligne
Salut Gilles,
En fait la description et le champ <episode-num system="xmltv_ns"> correspondent bien.
Selon la DTD de xmltv, le champs épisode-num a la forme suivante :
s/nb_s.e/nb_e.p/nb_p
s est le numéro de la saison
nb_s est le nombre de saisons
e est le numéro d'épisode
nb_e est le nombre d'épisodes dans la saison
p est la partie d'un épisode en plusieurs parties
nb_p est le nombre de parties.
Chacun des éléments peut être omis.
s, e et p sont numéroté à partir de zéro, mais les nombres commencent à 1.
par exemple :
0.0. : saison 1, épisode 1, partie inconnue
1.12/13. : saison 2, épisode 13 sur 13 de la saison, partie inconnue
2..1/3. : saison 3, épisode inconnu, partie 2 sur 3 parties
1/2.5/11.2/3 : saison 2 sur 2, épisode 6 sur 11, partie 3 sur 3.
A priori, le site de télérama ne fournit pas le numéro et le nombre de parties. En tout cas je ne suis jamais tombé dessus.
D'après Allociné, Wikipedia et IMDB, c'est bien le titre de l'épisode 2 mais tous les programmes TV indiquent épisode 3 !?
Pour la description, je dois pouvoir faire ça, je te tiens au courant.
Hors ligne
C'est bon, j'ai inversé saison et épisode dans la description.
La nouvelle version est là : tv_grab_fr_telerama_pg-1.14
Have fun ...
Hors ligne
merci et ok pour tes explications
mais je crois que si la numérotation des épisodes commence à zéro, il y a un problème pour bon nombre des séries. Souvent le fameux champs correspond aux numéros donnés dans la description et parfois c'est différent. Quels sont les bons numéros ??
Hors ligne
Tu es sur que tu as constaté ça avec tv_grab_fr_telerama_pg ?
En ligne 887 (ou 889 selon le cas) du script on soustrait 1 à la valeur trouvé dans le flux et on la met dans le champ episode-num.
La valeur trouvée dans le flux est celle utilisée dans le descriptif.
Il y a peut-être un bug, tu aurais un exemple où il y a problème ?
Hors ligne
désolé, je ne suis mélangé les pinceaux, je fais tourner plusieurs grabbers en même temps.
C'est ok pour ton grabbeur, il est à noter que ce décalage est corrigé à l'affichage dans le guide des programmes: les numéros d'épisode et de saison sont identique dans le champ ExxSxx et dans la description.
Hors ligne
Encore une version pour corriger un petit bug et ajouter un traitement.
- Correction d'un oubli dans le traitement des numéros d'épisode, si le nombre d'épisodes était
absent, le numéro n'était pas récupéré.
- Ajout du traitement du nombre de saison.
C'est par là : tv_grab_fr_telerama_pg-1.15
Hors ligne
Ca passe chez moi mais j'ai encore des remarques tant que tu as les mains dans le camboui
Dans ma base de données (0.25) je n'ai aucune étoile de renseignement (champ stars). C'est vrai que ce n'est pas facile de faire la part des choses entre toutes les évaluations .... mais dans le cas des programmes TV, il n'y a que le champs "stars" de prévu dans la base de données comme évaluation.
De la même façon, il y a un mélange entre la date de première diffusion "originalairdate" (jamais renseigné) et la date de diffusion "airdate" (qui est parfois à 1950)
Hors ligne
Salut Gilles,
Les "étoiles" apparaissent bien dans le xml généré par le script.
Par contre j'ai constaté une différence avec tv_grab_fr_iphone.
Dans tv_grab_fr_telerama, ça apparait sous la forme :
<star-rating>
<value>1</value>
</star-rating>
ce qui est la présentation conforme à la DTD xmltv (puisque c'est généré ainsi par la librairie xmltv).
Alors que dans tv_grab_fr_iphone ça apparaît ainsi :
<star-rating>1/5</star-rating>
Ce qui n'est pas conforme.
Par contre, avec tv_grab_fr_telerama, il manque le "/5" ce qui n'est pas normal, c'est exigé par la DTD. C'est peut-être ça qui perturbe Mythtv.
Par contre si c'est dû au fait que ça apparaisse dans le champ "value", je n'y peux rien, c'est du côté Mythtv qu'il faut changer. En effet <star-rating> dispose de 2 sous champs <value> et <icon> (pour mettre un lien sur une éventuelle symbologie correspondant à la note)
Pour les années, la DTD ne définit qu'un seul champ <date> qui correspond à la date de fin de réalisation du programme/film (qui est la date de début du copyright).
Le flux émet une seule date qui semble correspondre à ce que demande la DTD.
Ça ne correspond donc à originalairdate que pour les programmes télé (magazine, téléfilm, etc.).
Pour une raison que j'ignore, la regexp qui extrayait la <date> du flux ne fonctionnait plus.
Elle marchait au mois daoût dernier mais plus aujourd'hui alors qu'elle n'a pas changé. Par contre, je crois me souvenir que j'ai eu une mise à jour de Perl entre-temps.
Pour le "1950" dans airdate, je penche plutôt pour une erreur de parsing du côté de Mythtv ou de ses scripts associés. Je n'ai pas trouvé d'airdate à 1950 dans les xml que j'ai vérifiés, par contre j'ai pas mal d'émissions qui débutent ou finissent à 19h50 .
Les horaires de diffusion sont de la forme :
<programme start="20120329195000 +0200" stop="20120329204500 +0200" showview="546971417" channel="C20.telerama.fr">
J'en ai pris un au hasard et je vois que je tombe sur 19h50 . Et en plus ça m'apprend qu'on passe à l'horaire d'été le WE prochain (+0200).
J'ai corrigé ces 2 points ("/5" et <date>), ça se passe par là : tv_grab_fr_telerama_pg-1.16.
Avec un peu de chance tu auras originalairdate et stars qui seront renseignés, sinon c'est toi qui va devoir mettre les mains dans le cambouis
Hors ligne
Cool ça fonctionne, j'ai bien fait d'insister
( date et étoiles )
Hors ligne
Salut,
Après avoir lu ce message, je me suis dit que ce serait bien de récupérer directement les logos sur lyngsat .
J"ai donc fait une nouvelle version.
Si un fichier "logo-path.txt" existe dans le répertoire courant, le grabber l'utilise pour déterminer l'emplacement des logos des chaînes.
Le format est le même que celui de lookup_tv_grab_fr_telerama.txt, bien que le 2ème champ (chid) ne soit pas utilisé puisque configurable par le grabber.
J"ai corrigé la plupart des erreurs de lookup_tv_grab_fr_telerama.txt dans logo-path.txt (nom de chaîne incorrects essentiellement et quelques chaînes oubliées). Par contre je n'ai pas fait de recherche des logos manquants.
Le fichier logo-path est utilisable pour grab_fi_icons_xmltvids.
Exemple de contenu :
France 2|C2.telerama.fr|http://www.lyngsat-logo.com/logo/tv/ff/france2.jpg
Si les logos existent déjà en local, on peut mettre à la place :
France 2|C2.telerama.fr|/home/$user$/.mythtv/chaines/icones/france2.jpg
où $user$ est à remplacer par son nom.
Après utilisation de "tv_grab_fr_telerama --configure --config-file mon_fichier_de_conf.xmltv", on obtient donc des fichiers contenant des lignes du type :
channel 1 TF1;http://www.lyngsat-logo.com/logo/tv/tt/tf1.jpg
ou
channel 1 TF1;/home/$user$/.mythtv/chaines/icones/tf1.jpg
.
De même le fichier des programmes contient par exemple :
<channel id="C1.telerama.fr">
<display-name>TF1</display-name>
<icon src="http://www.lyngsat-logo.com/logo/tv/tt/tf1.jpg" />
</channel>
Si vous pensez que ça peut vous simplifier la vie, c'est ici tv_grab_fr_telerama_pg-1.17 et là logo-path.txt
Hors ligne
C'est une bonne idée et comme tu as mis à jour le fichier "lookup_tv_grab_fr_telerama.txt" je vais le mettre à jour sur le dépot. Comme celà tu pourras y faire appel et te passer de logo-patch.txt (inutile de maintenir 2 fichiers au contenu identique)
Au passage, celà me permet de mettre le fichier "lookup_tv_grab_fr_iphone.txt". à jour puiqu'il utilise la même source. Et je vais demander à Moé s'il veut bien en faire de même pour son grabbeur.
Merci pour ton aide.
Hors ligne
Nouvelle version 1.18 avec correction de une ou deux regexp:
Elle est déjà dispo là : http://www.number6.ch/tools/tv_grab_fr_telerama
et normalement des cette nuit sur le mirroir de mythtv-fr
Dernière modification par zubrick (04/06/2012 22:13:37)
Hors ligne
Salut Zubrick,
Étonnant, pour la regexp de "Année", j'avais fait la modif inverse il n'y a pas longtemps.
Théoriquement, puisque maintenant les page de telerama.fr sont bien converties de Windows-1252 à UTF-8, il n'y a plus besoin d'utiliser des regexp pour les caractères accentués.
En tout cas ça marche sans chez moi (Linux).
Utiliserais-tu, pour le script, un éditeur qui ne sauve pas les fichiers en UTF8 ? Ou y aurait-il un autre soucis ?
Hors ligne
Salut Patrick,
Le but était surtout pour le réalisateur qui ne marchait plus, et comme j'ai tendence à me méfier des accents j'ai fait la même chose pour l'année, j'ai mis ".+" comme ça au moins un caractère est pris en compte, c'est ce plus qui manquait dans touts les regexp avant.
Mon éditeur se débrouille très bien en UTF8, mais par principe, j'évite toujours d'avoir un code dépendant de l'encodage on ne sait jamais, mais si ça te pose un quelconque problème, pas de souci, on peut mettre des accents.
Hors ligne
Ça ne me pose pas de problème particulier. C'est juste que je lis plus facilement un 'é' qu'un '.+' .
Éventuellement, on pourrait ajouter quelque chose comme :
# coding: utf-8
au début du fichier. La plupart des éditeurs interprète cela comme étant l'encodage utilisé pour le fichier.
Je vois aussi qu'on peut forcer perl à interpréter les chaînes en utf-8 par
use encoding 'utf8';
mais, en même temps, je ne trouve pas la doc perl très claire sur ce point.
J'ai cru comprendre que par défaut perl utiliserait un encodage ISO 8859-1 (Latin-1).
Ça semble incohérent avec le fait que j'avais remplacé 'Ann.e' par 'Année' pour que ça marche.
Hors ligne
Pour le .+ au lieu du ., c'est parce que l'utf8 est un encodage de taille variable, et du coup, un caractère spécial peut prendre plus que 1 byte ce qui induit perl en erreur, s'il ne connait pas l'utf8, car il affichera plus d'un caractère, et c'est peut-être là que le use que tu propose entre en compte, car au final je penses que perl ne voit un accent ni dans le code ni dans le text parsé, mais simplement de caractère spéciaux dans ce qu'il y a maintenant.
Avant j'utilisait
use Unicode::MapUTF8 qw(to_utf8 from_utf8 utf8_supported_charset);
Ce qui jouait sûrement le même rôle, mais induisait un dépendence difficile à obtenir.
Le
# coding: utf-8
ne semble pas fonctionner sur mon éditeur (emacs), seuls les accents le font déterminer un encoding, sinon, il reste en ascii
Hors ligne
Arte a réussi à faire bugger le grabber, avec le film de mercredi soir: "Le sens de la vie pour 9,99 $"
Le dernier '$' se confond avec les limites de champs des données parsée (je n'ai plus d'iphone, mais si quelqu'un en a un, je suis curieux de savoir si leur appli fonctionne avec ça)
Je suis désolé pour ceux qui souhaitaient enregistrer ce film, car j'ai été obbligé d'enlever le '$' de la fin.
Ils n'avaient qu'à faire ça en euro, ça aurait été moins problématique.
J'ai fait une nouvelle version 1.19.
Comme d'habitude:
Elle est déjà dispo là : http://www.number6.ch/tools/tv_grab_fr_telerama
et normalement dès cette nuit sur le mirroir de mythtv-fr
Dernière modification par zubrick (04/06/2012 22:13:06)
Hors ligne
mirroir de MythTV-fr pas (encore) xmltv-fr
Hors ligne
effectivement, c'est corrigé :-D
Hors ligne
merci pour cette correction, ça a planté tout le script ou juste l'émission en question ?
j'utilise tv_grab_fr_iphone qui n'a pas reconnu cette émission "no data" mais il n'a pas planté. J'ai des données pour 11 jours (mon réglage)
Hors ligne
Ca a fait planté tout le script, car il n'a pas réussi à faire un comparaison d'heure
Hors ligne
depot arch mis à jour avec cette version
Hors ligne
Hello,
c'est mis à jour de mon côté
Hors ligne