ashtray
27.01.2010, 23:58
Hi,
ich möchte aus einem Seitenquelltext URLs herausfiltern unter C#, dabei habe ich es schon ein wenig eingeschränkt:
href="http://irgend_eine_url_die_ich_nicht_kenne" rel="nofollow">Title <b>
Die Einschränkung habe ich gemacht weil ich auch den Titel verwerten will.
Dies konnte ich noch auf
http://irgend_eine_url_die_ich_nicht_kenne" r
weiter einschränken.(ja da ist ein r und zwar das von rel)
Leider bekomme ich das " nicht weg bzw. jeder Versuch nur die URL heraus zu filtern ohne das " war bisher erfolglos.
Mein Ansatz bisher war so etwas in der Art
"http(.*)\""
bzw "http(.*)\" r" womit ich das obere herausfiltern konnte
Damit bekomme ich aber
http://irgend_eine_url_die_ich_nicht_kenne" rel="nofollow"
und nicht nur bis zum ersten ".
Die negierung mit ^ vor dem \" gibt nur einen Fehler und andere Sachen führetn auch nciht zu dem gewünschen Ergebnis
Mittlerweile bin ich ein wenig ratlos...
Helft mir Obiwan ihr seid meine letzte Hoffnung ... ährm falscher Film :D
EDIT:
Das mit den ^ am beginn und $ für letztes Zeichen habe ich auch schon getestet
Leider sind die URLs nicht gleich und enden alle unterschiedlich und da ich das ende nicht kenne
(nur das " ist gleich und das will ich ja nicht mehr) brachte mich das nicht wirklich weiter.
ich möchte aus einem Seitenquelltext URLs herausfiltern unter C#, dabei habe ich es schon ein wenig eingeschränkt:
href="http://irgend_eine_url_die_ich_nicht_kenne" rel="nofollow">Title <b>
Die Einschränkung habe ich gemacht weil ich auch den Titel verwerten will.
Dies konnte ich noch auf
http://irgend_eine_url_die_ich_nicht_kenne" r
weiter einschränken.(ja da ist ein r und zwar das von rel)
Leider bekomme ich das " nicht weg bzw. jeder Versuch nur die URL heraus zu filtern ohne das " war bisher erfolglos.
Mein Ansatz bisher war so etwas in der Art
"http(.*)\""
bzw "http(.*)\" r" womit ich das obere herausfiltern konnte
Damit bekomme ich aber
http://irgend_eine_url_die_ich_nicht_kenne" rel="nofollow"
und nicht nur bis zum ersten ".
Die negierung mit ^ vor dem \" gibt nur einen Fehler und andere Sachen führetn auch nciht zu dem gewünschen Ergebnis
Mittlerweile bin ich ein wenig ratlos...
Helft mir Obiwan ihr seid meine letzte Hoffnung ... ährm falscher Film :D
EDIT:
Das mit den ^ am beginn und $ für letztes Zeichen habe ich auch schon getestet
Leider sind die URLs nicht gleich und enden alle unterschiedlich und da ich das ende nicht kenne
(nur das " ist gleich und das will ich ja nicht mehr) brachte mich das nicht wirklich weiter.