IDHttp1 parse ile karakter sorunu.

Delphi'de kod yazma ile ilgili sorularınızı bu foruma yazabilirsiniz.
Cevapla
BOGACHAN
Üye
Mesajlar: 38
Kayıt: 12 May 2004 02:37
Konum: istanbbul

IDHttp1 parse ile karakter sorunu.

Mesaj gönderen BOGACHAN »

s.a
imdb.com sitesinden IDHttp1.Get ile sayfadan isdeğim bilgileri parseleyip alabiliyorum. fakat bazı oyuncu adları charsetler farklı olduğunudan düzgün gelmiyor
ğrnek olarak Russell Crowe, Renée Zellweger, burdaki 2. isim gii bunların düzgün gözükmesi yani imdb.com sayfasındaki gibi görüntülenmesi için ne yapmam lazım.

Renée Zellweger
Renée Zellweger

idhttp nin request tindeki charset language ayarlarını sayfada imdb.com sayfasındaki charset=iso-8859-1 göre ayarlamaya çalıştım ama ya yapamadım yada başka bir yolu var.

yardımcı olursanız sevinirim. kolay gelsin.
Kullanıcı avatarı
Battosai
Üye
Mesajlar: 1316
Kayıt: 01 Eki 2007 12:02
Konum: Ankara

Re: IDHttp1 parse ile karakter sorunu.

Mesaj gönderen Battosai »

Kod: Tümünü seç

S:=IDHttp1.Get();
S:=UTF8Encode(S);
BOGACHAN
Üye
Mesajlar: 38
Kayıt: 12 May 2004 02:37
Konum: istanbbul

Re: IDHttp1 parse ile karakter sorunu.

Mesaj gönderen BOGACHAN »

denedim ama olmadı dostum. sayfa kaynağını metin belgesine yapıştırıp farklı kaydetten utf 8 seçip kaydettiğimdede bişey değişmiyor.

Kod: Tümünü seç

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
 
<html>
<head>
<meta http-equiv="X-UA-Compatible" content="IE=EmulateIE7" />
<meta http-equiv="content-type" content="text/html; charset=iso-8859-1">
<title>Cinderella Man (2005)</title>
<link rel="canonical" href="http://www.imdb.com/title/tt0352248/" />
<meta name="title" content="Cinderella Man (2005)">
<meta name="description" content="Directed by Ron Howard.  With Russell Crowe,[b] Ren&#xE9;e Zellweger[/b], Paul Giamatti. The story of James Braddock, a supposedly washed up boxer who came back to become a champion and an inspiration in the 1930s. Visit IMDb for Photos, Showtimes, Cast, Crew, Reviews, Plot Summary, Comments, Discussions, Taglines, Trailers, Posters, Fan Sites">
koyu olarak yazı olan alan değişmiyor.

http://www.imdb.com/title/tt0352248/ bu sayfa üzerinden konuşuyorum
Kullanıcı avatarı
barutali
Üye
Mesajlar: 297
Kayıt: 02 Tem 2007 02:30

Re: IDHttp1 parse ile karakter sorunu.

Mesaj gönderen barutali »

s := StringReplace(s,'&#xE9;','é', [rfReplaceAll,rfIgnoreCase]);
amatör küme programcı :D
Kullanıcı avatarı
G.Arkas
Üye
Mesajlar: 829
Kayıt: 01 Eki 2007 07:16
Konum: İstanbul
İletişim:

Re: IDHttp1 parse ile karakter sorunu.

Mesaj gönderen G.Arkas »

Bence direk olarak EmbeddedWB kullan;
DocumentsourceTEXT opsiyonu ile istediğin html dosyasını yada web sayfasını komple Parseleyebilirsin.
Bileşenler kısmında yayınlamıştık.

İyi çalışmalar.
Resim
BOGACHAN
Üye
Mesajlar: 38
Kayıt: 12 May 2004 02:37
Konum: istanbbul

Re: IDHttp1 parse ile karakter sorunu.

Mesaj gönderen BOGACHAN »

G.Arkas yazdı:Bence direk olarak EmbeddedWB kullan;
DocumentsourceTEXT opsiyonu ile istediğin html dosyasını yada web sayfasını komple Parseleyebilirsin.
Bileşenler kısmında yayınlamıştık.

İyi çalışmalar.
arkadaşım teşşekür ederim. sitesinden indirip kurdum dediğin metodu denedim ve isimler hiç bozulmadan geliyor. fakat içindeki demo örnekleri delphi7 sonraki sürümlerle yapılmış galiba kimisi açılıyor çoğu çalışmıyor. takıldığım bişey olursa yardımınızı rica edeceğim. tekrardan teşkürler. kolya gelsin.
Cevapla