Hi@all,
also ich wollte mir mittels der TcpClient-Klasse den Seitenquelltext einer bestimmten Seite ausgeben lassen, allerdings enthält dieser nur Kryptische Zeichen. Hier erstmal der Quellcode meines Programms:
static void Main(string[] args)
{
TcpClient tcp = new TcpClient();
tcp.Connect("mangafox.me", 80);
Console.WriteLine("Connected...");
StreamReader reader = new StreamReader(tcp.GetStream());
StreamWriter writer = new StreamWriter(tcp.GetStream());
writer.WriteLine("GET /manga/dead_tube/v01/c000/1.html HTTP/1.1");
writer.WriteLine("Host: mangafox.me");
writer.WriteLine("Connection: keep-alive");
writer.WriteLine("Cache-Control: max-age=0");
writer.WriteLine("Upgrade-Insecure-Requests: 1");
writer.WriteLine("User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36");
writer.WriteLine("Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8");
writer.WriteLine("Referer: http://mangafox.me/manga/dead_tube/");
writer.WriteLine("Accept-Encoding: gzip, deflate, sdch");
writer.WriteLine("Accept-Language: de-DE,de;q=0.8,en-US;q=0.6,en;q=0.4");
writer.WriteLine("Cookie: bm_monthly_unique=true; __gads=ID=8df2fed88321a313:T=1497212553:S=ALNI_MZ7bEUUUeUTsdRjPIw6NkPZAhxLww; bm_daily_unique=true; bm_sample_frequency=100; mfsid=vfv38ont1s466eitno0cdro6n6; OX_plg=swf|shk|pm; mfvb_sessionhash=0856ec18363e7b5702133b36c694e199; bm_last_load_status=NOT_BLOCKING; __utma=18273573.162728704.1497199836.1497237101.1497262569.6; __utmc=18273573; __utmz=18273573.1497199836.1.1.utmcsr=(direct)|utmccn=(direct)|utmcmd=(none); mfvb_lastvisit=1497199832; MarketGidStorage=%7B%220%22%3A%7B%22svspr%22%3A%22http%3A%2F%2Fmang
afox.me%2F%22%2C%22svsds%22%3A46%2C%22TejndEEDj%22%3A%22MTQ5NzE5OT
gzOTc0NzEyODAwMDE0NjE%3D%22%7D%2C%22C128000%22%3A%7B%22page%22%3
A1%2C%22time%22%3A1497269868078%7D%2C%22C128002%22%3A%7B%22page%
22%3A1%2C%22time%22%3A1497267902950%7D%2C%22C128001%22%3A%7B%22p
age%22%3A1%2C%22time%22%3A1497268000802%7D%2C%22C128003%22%3A%7B
%22page%22%3A1%2C%22time%22%3A1497263687032%7D%7D; __unam=657356c-
15c98107d68-26374ae2-144; session_depth=mangafox.me%3D3%7C285794267%3D1%7C517318171%3D2; OX_ssn=206198147");
writer.WriteLine("");
Console.WriteLine("Written...");
writer.Flush();
Console.WriteLine("Flushed...");
string line = "";
do
{
line = reader.ReadLine();
Console.WriteLine(line);
} while (line != null);
Console.ReadKey();
}
(Sorry, durch den langen Cookie ist es ein bisschen unübersichtlich.)
Die Request Daten habe ich vom Browser ausgelesen und 1:1 übernommen.
Jetzt habe ich das Problem, dass die Ausgabe folgendermaßen aussieht:
HTTP/1.1 200 OK
Server: nginx
Date: Mon, 12 Jun 2017 15:33:54 GMT
Content-Type: text/html; charset=utf-8
Transfer-Encoding: chunked
Connection: keep-alive
Set-Cookie: mfsid=3fc71nij2t4skpoasiiaif6cn5; path=/; domain=.mangafox.me
Cache-Control: max-age=3600
Pragma: no-cache
Expires: Mon, 12 Jun 2017 14:42:45 GMT
Content-Encoding: gzip
Vary: Accept-Encoding
X-Cache: HIT
hb: TR
TEST: hb
PX-Cache: MISS
16e9
ý ý[ýsý6ýýýS5ýýNýgýuRMMyIý\;ow+ýSý$ý)ý!)ýýýýýýk ý@™[ýUUý$h4ý>ý/ýxýýýý_ýEýýýýýýý93–ýýýsýzqýýýë7ýýmvýUýýyXýIýFýýýýýEQýcýZýýýg&ý:ýº%Z6V_Å6ý
ýýý<|p!fý]FqýýcýF#9ý`ýýxýUýýyj.ýýýýýJýn@Dýýpýý"mýWýc<OýýEýý.ýýý/ý(ýmaýýýýr^8ýbý>3ý*%ýý]røýwý$rmýý®VgýýýwPJýýô¥ý]ýw[ýý3ýýVýýyýýYýýýýOýXý}GýlXý74ýýUý lýWý
ý6ýýyýc?ý,ýHHý,ýjTn:ýý",">ý'@þyýýQsýýI/,9Rý(Rýg]c$ýh9ý$9ZýEmý~ýý’%ýýýVý?|ýýzý"ýýXdaýýý&xýý0f9ý3^ýý)ýýEýDlýýFOý`ýýY¤ýýQýý17ýýýýsýýýfýJnýý"mý:Os9ýyaýEýqKhýeýýýýý'7<3?ýý'Erýcý7ó!?ýýý ý]pýýýppýýýhý("ýýN{ýýYýsýýý~Bý#%ýý=ýýnýcýLýýýFgýýYo04ý ýýýýýýzýNg48;;<.MýaýýýýýFýýý9ýÑ6ý<>Kýýý6@ýz×ýwýuýdýýsýý9vRýqý `ýq^"ø\ýýý*7ý&[d|V&ýMý¬ý= ýýý?#ý:ý`ýýmýs,$ýýýs7ýeW7MýýýýýIeýv ýaY§cTýý.ýýlmýýýý2xý]ýýýýd[K?ýnýP]Àaýýýýý~ýXdýL|yýý'ý÷ýýýýýcvýýpýýýKvýÄlIEýýýýýýýSXýAýb30ýcxýýý$#ýý<ýý\ýCný~ýýýýýýE% )ýýý+ýýýq3§ýJýýýOr.ýýï1ýýýý+ýýýG4ýýýœ'ý<ýnŸ,-zfEýý[0$ýýlshýýýý-IýýnX4[ýýý*ý3ý*ýýUý%Sý.ýýý]EýýýýIýýýKJýý\ýA:Rýý|ýLýýlýF9ýýp´ýýAýýýGýwýýýý$ýýpýýýEýýýgýuh</ý1ýý)7W9ÞýýýZýýý|ýýýý'ý6býGs^<Oý7z2ýýVý/7ýýýý9ýqý?ý)ýsý.ýýý0Zý;1_ýýB{LMý'ýLý-ý'fýý5ýýAýýýý3ý1ý1b7ýMýNýýuýxE-ýý3ý\6!ýýY$}su ýÛý±q$K7ýSýýýý1ýHýýtyq3JýJýýý!Hýýýa i:U'ý"'Zýp+ý+ýýd kýý"hF<ýýIGýý°ýýi^ýYýlýýþýýýýýFýýÄýýýiý[ý[ýý ýý"ýQýCýýc{#:ýNý6ý s¹qýýmýNc%4ýý;@JJhwbaý,fýXýv|ýGýB1 F0UkýýýýU79/Zýýýý>X-ý7IýE8ýýh2ýýaý=&ýýdI({.uýýDýýFýKý.zH'ý$_Fý~?kBFýD@ýýý],dý7ü}ýAgýýýe?ýýýÏrý#ýa/uýýýýU8ýýýýýýýýýKý6ý7Bý:ýýagkSýýý?(MjýpýFýX.G9Nýjl1(ý¸býeW6ýIUýý3ý)ý=o6ý4Nuýýý~´iýý4u3wýý-5Mýhýh6ýý@ýý-
Býýýýý;R2ýýýuýýnoý+ýýýjýýýyýýA;b;:Wýý1ýN'ý>aýýoýýgýR6ýý ý'býaEýýý4ýyNýGýýýýýGýIýtýýFýýýý7&ýSýýHýýýýýýýýn*0Xýj!ý!ýýýýýýYýý<ýýýý]^“=ý7ý7ýýDýnMýdý}#?@ýz8*&(`CýBýnýHýýýýýZ(ýýKý;ýA_ýý7ýýý=:ýýg~ýýpý8Sýýýý,CýNý4OýxýFýHý!1ý}aýDHRýý$ýýý\Lýýpýý2ýýýýÃýýlýýý;ý^s3]ýOýýýýýý_>výýýlý_zOýý}ýýý‰ýQQPý/FýýýDý'~Fý]ý* EOýdýýýýýAýd=%¹6ýýCýN~%P,)ýIh J4/8=sýýý}ý6@ýn#]ýýGýQýý!aGýýý1b$ýBD0)ý95Sýýý(qýqýgylCGý9ýhZýaýýý5ýýýýý\ý>ý”ý"JýýýýýýýRý%wEný-ýoýýdýRý ,’))ýiI)o‹ýEýýýý\ýRý\*ýýýýbý@Gýýývýx# §“4Iýýýýý`j.ý`ýi>ý[ýJýgýHýýý`ý`ýýýdýýxýýYýýýZýmwU$Hýˆý-&ýWýýBJ&ý X(ýž`Býý ýdý]Nýýýipýý>ýýýý(ýý4sq Rlh]ýýýýýýdý!|ýýýýUýýýý(#u]ýq,ýd]z|ýýoýBýý#)@ýýtýýýddýbcg2ý6ýýýlLýýqr}{ýýýýýdmýNý\ýIfýýýýý½ýýýiýýýrZýýýH@,cU*!LvýýýkýG#ýý7Rý8ýCýpý ýwsý[ýý5<O^ ýOýýPýýýGýzJýný(ý|%ýýjýý0<?cýnýMý;ý:ýýý*eýýVsH{D,ýýSútýýýý}ýýý'{ý|Vý,ýbýýýpaýýýyýPýýýTVýýýý8OýUýýýyý$ýýGýý;ýN:ýýýggggýý=±&ýýýý4ý`ý>ýpý9{\ýýý_ýýTýDýý"aqRý7 ý;býA5ýý'ýýýýýýý6ý(Pýýýýgn~ýý )iHý!ýýý lý°,·%Yý3³ýpýQ&ýa)ý<Qý ýL3Dýoýý|u_QýHýýýýýíý:RýýZýý8ýfý@ý,HMXýý(YX6ý7ýýý|ýý=Y+ýI$9ýM?ýt.ýk}ýtý/ýýý%ý^ýIý2ýý'ýgý-ýQGtýýý8ýý^ýýLý>1JýýULýý ý7$ýýqd2ýýý+ýý^ýKýýýODUyý>Býýý/_ýÿ ýý/3ýýý`ýEaýýsx*DbýRýjý ýs5kýý&ýýýýj+ý,ý^ýýJýý2ý#Sýý#ýDýýýýBýýJý ý ýýMqý=ýýb""…]_ýqýýýýsd*ýýýeýn,lýýEýýýýýýýýsýýý|ýýMýýý,Výýýý_˜ýq36WVLQTýdIýýWýýýTý=*ýý0Trýýýý_ýz.RýGXýZý?ýýýy&;ýiIýýý$bý\#<ý_TýD:ýP«ýRýý€ýqýýýý=ý#ýýýS5ýY,¼ý6ý'ýPýVmý[ýfýýýýýýýLýý5cýý ýU^ýê"ýý5# ýJ}ýG9Lý~ýýý4>ý&ýýXý%û+$ýjyý‹ýýDýýý0ý\IýýXýýýS;ýý~ýýý]ýMýý{hýjñýqýýAýHýýfvý)ý ý×ýýk¡:ýýpKý\ým=ý6ýý&PAýtýýlý=ýpý@BÏQIý:I3ýý% ýý*PýýJýkKFýFýý*ý^)ýýAy!t)ýýýr^+lý_uýým`fýý%ý8ýy`ýýýýý~ýýuýng6ý#
ýyýuý=ýýýe:mýýýx\ýhý8ývý`_ýtóýHýý9ýTýIýýýRTýnQýLýF/*ýýAýývýHý)ý.Dýo0ý\A9ýB hsý!&mý/ýbdýýýZS5ýýýýýýùýMýÊr;ý(ý Gýn?ýývýýýý)ýnHg+*=ýýýc OZ$ýýTýýý@uýýýýý_NAýýýýýSýý,ýýýAýýoý ýýa*ýQýýýl7ý&RAý8ýý`ýýPjXýýDFPý I"(cýaýeýý*bý=pLý*iIýýýýZýýcý%@ýsboý.xý"ýýJý1ýý#S.ýýý/Cýj ý#oý:ý"7ý&ýDýýýsýýscdý_ý'ýt8ýýýý;ýý3ý6ýýýQýzgý)nAyýýý†ýýýrHýo”"SrD1ZýýSý&ŽPýýýýý4ýýý ýgýjdýOý8~ v ý8a@ýýUýpýýýrý5ýýýdýýDý›ýý9ýýýHýNýý F]pOA<aSýý<(ý5ýÍH/qýýýý(ýýýýtFclÅýý4ýý%kýýýý1ýýPýýM}_p2ý0ýýýNDwýaýxýýiý$^ýEý!ýýýýdý 0A0ýýýýýýýý(Zýs1ýý,J']ý8ýB"ý3ýjý_ýýýý~ýKd;ýp ýýýHý,ÞM]<dý ý0ý'*j@cT|CT9ýýýdyIýýýSýý@ý:ýLiý$ýIý&!ýýý'ýýýýýÌýýýýaýz'ý@~kýUg ýý EXPý|ýýjý8·ý!ý(]Iý "ýýBaTýýCý<n=.Kýý ýIýýqýýýý;Sýs§_.u5pýWýK=oýýýý.ýýýýy^FýU=ýý6huýýý.nÉýjýýJýýxý 8ýý ýýjp`ýýý6ý|RBý0dýýýTÅ\mý)Cý[4ýýý ý9bý9ýý\qSýý6axAfýý ý{ýÿýwýpý.}dgý8ýýýý,M6ýýZý^A*%%ýýý(ýPLAÖýýRý&ýý~ >ýývYýV\ý2I9ýýkýýýýQI+ýý]ýýýýýtdýýýý}ýý-ý21]|týDýýýL%I1ý#E)ýn0ýeýýP 'ýýýýýýýýjýeQýCvý /ý?\ 0a?ýPG,ýý-býýýAýý5WýS}ýtmxý6f@[ý{ýxý'ýrýýýýý"ýýýýBa.ý'ý.ýýUu"ýr_&týÍýý!ý Y7[ýd|;zý ýýý)ýýýýdM!ýýAýQýýUýýV* Lýý\ýýVý } ýýýý{6ýcZý9ýýýýý^ýýýýpP,ýqý;Býwý^ýýýO sýý)`7Q,mýxý`ýýý|ý}BtýýýHýoýý:.yý{ýýìjy=ýÌtuc <ý^ýÑýý:ý>ýýý!]*Uý~ý(ýýýý[$Pýý=ýýýýý;ýVýw=aýa³ý95WýýýýiýzýýhQýýcýýc%ý~ýqYýc6ýJ?ýý!O,ý}Uýý{ýý5ýý6ýýiýqýýSýýýýýý~ýýýýýtPýAýýýýýýgýbýý=iý]ýýRýýIýFýýýýýýýý ý86ýE?\4ýTýýýýýýýYý ý ýNýýýQz%Bt_eýý'K]ýýIýýý4q[)fý_výý~hII`5Sý8 ý0ýTýCöýýyýýýýJýýRxýýzýýý^WýývýýýLýý/ýýsýý ý+sý.ýý{}ªýýbý)ýýBýDýý2ýýHý\J-Týý9ýýBj[ýýxê)ý3*ýFýý ýýký…)Þyý_ýý#gýFýýýýýgýýAýýýýAýqýýiýýývPýýAýýý$]ýcF;Oý;ýý ýý]Dý@ýýýýýJýý;ý;ýU{Àýýý^^ýýiý8.(9ýìý ý3wkQ4ýý2^ýý,ýnýký*oýz}Kuý,[nQdý]Cný ýý)k6ý/c;ýýUýVýýýýýC<mýfýý3ýwNýýýýý‘ZýýýýRýuýýýýjTmýpýýý/ý¿ýRý4ýý*ýý5 l~ýýývýsýdý4ýëýFMo6\ý\ýoýv~ýýýýýý,#+ýýBýL%ýýUm-ýUýýý+êý=ýJýeýt\ýKxG»ý_ýýý")P:ýýýý0y3{ý[ýevýýýýi*2ýýýýýI-oýý2ýý/e%Výý&ýý/ ýý#ýý^Pýýýýýýý6ý#fý4hý4ýcýýýý#ýýxsýýTCýZJýs3CCýSKý@ýýý1ýlhý0ýý}`ýýVýý6ý/ýý ýý<C#+SKý:{ýGHýL _t*ý~C 0
Der Response-Header sieht ja vernünftig aus, auch wenn ich manche der Parameter zum ersten mal sehe
aber der Seitenquelltext, enthält nur irgendwelche kryptischen Zeichen.
Bei anderen Unterseiten dieser Seite kann der Quelltext allerdings problemlos dargestellt werden.
Jetzt wollte ich mal fragen, woran das liegen könnte und wie ich das ändern kann?
Hi,
kurzum - ich würde behaupten, dass dein Content wie der Header es auch sagt gzip-komprimiert ist.
Sicher - du könntest jetzt hingehen und schauen, wie man das dekomprimierst.
Da das .NET-Framework für WebRequest's eine nützliche Klasse bietet, die dich davon befreit "das Rad" neu zu erfinden - scshau dir doch mal bitte folgenden Link an:
How can I download HTML source in C#
LG 😉
Bitte beachte [Hinweis] Wie poste ich richtig? Punkt 3.1
Erstmal danke für die schnelle Antwort.
Hab's jetzt mal hiermit versucht:
static void Main(string[] args)
{
WebClient web = new WebClient();
string quellcode = web.DownloadString("http://mangafox.me/manga/dead_tube/v01/c000/1.html");
Console.WriteLine(quellcode);
Console.ReadKey();
}
Da kommt aber ebenfalls nur Kauderwelsch bei raus.
Hallo Subaru,
du musst den ResponseStream ent-zippen, da dieser eben mit gzip komprimiert ist (und der Server wohl nicht selektiv komprimiert, sondern immer). Guckst du: HttpWebRequest.AutomaticDecompression Property (System.Net)
mfG Gü
Stellt fachliche Fragen bitte im Forum, damit von den Antworten alle profitieren. Daher beantworte ich solche Fragen nicht per PM.
"Alle sagten, das geht nicht! Dann kam einer, der wusste das nicht - und hat's gemacht!"
Hi,
so leid mir das tut - aber der Betreiber wünscht nicht, dass Robots auf diese Seite angesetzt werden, welchen du offenkundig gerade schreibst. (Beim ersten Post leider die Url übersehen)
Ich möchte somit hier nicht helfen - und würde es anderen ebenfalls nicht empfehlen.
LG
Und daher ist hier auch zu.