Referitor la scraping

Stare
Nu este deschis pentru răspunsuri viitoare.
@Susp3kt tocmai de aia am apelat la voi. am zis ca poate ceva nu e ok.
scriptul functioneaza in felul urmator: intri pt prima data, nu iti arata sursa decat daca treci testul reCaptcha. Adica puteti vedea si voi asta... Apoi daca totul e ok, daca treci testul, primesti un cookie sa nu mai bagi de fiecare data captcha. Data viitoare cand vezi un episod nu mai primesti imaginea si se trage cu json iframe-ul.
@Susp3kt si @Ovidiu Bokar nu inteleg ce nu vedeti voi cu recaptha. E pus in buton, e hidden captcha. Daca ati dat click pe el si nu v-a cerut nimic, asta e alta poveste,
Totusi, ajungem la ce ma intereseaza pe mine .... si anume primul post ........ si mai exact cum pot sa-mi protejez contentul de boti daca acesta este vizibil.
 
@Susp3kt tocmai de aia am apelat la voi. am zis ca poate ceva nu e ok.
scriptul functioneaza in felul urmator: intri pt prima data, nu iti arata sursa decat daca treci testul reCaptcha. Adica puteti vedea si voi asta... Apoi daca totul e ok, daca treci testul, primesti un cookie sa nu mai bagi de fiecare data captcha. Data viitoare cand vezi un episod nu mai primesti imaginea si se trage cu json iframe-ul.
@Susp3kt si @Ovidiu Bokar nu inteleg ce nu vedeti voi cu recaptha. E pus in buton, e hidden captcha. Daca ati dat click pe el si nu v-a cerut nimic, asta e alta poveste,
Totusi, ajungem la ce ma intereseaza pe mine .... si anume primul post ........ si mai exact cum pot sa-mi protejez contentul de boti daca acesta este vizibil.

Tu ce ai facut acolo cu butonul ala nu este decat pentru useri, pentru boti nu ai facut nimic.
Tu filmele le afisezi printr-un request catre url asta:
Cod:
http://tvhub.ro/wp-admin/admin-ajax.php?action=do_ajax&fn=get_iframe&id=2807425
Url-ul respectiv tu nu il ai securizat, tu acolo trebuia sa verifici daca exsita cookie-ul, iar daca nu exista sa nu afisezi playerul.

Iarasi, "reCaptcha" ala pe care l-ai pus tu poti sa simulez simplu un click pe btn ala, doar cu jquery.
Pune reCaptcha cu imagini.
 
Daca ati dat click pe el si nu v-a cerut nimic, asta e alta poveste,
Daca asta iti este atitudinea la functionalitatea care nu iti merge, atunci nu e de mirare faptul ca ai probleme. Pentru a intelege exact cum functioneaza reCaptcha, iti recomand sa citesti https://www.google.com/recaptcha/intro/ iar daca chiar vrei sa implementezi hidden captcha, iti recomand sa citesti si sa intelegi cum functioneaza https://en.wikipedia.org/wiki/Cross-site_request_forgery
 
@Susp3kt crede-ma ca singur, fara cunostinte, am facut treaba aia. Mi-a luat o gramada de vreme sa o aplic.

Acum, de ce zici ca e buton doar pt useri si nu pt boti ? Pagina cand se incarca, daca e sa o iei html nu contine nici un iframe.

Da, stiu, sunt praf, mai am de invatat, sincer .... dar incerc ... de aia ca cer ajutorul aici. Cu ce gresesc in acest moment ????
reCaptha nu e pus cu imagini sau altceva ... e cel default. NU ALEG EU CE SE PUNE.
Ok, url nu e securizat, cum sa il securizez ? TREBUIE SECURIZAT ???
De asta intreb aici, sunt paralel dar daca ma indrumati in directia corecta poate rezolv ceva.

Da, iframeul vine prin json, ar trebui sa nu vina deloc pt boti. Unde gresesc ? Sincer....
 
@Susp3kt crede-ma ca singur, fara cunostinte, am facut treaba aia. Mi-a luat o gramada de vreme sa o aplic.

Acum, de ce zici ca e buton doar pt useri si nu pt boti ? Pagina cand se incarca, daca e sa o iei html nu contine nici un iframe.

Da, stiu, sunt praf, mai am de invatat, sincer .... dar incerc ... de aia ca cer ajutorul aici. Cu ce gresesc in acest moment ????
reCaptha nu e pus cu imagini sau altceva ... e cel default. NU ALEG EU CE SE PUNE.
Ok, url nu e securizat, cum sa il securizez ? TREBUIE SECURIZAT ???
De asta intreb aici, sunt paralel dar daca ma indrumati in directia corecta poate rezolv ceva.

Da, iframeul vine prin json, ar trebui sa nu vina deloc pt boti. Unde gresesc ? Sincer....

Pai ti-am zis ce trebuie sa faci, citeste ce ti-a dat si @Ovidiu Bokar.

Este normal ca url de action sa fie securizat, pai accesand url-ul ala direct pot sa preiau direct codul de embed de la orice film.

O solutie pentru inceput: In url-ul de de request verifica daca exista cookie-ul seriale-online-captcha-tvhub, iar doar daca exista sa returnezi codul de embed.
Cookie-ul seteazal sa expire dupa 24 de ore, 7 zile este mult si se poate clona usor cookie-ul pentru a putea fi folosit in script.

Si pune recaptcha cu imagini, ce ai tu nu este recaptcha. Probabil ai incercat sa il pui dar nu ti-a reusit.
 
@susppekt daca pun prea complicat pun si pt useri, nu are sens. poate fi si cel mai simpu catpcha, unde e problema ? Daca e bot, ar trebui sa nu treaca de captcha indiferent ca e complicat sau nu, ok ?

In fine, multumesc ca incercati sa ma ajuti @Susp3kt , raman dator cu o bere. Incerc sa rezolv problema asta. Daca ai vreo idee cum, te astept pe PM.
@cnusi get a life dude, sunt destule persoane carora sa le dai deny sau altceva.

@Eduard E ai avertisment, textul cu majuscule pe un forum de interpretează că "tipi" la noi. La următoarea greșeală ai BAN

PUN MAJUSCULE atunci cand consider ca este nevoie, nu cand consideri tu ca este prea excesiv. Get a life si ces't la vie.
 
@susppekt daca pun prea complicat pun si pt useri, nu are sens. poate fi si cel mai simpu catpcha, unde e problema ? Daca e bot, ar trebui sa nu treaca de captcha indiferent ca e complicat sau nu, ok ?

In fine, multumesc ca incercati sa ma ajuti @Susp3kt , raman dator cu o bere. Incerc sa rezolv problema asta. Daca ai vreo idee cum, te astept pe PM.
@cnusi get a life dude, sunt destule persoane carora sa le dai deny sau altceva.

@Eduard E ai avertisment, textul cu majuscule pe un forum de interpretează că "tipi" la noi. La următoarea greșeală ai BAN

PUN MAJUSCULE atunci cand consider ca este nevoie, nu cand consideri tu ca este prea excesiv. Get a life si ces't la vie.
Fara suparare, dar tu stii ce este un captcha? tu nu ai niciun captcha pe site.
Captcha este atunci cand te pune sa faci o actiune, sa selectezi niste imagini, sa introduci un text dintr-o imagine, pentru a face diferenta dintre un user normal si un bot.
 
@susppekt daca pun prea complicat pun si pt useri, nu are sens. poate fi si cel mai simpu catpcha, unde e problema ? Daca e bot, ar trebui sa nu treaca de captcha indiferent ca e complicat sau nu, ok ?
Nu e acelasi lucru. Sunt fel si fel de boti, unii mai buni ca altii. Daca pentru "captcha" simplu un bot nu trece, asta nu inseamna ca orice bot nu trece. Suntem in 2017, se creaza boti care simuleaza actiuni umane pe site(click, comentariu etc etc).
PS: Tocmai pentru ca nu ai experienta in domeniu, nu-i mai contrazice pe Ovidiu si Susp3kt. Stiu ei ce zic acolo, trust me!
PPS: Ti s-a dat o solutie deja!
O solutie pentru inceput: In url-ul de de request verifica daca exista cookie-ul seriale-online-captcha-tvhub, iar doar daca exista sa returnezi codul de embed.
Cookie-ul seteazal sa expire dupa 24 de ore, 7 zile este mult si se poate clona usor cookie-ul pentru a putea fi folosit in script.

Si pune recaptcha cu imagini, ce ai tu nu este recaptcha. Probabil ai incercat sa il pui dar nu ti-a reusit.
 
Din partea lui @Eduard E fiind blocat cateva zile si avand nevoie de ajutorul dvs. in continuare :D

1. @Naruto9 deja EXISTA acel cookie, se verifica daca exista, si daca exista afiseaza codul.Deja este prezent! apropo are 7 zile ca sa nu bage oamenii in r**** o data pe zi, o ok si pe saptamana
2. reCaptcha cu imagini ?Wtf sunteti inconstienti ca exista invizible captcha by google ? nu e nevoie de imagini sau alte prostii, simplu buton care sa aplice captcha e deajuns .... @Naruto9 9 mi s-a dat o solututie ? solutia e deja implementata.
 
Din partea lui @Eduard E fiind blocat cateva zile si avand nevoie de ajutorul dvs. in continuare :D

1. @Naruto9 deja EXISTA acel cookie, se verifica daca exista, si daca exista afiseaza codul.Deja este prezent! apropo are 7 zile ca sa nu bage oamenii in r**** o data pe zi, o ok si pe saptamana
2. reCaptcha cu imagini ?Wtf sunteti inconstienti ca exista invizible captcha by google ? nu e nevoie de imagini sau alte prostii, simplu buton care sa aplice captcha e deajuns .... @Naruto9 9 mi s-a dat o solututie ? solutia e deja implementata.
mane, invizible capcha ala e apa de ploaie. Asa cum userul da click de ce nu ar da si botul? De ce netu de exemplu nu foloseste invisible captcha sau alte siteuri?
Pana si pe google cand faci cont ai captcha cu imagini/cifre, si tu-mi zici ca invisible captcha ala e fenomenal si ca n-are rost cel cu imagini text? Pai daca era asa fantastic nu crezi ca-l implementau si cei de la google?
Acel captcha invizibil pe care il ai opreste doar o parte din boti..iar din pacate tu ai de-a face cu boti mult mai avansati decat iti imaginezi :)
 
reCaptcha pus cum trebuie , este o solutie dar nu una permanenta in cazul celor de la Openload pentru anumite seriale.
Nu stiu ce uploadeza @Sacalul de nu i-a sters de 5 luni dar daca pui cam tot ce este HBO , iti garantez ca maxim o data pe luna , primesti dmca , si este ok ca si timp.
Dar solutia cea mai convenabila ar fi sa folosesti si alte surse de vizionare , sa nu ramana oamenii aia in pana care iti viteaza site-ul , la serialele unde iti sterge cel mai des pune ca prima sursa Netu.tv sau Vidlox sau Raptu/Rapidvideo.
 
Din partea lui @Eduard E fiind blocat cateva zile si avand nevoie de ajutorul dvs. in continuare :D

1. @Naruto9 deja EXISTA acel cookie, se verifica daca exista, si daca exista afiseaza codul.Deja este prezent! apropo are 7 zile ca sa nu bage oamenii in r**** o data pe zi, o ok si pe saptamana
2. reCaptcha cu imagini ?Wtf sunteti inconstienti ca exista invizible captcha by google ? nu e nevoie de imagini sau alte prostii, simplu buton care sa aplice captcha e deajuns .... @Naruto9 9 mi s-a dat o solututie ? solutia e deja implementata.

Nu ai niciun cookie, tu doar ai cookie pentru buton atat, mai departe nu mai verifici cookie-ul. Url de mai jos nu avea voie sa afiseze codul de embed al playerului. Plus ca am testat si de pe proxy, si la fel, functioneaza fara probleme.
Cod:
http://tvhub.ro/wp-admin/admin-ajax.php?action=do_ajax&fn=get_iframe&id=2807425
 
Stare
Nu este deschis pentru răspunsuri viitoare.
Loading...
Back
Sus