Referitor la scraping

Stare
Nu este deschis pentru răspunsuri viitoare.

Eduard E

Active Member
Registered
Banned
Salut.
Sa intru in subiect, detin tvhub . De curand am o problema cu scraperii ... sau ce putin asa cred eu. Am inceput sa primesc reclamatii DMCA pe openload zilnic. Primesc mailul si serialul, toate episoadele. Dupa 10 minute dupa ce se face scrape la urmatorul serial targetat, primesc iar mail, toate episoadele, samd. Am implementat treaba cu reCaptcha si un cookie (gen fsOnline) pentru a nu fi sacaitor cu userii. Am zis ca voi scapa de scraperi si toate bune. Degeaba.
Din ce am considerat eu, sunt 3 posibilitati:
1. cineva chiar isi aloca timp sa-mi viziteze fiecare pagina si sa ia linkurile sa faca reclamatie;
2. cumva trecand o singura data testul de de la reCaptcha raman cookies si ii arata sursele chiar daca e bot (da, stiu, sunt si boti cu cookie)
3. am facut eu ceva gresit in designul codului ceea ce permite vizualizarea sursei ... (cea mai putin probabila)

Din pacare sunt "solo percutia" in acest proiect si nu am pe cineva sa ma ajute in acest sens. De aceea va cer ajutorul, poate reusesc cumva sa scap de situatia asta jenanta.

EDIT: nu am nevoie de pluginul de ascundere sursa, AM SPECIFICAT MAI SUS ca am facut ca sursa sa nu apara decat prin javascript daca trece testul de "ESTI OM" ......
 
Ultima editare:
@AlexH fara suparare, ai citit ce am scris eu? Ce treaba are sula cu prefectura ? Site-urile mirror nu-si au rostul discutiei pornite de mine aici. Daca imi scapa ceva din cele 2 posturi puse de tine, te rog sa ma luminezi. Inca o data, fara suparare :p ...
 
@AlexH fara suparare, ai citit ce am scris eu? Ce treaba are sula cu prefectura ? Site-urile mirror nu-si au rostul discutiei pornite de mine aici. Daca imi scapa ceva din cele 2 posturi puse de tine, te rog sa ma luminezi. Inca o data, fara suparare :p ...
Pai ce a postat Alex cred ca te ajuta! Daca cineva ti-a clonat site-ul, atunci toate link-urile de la openload sunt la el pe site, si automat daca boti reclama acele link-uri de la el, nu sunt cumva ale tale?
 
Pai tu ai problema cu scraperii nu, care iti copie continutul si din aceasta cauza primesti reclamatii dmca. Daca e asa, atunci cele doua topicuri de mai sus te pot ajuta.
Apoi pentru a nu fi gasit de de boti dmca poti folosi acest plugin Hide Embed Plugin Wordpress.
Daca nu am inteles care este problema ta nici acum, te rog posteaza punctat pentru a intelege mai bine.

 
@C.Pintiuta ok inteleg acum la ce se refera. Degeaba se cloneaza, continutul iframeului se face prin js si nu cred ca daca il clonezi reusesti sa obtii sursa. Inca o data, poate ma insel, dar e doar parerea mea.
 
@AlexH nu am nevoie de pluginul acela, diferenta dintre pluginul tau si ce am facut eu este ca la tine se poate vedea sursa cu inspector si la mine nu se poate vedea absolut nimic pana nu treci de reCaptcha.
Cam aici e problema, de ce ma plang eu, cum se pot obtine sursele si in alt fel decat manual ... M-as mira sa stea cineva la birou in SUA sa imi faca mie reclamatie DMCA la GOT pentru openload ...

Mai e posibil sa fie unul din asta care nu are ce face gen "competitor" sa faca reclamatiile ... ceea ce e cel mai plauzibil.
 
@Sacalul stiu de plugin de dinainte sa postez aici, dar nu ma ajuta cu nimic, am solutionat eu personal problema asta cu sursa ....
 
@Sacalul stiu de plugin de dinainte sa postez aici, dar nu ma ajuta cu nimic, am solutionat eu personal problema asta cu sursa ....
Eu cred ca ai tu o fisura la codul tau..Daca ai unul gen fsonline ..eu de exemplu vedeam sursa ..nu mai stiu exact cum.. insa imi trebua sa ii copiez doar subtitrarea serialului respectiv pentru a o lipi.
Eu cred ca ai o fisura in codul tau.. refuz sa cred ca google pune botul la unul "nebun" care iti trimite linkurile openload.
 
@Sacalul, nu cred ca are rost sa implicam google aici, nu ma refeream la DMCA de google ci de cele la openload. Ca sa vezi sursa in browser, indiferent daca esti bot sau nu, trebuie sa treci de reCaptcha. apoi ti se va arata sursa. Dupa ce treci de reCaptcha ti se pune cookie 7 zile sa primesti direct sursa fara sa mai fii nevoit sa bagi captcha.
Fisura eu nu cred, mai ales ca tu vorbesti de google. BTW google nu mi-a indexat iframe-ul ceea ce inseamna ca nu il poate vedea.
 
@Sacalul, nu cred ca are rost sa implicam google aici, nu ma refeream la DMCA de google ci de cele la openload. Ca sa vezi sursa in browser, indiferent daca esti bot sau nu, trebuie sa treci de reCaptcha. apoi ti se va arata sursa. Dupa ce treci de reCaptcha ti se pune cookie 7 zile sa primesti direct sursa fara sa mai fii nevoit sa bagi captcha.
Fisura eu nu cred, mai ales ca tu vorbesti de google. BTW google nu mi-a indexat iframe-ul ceea ce inseamna ca nu il poate vedea.
Ma gandesc ca openload tine cond de DMCA sau google.. sau tu crezi ce administratorul openload nu stie ca 99.9% din continutul incarcat ar trebui sters pentru ca nu detin drepturile de autor.
 
@Sacalul Scuze, dar ce DMCA sa stie google ca am eu pe site din moment ce sursa openload este 100% ascunsa? google stie ca am niste text si atat. Ne departam de la subiect.
Ce stie administatorul openload nu isi are rostul discutiei aici, din nou.
Va rog sa nu comentati fara sa va fi interesat in prealabil sau sa fi aruncat un ochi.
PS: nu vreau sa par magar, chiar nu sunt, dar toate discutiile de pana acum au fost pe langa subiect. Nu se poate sa vorbim despre cele 3 lucruri pe care le-am spus in primul post? Cred ca e important sa citesti postul intreg @Sacalul inainte sa postezi ceva fara absolut nici o legatura.

EDIT: incerc sa gasesc o solutie la problema prezentata, daca e posibil, atata tot.
 
Stimate @Eduard E daca esti atat de bun, la ce mai ceri ajutorul? Daca ai plugin mai bun la ce mai ceri ajutor? Vezi ca prin cele spuse sunt cateva aberatii si te rog nu ne lua de ....
Sau acest topic a fost defapt ca lumea sa caute al tau site mascat ca unul de ajutor.
Cred ca e important sa citesti postul intreg @Sacalul inainte sa postezi ceva fara absolut nici o legatura.
De fapt cred ca tu esti cel pe langa.
Cum ai expus problema in prima postare ti-a fost oferit raspuns. Vezi ca au mai fost cativa pe aici care se dadeau ca stiu multe dar in final nimic.
Zi multumesc fiecarei persoane care si-a luat din timpul lui sa iti raspunda.
 
@Sacalul Scuze, dar ce DMCA sa stie google ca am eu pe site din moment ce sursa openload este 100% ascunsa?
Sa stii ca scanez psihicul unui om intr-o secunda si nu ma insel niciodata. Si sper sa ramanem prieteni chiar daca te-am prins.
Ai facut acest post din 2 motive:
1 Ori chiar ai probleme si ma repet din nou exista o fisura ..poate chiar codul capcha daca este a lui google.
2 Ori ai vrut sa iti faci o reclama gratuita.. si mai mult decat atat esti si putin cam obraznicel.
 
@AlexH nu sunt bun, tot ce am facut a fost de unul singur dupa multe ore de cautat pe google si "trial and error". Am cerut ajutorul pentru ca poate sunt persoane care poate pot spune daca am facut ceva gresit si imi pot da ceva sfaturi in acest sens. Nu am plugin, am implentat singur tragerea continutului prin js. Nu sunt de departe vreun expert, doar sunt un singur om in toata treaba asta. Nu va iau de ... " ... " .... SINCER.
Daca am parut ingamfat IMI CER SCUZE. Se poate sa o luam de la capat ? Nu caut cearta aici. SINCER.
Sa pun problema in felul urmator: "cineva cere ajutor, este noob, nu stie, etc". Nu este adevarat. Asa pare sa ceri ajutor aici. Am cerut ajutor si primul raspuns a fost sa citesc un articol vechi. Daca vrei sa ma ajuti @AlexH intai intreaba-ma care sunt cunostintele mele, nu ma pune pe un piedestal de retardat.... Inteleg, toti care cer ajutor sunt incepatori, dar nu 100%. In fine. Deviez de la subiect.
Referitor la problema mea, o sa incerc sa banez sau sa le dau o pagina de eroare la requesturile fara header ...gen... if ($http_user_agent = "") { return 403; }
Intrebare, ma va scuti de toti botii sau sunt si boti care pot trece de solutia asta ?

@Sacalul
1. Da, am o problema, problema a fost specificata in primul post. "fisuri: te rog sa cauti tu, ca aia e alta problema. daca tu imi vorbesti de mici probleme care AU legatura cu subiectul prezentat, te rog sa mi-l detaliezi.
2. Daca faceam reclama nu mai faceam postul asta. Sa fim serios. Fatalau nu sunt. Atasez o poza in acest sens. In sensul de a se vedea ca sunt targhetate linkurile la episoadele serialului, asta nu e mana de BOT.
 

Atașamente

  • rsbllH1[1].jpg
    rsbllH1[1].jpg
    302,9 KB · Vizualizări: 26
Am cerut ajutor si primul raspuns a fost sa citesc un articol vechi. Daca vrei sa ma ajuti @AlexH intai intreaba-ma care sunt cunostintele mele, nu ma pune pe un piedestal de retardat...
1. topicurile nu sunt vechi
2. topicurile si chiar daca ar fi vechi te ajuta la problema care o ai
3. nu am tratat pe nimeni asa cum spui tu.
Intrebare, ma va scuti de toti botii sau sunt si boti care pot trece de solutia asta ?
Este imposibil sa banezi toti botii. Acestia isi schimba numele si semnatura periodic cat si localhost, asa ca este aproape imposibil sa ii blochezi pe toti.
Pentru a elimina cererile dmca in proportie de 95% iti recomand iar sa citesti acele doua topicuri si nu doar titlul. Nu le recomand asa ca nu am ce face.

Site in cauza apartine altui user pe forum. Ai cumva 4 conturi pe acest forum?
 
@AlexH nu, site-ul e 100% al meu, mai am pe cineva care se ocupa de el cand sunt plecat. daqogem e nickul celalt al tipului. fericit? Restul pana la 4 conturi poti sa stergi tot ce consideri tu, eu nu am decat 1 cont, el nu are decat un cont. Restul le coti compara sau ce vrei tu, nu sunt ale mele.

Dar daca tot vorbim .....
"Site in cauza apartine altui user pe forum. Ai cumva 4 conturi pe acest forum?"
Cum apartine altui user pe forum? Cum determini TU ca apartine altcuiva? Daca EU am un site si nu postez nimic si vine un agarici si posteaza ceva, gata e al lui ?
BWT a postat daqogen ca el e uploaderul meu pe timp cand sunt plecat.
Intram in alta arie de discutii si nu are rost.


AM DEVIAT DE LA SUBIECT.
In legatura cu subiectul se poate pls ?
 

Atașamente

  • asdasdas.jpg
    asdasdas.jpg
    76 KB · Vizualizări: 20
@AlexH te rgo sa-mi explici ca treaba are cu site-urile clonate, eu nu vorbesc de asa ceva aici.
Voi face acest post in speranta ca cineva stie sa raspunda.
INCA O DATA nu are legatura cu site-uri clonate. Nu are legatura cu NIMIC decat ceea ce am zis eu in primul post. NU POTI VEDEA SURSA DECAT DACA ESTI OM... am pus reCaptcha spacial ... in continuare primesc DMCA ....
1. Ori MANUAL
2 BOT si nu stiu eu cum ...


PLS HELP ?
 
@AlexH te rgo sa-mi explici ca treaba are cu site-urile clonate, eu nu vorbesc de asa ceva aici.
Voi face acest post in speranta ca cineva stie sa raspunda.
INCA O DATA nu are legatura cu site-uri clonate. Nu are legatura cu NIMIC decat ceea ce am zis eu in primul post. NU POTI VEDEA SURSA DECAT DACA ESTI OM... am pus reCaptcha spacial ... in continuare primesc DMCA ....
1. Ori MANUAL
2 BOT si nu stiu eu cum ...


PLS HELP ?
Care reCaptcha? ca eu nu am vazut nimic.
Zici ca doar daca esti om poti vedea sursa? really?
Ia uite aici la scriptul asta din 17 linii, si asta e om?:))
Cod:
http://componentepc.net/tvhub.php
 
Stare
Nu este deschis pentru răspunsuri viitoare.
Loading...
Back
Sus