konto usunięte

Temat: blokada ruchu w .htaccess

Witam,
Potrzebuję pomocy w budowie pliku .htaccess. Chciałabym zablokować możliwość dostępu do strony wszystkim oprócz googlebota oraz własnego IP. Jeśli to możliwe chciałabym również aby strona użytkownikom innym niż googlebot i moje własne IP zwracała kod błędu 404 a nie 403, tak jak to jest w przypadku polecenia -deny-
Ponieważ niezbyt dobrze znam polecenia w tym pliku, proszę szanownych forumowiczów o pomoc.
Tomasz Zadora

Tomasz Zadora programuję

Temat: blokada ruchu w .htaccess

Takie postępowanie prawdopodobnie jest niezgodne z wytycznymi google - tzn. wystawianie treści dla google a dla użytkowników nie. Polecam zainteresować się tą kwestią przed pojęciem takich działań, bo może skończyć się na tym, że strona dostanie w google "bana".

konto usunięte

Temat: blokada ruchu w .htaccess

Nie ma obawy gdyż to nie cloaking tylko blokada dostępu. googlebot nie czyta htaccess więc nie wie, że wszyscy inni mają 404. Poza tym takie działanie robię bardziej w ramach pewnego eksperymentu i z testową stroną.Agnieszka Kowal edytował(a) ten post dnia 16.08.12 o godzinie 16:18

konto usunięte

konto usunięte

Temat: blokada ruchu w .htaccess

Być może się mylę ale z tego co zauważyłem bot google ma wiele adresów IP

konto usunięte

Temat: blokada ruchu w .htaccess

Dawid Zając:
Być może się mylę ale z tego co zauważyłem bot google ma wiele adresów IP

Bot się zawsze podpisuje, więc wpuści go przez HTTP_USER_AGENT.
Siebie samą wpuści przez swoje IP.
Wszystkich innych przekieruje na osobną stronę zwracającą 404.

konto usunięte

Temat: blokada ruchu w .htaccess

Właśnie dlatego chciałabym go dopuścić po useragent. Wszystko inne zablokować. Myślę, że nawet własne ip mogę wykluczyć aby zbytnio nie gmatwać plikuAgnieszka Kowal edytował(a) ten post dnia 16.08.12 o godzinie 16:41
Tomasz Zadora

Tomasz Zadora programuję

Temat: blokada ruchu w .htaccess

Agnieszka Kowal:
Nie ma obawy gdyż to nie cloaking tylko blokada dostępu. googlebot nie czyta htaccess więc nie wie, że wszyscy inni mają 404.

Tyle, że google nie zawsze przedstawia się jako google - bo niby w jaki inny sposób ma wykrywać niedozwolone praktyki polegające na podstawianiu innej treści botowi a innej użytkownikom?

To co robisz to działanie szkodliwe dla google, bo powoduje umieszczanie w indeksie stron do których ludzie nie mają dostępu. Wyobraź sobie że wpisujesz coś w google - np. "bizuteria" -wyskakuje strona, klikasz a tu 404 zamiast treści.

Jeżeli nadal uważasz że to bezpieczne to powodzenia - ale później może być ból jak strona dostanie banana.Tomasz Zadora edytował(a) ten post dnia 16.08.12 o godzinie 18:15

konto usunięte

Temat: blokada ruchu w .htaccess

jak już wspomniałam wcześniej, robię to w ramach testu. Nigdy czegoś takiego nie wykonałabym dla swoich stron firmowych. Po prostu taki mały teścik dla potrzeb seo

konto usunięte

Temat: blokada ruchu w .htaccess


<?php
if(strpos($_SERVER['HTTP_USER_AGENT'], 'googlebot') === FALSE) {
header('location: 404.html');
exit;
}
?>
Jakub Świegot edytował(a) ten post dnia 17.08.12 o godzinie 11:08

konto usunięte

Temat: blokada ruchu w .htaccess

Jakub Świegot:

<?php[/quote]> if(strpos($_SERVER['HTTP_USER_AGENT'], 'googlebot') === FALSE) {[quote]header('location: 404.html');
exit;
}
?>

1. Dopisz sobie do user-agent przeglądarki słówko googlebot
2. Wejdź na "zabezpieczoną" wg porady Jakuba stronę.
3. Profit!

Brak porady jest zawsze lepszy jak zła porada.Dariusz Półtorak edytował(a) ten post dnia 17.08.12 o godzinie 11:38

konto usunięte

Temat: blokada ruchu w .htaccess

Szukasz dziury w całym Darku :)

Skoro strona ma służyć do testów SEO, któremu głupolowi (i po co) chciałoby się dłubać w tym i zmieniać user agent?

Jak zrobisz lepszą poradę i zablokujesz daną pulę IP, to zawsze znajdzie się sposób, żeby taką stronę jednak obejrzeć.

Niech forma nie przerasta treści.

konto usunięte

Temat: blokada ruchu w .htaccess

Jakub Świegot:
Szukasz dziury w całym Darku :)

Skoro strona ma służyć do testów SEO, któremu głupolowi (i po co) chciałoby się dłubać w tym i zmieniać user agent?

Jak zrobisz lepszą poradę i zablokujesz daną pulę IP, to zawsze znajdzie się sposób, żeby taką stronę jednak obejrzeć.

Niech forma nie przerasta treści.

Nie szukam dziury w całym tylko stwierdzam fakty. Dobre zabezpieczenie to takie zabezpieczenie gdzie nawet znając mechanizm masz trudności z jego złamaniem. Parę sekund w Google:
http://googlewebmastercentral.blogspot.com/2006/09/how...

Zostaje tylko dopuścić samego siebie dodatkowo. Jeżeli mamy stałe, unikalne IP (mało kto ma) to sprawa jest prosta (allow nasze.ip) a jeżeli nie to sugeruję zrobić to poprzez skrypt. Najprostsze podejście to coś ala porada Jakuba ale poprzez podanie w długich i losowych kluczy. Jeżeli klucze się zgadzają to powinno zostać ustawione ciasteczko będące hashem z tych kluczy i jeżeli nie jest ono obecne to wysyłamy nagłówek 404.

konto usunięte

Temat: blokada ruchu w .htaccess

Dla upartego to i tak niewiele da, bo są metody podszycia się pod googlebota i nawet najbardziej wymyślne mechanizmy nie pomogą.

Pamiętaj, stosujmy zabezpieczenia dopasowane do wymagań, jakie stawiamy. Nikt nie będzie zakładał drzwi antywłamaniowych Gerda do szopy ze słomą.

konto usunięte

Temat: blokada ruchu w .htaccess

Marek M.:
Dawid Zając:
Być może się mylę ale z tego co zauważyłem bot google ma wiele adresów IP

Bot się zawsze podpisuje, więc wpuści go przez HTTP_USER_AGENT.
Siebie samą wpuści przez swoje IP.
Wszystkich innych przekieruje na osobną stronę zwracającą 404.
gdyby tak było to połowa internetu stosowałaby cloaking

konto usunięte

Temat: blokada ruchu w .htaccess

Agnieszka Kowal:
Nie ma obawy gdyż to nie cloaking tylko blokada dostępu.

To właśnie jest cloaking.
googlebot nie czyta htaccess więc nie wie, że wszyscy inni mają 404.

Bzdury Agnieszko opowiadasz.Robert B. edytował(a) ten post dnia 18.08.12 o godzinie 23:10

konto usunięte

Temat: blokada ruchu w .htaccess

Marek M.:
...
Bot się zawsze podpisuje, więc wpuści go przez HTTP_USER_AGENT.

Niestety nie jest to prawda. Są przypadki odwiedzin bez identyfikacji UA. Tak na przykład wykrywany jest cloaking.

Są też wejścia pracowników Googla - to też metoda na wykrycie cloakingu.Robert B. edytował(a) ten post dnia 18.08.12 o godzinie 23:11

konto usunięte

Temat: blokada ruchu w .htaccess

Agnieszka Kowal:
jak już wspomniałam wcześniej, robię to w ramach testu. Nigdy czegoś takiego nie wykonałabym dla swoich stron firmowych. Po prostu taki mały teścik dla potrzeb seo

To się zgłoś z tym problemem na grupę SEO to powiemy Tobie co może Ciebie spotkać.

Może Ciebie spotkać to samo co stronę BMW wiele lat temu - czyli BAN.

Może nie oznacza, że musi. Wszystko zależy od tego czy ktoś złoży donos lub jak Google woli - czy ktoś złoży raport.
Paweł Gontarek

Paweł Gontarek Wiedza jest bezcenna
...

Temat: blokada ruchu w .htaccess

edit. kasować.Paweł Gontarek edytował(a) ten post dnia 19.08.12 o godzinie 17:15

konto usunięte

Temat: blokada ruchu w .htaccess

Paweł Gontarek:
edit. kasować.

Dbasz o image czy jak ?

[edyta]
.. i tak wiem co napisałeś ;)Robert B. edytował(a) ten post dnia 21.08.12 o godzinie 22:41

Następna dyskusja:

Blokada IP




Wyślij zaproszenie do