robots.txt

Вопросы без привязки к версии. Установлена авточистка (2 года).

Сообщение Xvost 24.03.2007 21:04

Ещё раз: нужен robots.txt, который по умолчанию подошёл бы для большинства форумов. Т. е. должен быть определенный набор запретов которые можно рекомендовать для всех.
С уважением, С. Д. aka Xvost
Аватара пользователя
Xvost
phpBB 1.4.1
 
Сообщения: 41
Зарегистрирован: 23.03.2007 1:41
Откуда: г. Краматорск, Донецкая обл., Украина

Сообщение edgar 24.03.2007 21:11

Alice, слэши означают директорию, которую нельзя индексировать
Disallow: / означает корневой каталог.
Так что у вас всё правильно, только эта строчка не нужна:
Disallow: /admin/
Поисковик не может увидеть эту папку, нет на нее ссылки.

Xvost писал(а):Может здесь кто нибудь выложить стандартный robots.txt, который по умолчанию подошёл бы для большинства форумов?

я выложил чуть выше
Три простых способа защиты от спама на форуме phpBB 2.0.22: 1, 2, 3
Аватара пользователя
edgar
phpBB 2.0.18
 
Сообщения: 1149
Зарегистрирован: 26.07.2005 7:20
Откуда: с Луны свалил...

Сообщение Alice 24.03.2007 22:07

edgar, спасибо за объяснения! Теперь ВСЕ ясно :)
/admin/ уберу.
Я не волшебник, я только учусь!
Аватара пользователя
Alice
phpBB 2.0.7
 
Сообщения: 285
Зарегистрирован: 18.03.2007 19:07
Откуда: SPb

Сообщение edgar 24.03.2007 23:00

Alice, кстати еще непонятно, что вы хотите закрыть от индексации этой строкой:
Disallow: /quick_reply.php
Туда тоже робот попасть не сможет, и индексировать там нечего, и закрывать там нечего. Независимо от того установлен быстрый ответ или нет, поисковый робот сможет попасть только на /posting.php
От лишних строк в robots.txt вреда нет, но они просто не нужны
Три простых способа защиты от спама на форуме phpBB 2.0.22: 1, 2, 3
Аватара пользователя
edgar
phpBB 2.0.18
 
Сообщения: 1149
Зарегистрирован: 26.07.2005 7:20
Откуда: с Луны свалил...

Сообщение Alice 24.03.2007 23:23

edgar писал(а):От лишних строк в robots.txt вреда нет

Да поэтому наверное и написала :)
Я просто не знаю, куда может робот попасть, куда нет. Вот кто-то вписывал еще папки cache, db, includes, language, templates и проч. - я в этом пока только начинаю разбираться (со вчерашнего дня), поэтому что нужно запретить, а что можно оставить не совсем понимаю.
Я не волшебник, я только учусь!
Аватара пользователя
Alice
phpBB 2.0.7
 
Сообщения: 285
Зарегистрирован: 18.03.2007 19:07
Откуда: SPb

Сообщение Xvost 25.03.2007 3:08

edgar

Хорошо, я взял себе Ваш шаблон. Теперь поясните, чего роботу запрещаем?

User-agent: *
Disallow: /faq.php - Это понятно, справочный раздел
Disallow: /groupcp.php - ???
Disallow: /index.php?c= - ???
Disallow: /login.php - страница входа, так?
Disallow: /memberlist.php - Список юзеров, как я понимаю?
Disallow: /posting.php - Это что форма ответа?
Disallow: /privmsg.php - приватные сообщения?
Disallow: /profile.php - профиль пользователя?
Disallow: /search.php - форумный поиск, да?
Disallow: /viewonline.php - ???

А это надо запрещать: viewtopic.php, viewforum.php?
И нужен ли запрет на некоторые каталоги?

Блин, как много всего я спросил... :D

Добавлено спустя 1 час 57 минут 9 секунд:

Да, и какие права должны стоять на этот файл?
С уважением, С. Д. aka Xvost
Аватара пользователя
Xvost
phpBB 1.4.1
 
Сообщения: 41
Зарегистрирован: 23.03.2007 1:41
Откуда: г. Краматорск, Донецкая обл., Украина

Сообщение edgar 25.03.2007 7:29

Alice писал(а):Я просто не знаю, куда может робот попасть, куда нет. Вот кто-то вписывал еще папки cache, db, includes, language, templates и проч.

Он может попасть только туда куда есть ссылки на вашем сайте или на других сайтах. Ссылок domain.com/cache/ domain.com/language/ и т.д. на форуме нет, никаких страниц там тоже нет, чтобы их запрещать.
В папке templates могут проиндексироваться служебные картинки форума (кнопки, фон, информация о стиле, ваш лого и т.д....). Ее можно и запретить, если не хотите чтобы эти картинки индексировались

Xvost писал(а):Хорошо, я взял себе Ваш шаблон. Теперь поясните, чего роботу запрещаем?

Откройте эти страницы в браузере и узнаете

Xvost писал(а):А это надо запрещать: viewtopic.php, viewforum.php?

Если не хотите, чтобы к вам посетители с поисковых систем приходили, можете запретить. Но проще тогда весь форум одной строкой запретить
Disallow: /
Три простых способа защиты от спама на форуме phpBB 2.0.22: 1, 2, 3
Аватара пользователя
edgar
phpBB 2.0.18
 
Сообщения: 1149
Зарегистрирован: 26.07.2005 7:20
Откуда: с Луны свалил...

Сообщение Alice 25.03.2007 19:20

edgar писал(а):тогда весь форум одной строкой запретить
Disallow: /

По-моему так даже лучше делать, т.к. на форум заходят с сайта (в основном), а сайт проиндексирован и прописан в поисковиках/каталогах. Так например в моем случае и есть. Не думаю, что человек будет сначала искать форум, потом заходить на сайт, в основном происходит как раз наоборот. Да и будет защита от тех, кто по поисковикам ищет форумы, чтобы спамить.
Но это конечно не подходит тем, у кого сайт-форум.
Я не волшебник, я только учусь!
Аватара пользователя
Alice
phpBB 2.0.7
 
Сообщения: 285
Зарегистрирован: 18.03.2007 19:07
Откуда: SPb

Сообщение Герасимов Дмитрий 25.03.2007 19:44

Alice, бредятина то какая... Форум собирает запросы низкочастотники. Ищущий не ищет форум, он обычно ищет ответ на вопрос. А вот найдя ответ на свой вопрос, он может уже обратить внимание на сайт, и форум, особенно если форум тематический.

Добавлено спустя 2 минуты 10 секунд:

Тем более таким вот роботсом вы запретите индексацию и сайта в том числе вместе с форумом.

Alice писал(а):Disallow: /


Надо так:

Disallow: /forum/
Герасимов Дмитрий
phpBB 1.2.0
 
Сообщения: 17
Зарегистрирован: 26.01.2007 15:37

Сообщение Alice 25.03.2007 19:48

Герасимов Дмитрий писал(а):бредятина то какая...

Может вам и бредятина, а мне нет :) У меня по "запросу по теме" можно все найти на сайте.

Герасимов Дмитрий писал(а):Тем более таким вот роботсом вы запретите индексацию и сайта в том числе вместе с форумом.

Неа. И все потому, что я лучше знаю, где у меня сайт/форум располагается. :wink: У меня 2 сайта, на одном сам контент, на другом - форум.
Я не волшебник, я только учусь!
Аватара пользователя
Alice
phpBB 2.0.7
 
Сообщения: 285
Зарегистрирован: 18.03.2007 19:07
Откуда: SPb

Сообщение Xvost 25.03.2007 20:32

edgar
Ну, я почти всё понял. Кроме смысла на запрет этого:
Disallow: /index.php?c=
Я не разбираюсь в php-кодировке, что это значит? Ведь если index.php - главная страница форума, то что, её запрещаем? не понимаю, поясните.

Добавлено спустя 2 минуты 59 секунд:

Disallow: /memberlist.php - а это зачем запрещать? Ведь робот, как я понимаю, пройдёт по такому пути: имя юзера-найти все сообщения?
С уважением, С. Д. aka Xvost
Аватара пользователя
Xvost
phpBB 1.4.1
 
Сообщения: 41
Зарегистрирован: 23.03.2007 1:41
Откуда: г. Краматорск, Донецкая обл., Украина

Сообщение edgar 25.03.2007 21:39

Герасимов Дмитрий писал(а):Alice, бредятина то какая...

Согласен :)
Alice, вообще-то мы robots.txt для того тут и обсуждаем, чтобы сделать форум удобней для поисковых систем, а не спрятать его. Но если вы хотите вообще закрыть его от индексации и потерять посетителей, это ваше право :)

Xvost писал(а):Ну, я почти всё понял. Кроме смысла на запрет этого:
Disallow: /index.php?c=

Это категории. Имхо эту строчку можно убрать из robots.txt. Никакого вреда от ее индексации не будет. Вот на какую страницу эта ссылка ведет:
http://www.phpbbguru.net/community/index.php?c=1
Три простых способа защиты от спама на форуме phpBB 2.0.22: 1, 2, 3
Аватара пользователя
edgar
phpBB 2.0.18
 
Сообщения: 1149
Зарегистрирован: 26.07.2005 7:20
Откуда: с Луны свалил...

Сообщение Alice 25.03.2007 22:11

edgar писал(а):Alice, вообще-то мы robots.txt для того тут и обсуждаем, чтобы сделать форум удобней для поисковых систем, а не спрятать его. Но если вы хотите вообще закрыть его от индексации и потерять посетителей, это ваше право

Согласна, каждому свое.. вы же не можете знать всего про мой сайт/форум, кто там сидит (может он для трех моих друзей, lol), нужно что-то или нет, будет вред от того, что форум проиндексируется или нет, и т.д.
А запрет на индексацию к robots.txt тоже относится, поэтому я "в теме".
Пы.Сы. Я не сказала, что я сделаю так (закрою индексацию), и что все должны так же сделать, а сказала, что можно произвести сию операцию (которую кстати вы и предложили :wink: ) Так что мОжно и дОлжно, как говорится, 2 большие разницы.
Я пока не собираюсь ставить Disallow: / - я вообще пока что учусь и разбираюсь. Поэтому спасибо за все советы! :wink:
Я не волшебник, я только учусь!
Аватара пользователя
Alice
phpBB 2.0.7
 
Сообщения: 285
Зарегистрирован: 18.03.2007 19:07
Откуда: SPb

Сообщение Герасимов Дмитрий 26.03.2007 3:16

Alice писал(а): вы же не можете знать всего про мой сайт/форум, кто там сидит (может он для трех моих друзей, lol),


Всё верно, возможно. Я администрирую разные форума, и могу с уверенностью сказать, что если в течении долгого времени на форуме нет притока свежей "крови", форум хиреет и общение становится скучным и жидким. Люди постоянно меняются, перестают посещать форум, очень мало людей приходит на много лет. Важен костяк форума, который, составляет обычно мизерный процент общего количества посещений. Но этот костяк устанет друг от друга, если не будет обновления в их рядах. :wink: Как известно, уникальный контент - штука архиполезная и дорогая. (одно из главных правил SEO - уникальный контент). А тут у вас толпы народа бесплатно пишут вам контент каждый день, каждый час, каждую минуту... И закрывать это добро от индексации??? Я, простите, не встречал ещё ситуации, когда это будет оправданно.
Герасимов Дмитрий
phpBB 1.2.0
 
Сообщения: 17
Зарегистрирован: 26.01.2007 15:37

Сообщение Alice 26.03.2007 3:39

Герасимов Дмитрий писал(а):Я администрирую разные форума, и могу с уверенностью сказать, что если в течении долгого времени на форуме нет притока свежей "крови", форум хиреет и общение становится скучным и жидким. <...>

<офф>
Согласна, но это уже все оффтоп, нас накажут. :roll: :wink:
У меня контент на сайте, а форум так - попросили уже, чтоб общаться, вот путь общаются. Мне он в общем-то не нужен был, честно говоря.
В общем, я пока от индексации полностью не собираюсь закрываться, и повторюсь (да не прийдут в ярость админы!), что можно и должно - разные вещи.
P.S. Если что, давайте оффтопить в личке.
</офф>

Уважаемый edgar, скажите пожалуйста, все-таки меня беспокоит этот UNIX. Стандартный txt файл, созданный в блокноте - это правильный файл или что-то надо с ним сделать, переконвертировать? (я как-то с кодировками не сталкивалась)
[Так же этот UNIX нужен для .htaccess (по нему тоже инфу изучаю) - но это другая тема. ]
И еще, Xvost спрашивал про права доступа на robots.txt - думаю, 644 будет ему в самый раз? или?
Я не волшебник, я только учусь!
Аватара пользователя
Alice
phpBB 2.0.7
 
Сообщения: 285
Зарегистрирован: 18.03.2007 19:07
Откуда: SPb

Пред.След.

Вернуться в phpBB-пространство

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 0