Регистрация сайта в Апорте производится со страницы http://catalog.aport.ru/rus/reg/add.ple. Эта страница доступна по ссылке Добавить URL почти с любой страницы Апорта, например, с главной страницы Апорта (ссылка находится в самом низу страницы).
Что нужно и что не нужно добавлять
Сайтом, в понимании Апорта, может являться как целый сервер (например, www.agama.com), так и самостоятельная по содержанию часть сервера (например, www.company.ru/~vasya/). Добавлять следует корень сайта, остальные страницы будут найдены Апортом по ссылкам. Апорт является поисковой системой по российскому интернету, поэтому добавлять в нее следует русскоязычные сайты, а также сайты имеющие непосредственное отношение к российскому интернету. В случае отказа в автоматическом добавлении сайта, что может произойти, например, если робот не найдет на его корневой странице русскоязычного текста, вы можете обратиться с просьбой о добавлении сайта по e-mail addurl@rol.ru Когда сайт появится в результатах поиска
С момента добавления сайта в Апорт до момента его появления в поисковой базе проходит от двух-трех дней до двух недель. В отдельных случаях, например, в случае нестабильной связи с добавленным сайтом, это время может оказаться несколько больше.
2. КАК ОБНОВИТЬ ИНФОРМАЦИЮ ОБ УЖЕ ЗАРЕГИСТРИРОВАННОМ САЙТЕ
Апорт периодически проверяет уже имеющиеся в его базе сайты и приводит свою базу в соответствие с произошедшими там изменениями. Период проверки в значительной степени зависит от конкретного сайта (учитывается его популярность, динамичность обновления по данным собранным апортом при предыдущих заходах на сайт и ряд других факторов).
3. КАК СДЕЛАТЬ, ЧТОБЫ АПОРТ КАЧЕСТВЕННО ПРОИНДЕКСИРОВАЛ САЙТ
Какие документы на сервере индексирует Апорт
Как правило, Апорт индексирует все документы, найденные его роботом по ссылкам на сайте, за исключением документов, в Url которых встречается символ "?" (для них применяются специальные правила, см. об этом ниже). Это правило может не соблюдаться для больших по объему сайтов, а также для сайтов, замеченных в применении спама.
Следует учитывать, что полная индексация сайта может происходить постепенно, а также то, что содержание базы является прерогативой поисковой системы и каких-либо гарантий по индексации (а также сохранению в индексе уже проиндексированных документов) Апорт не дает.
Документы, содержащие в Url символ "?", индексируются апортом выборочно, с использованием квотирования количества таких документов для каждого сайта. Размер квоты вычисляется автоматически в зависимости от ряда условий, в частности от индекса цитируемости сайта, и может, в частности, быть для некоторых сайтов нулевым.
При просмотре содержимого сервера для индексирования Апорт проверяет файл ROBOTS.TXT. Так что вы можете использовать его, чтобы ограничить "деятельность" Апорта на своем сервере. При желании установить селективные ограничения только для Апорта следует использовать в качестве имени робота слово Aport. Также поддерживаются мета таги Robots, позволяющие, в частности, установить правила поведения робота на вашем сайте, даже в случае, если вы не имеете возможности изменять файл robots.txt на сервере.
Какие части документа индексирует Апорт
Апорт — полнотекстовая поисковая система. Это означает, что она индексирует все слова, которые бы увидел на экране человек, просматривая конкретную страницу вашего сервера. В результате любое слово из текста ваших документов может служить критерием последующего поиска. Для документов HTML кроме основного текста документа индексируются также: заголовок документа (TITLE), ключевые слова (META KEYWORDS), описания страниц (META DESCRIPTION) и подписи к картинкам (ALT). Кроме того, Апорт индексирует как принадлежащие документу, тексты гиперссылок на этот документ с других страниц, находящихся, как внутри сайта, так и за его пределами, а также составленные (или проверенные) редакторами описания сайтов из нашего каталога.
4. СОРТИРОВКА РЕЗУЛЬТАТОВ ВЫДАЧИ
Общие принципы
Задача ранжирования результатов поиска
является определяющей с точки зрения качества работы поисковой системы.
Разработка хорошей функции ранжирования весьма непростая задача, в частности,
из-за большой неоднородности ранжируемых документов и из-за попыток
сознательного искажения результатов поиска с помощью поискового спама. Мощным
средством повышения качества ранжирования является учет гипертекстовой структуры
Интернета: ссылочное ранжирование и индекс цитируемости позволяют (хотя и не
всегда) отличить качественный контент от сходного по содержанию “мусора”, а
также (что особенно важно для владельцев сайтов) оригинальные материалы от их
копий. Однако и здесь приходится иметь дело с теми же проблемами:
неоднородностью ссылочной структуры и ее сознательным искажением
спамерами.
Ещё одним важным средством повышения релевантности является
использование информации из каталога Апорта, которая обладает высокой степенью
достоверности, так как составлена или проверена профессионально подготовленными
редакторами.
Принципиальным моментом в ранжировании результатов поиска в
Апорте является стремление к учёту максимального количества критериев
ранжирования в их взаимосвязи. В частности, заметное преимущество получают
документы, имеющие высокий вес сразу по нескольким независимым критериям
(например, по частотности слов запроса в тексте и ссылочному
ранжированию).
Ранжирование производится исключительно автоматическими
методами, мы не осуществляем специальной корректировки результатов поиска для
каких-либо запросов или сайтов.
Критерии
ранжирования
Апорт применяет
следующие критерии при ранжировании документов:
частота и взаимное расположение слов запроса в тексте документа;
размер документа;
присутствие и взаимное расположение слов запроса в выделенном (размером
шрифта или html-тегами <b>, <strong>, <h1>...<h6>)
тексте;
присутствие и расположение слов запроса в заголовке документа;
присутствие и расположение слов запроса в мета-тегах "keywords" и
"description";
присутствие и расположение слов запроса в ссылках на ранжируемый документ и
авторитетность этих ссылок;
присутствие и взаимное расположение слов запроса в названии и описании сайта
в каталоге Апорта (учитывается при вычислении веса главной страницы сайта);
взвешенный индекс цитирования документа;
количество страниц сайта, имеющих высокую релевантность запросу.
Результирующий вес документа рассчитывается по специальному алгоритму,
различным образом учитывающему сочетания разных критериев.
Частотные
характеристики
Учитывается как
абсолютная, так и относительная частота слова в тексте документа.
И для
той и для другой величины существуют пороговые значения, после достижения
которых дальнейшее увеличение частоты не влияет на вес документа. Для небольших
документов, размер которых (в словах) меньше заданной константы, относительная
частота рассчитывается не от их фактического размера, а от этой
константы.
В заголовке, мета-тегах, а также в названии и описании сайта
из каталога частота слов не учитывается.
Ссылочное
ранжирование
Алгоритмы
ссылочного ранжирования в Апорте учитывают не более одной ссылки с каждого
домена второго уровня для отдельного запроса (то есть, для разных запросов могут
учитываться разные ссылки).
Вес каждой ссылки зависит (помимо ее текста)
от взвешенного индекса цитирования ссылающейся страницы.
Взвешенный индекс
цитирования
Алгоритм вычисления
взвешенного индекса цитируемости является модификацией классического алгоритма
PageRank. В качестве одной из наиболее существенных особенностей следует
отметить, что учитывается не более одной ссылки на документ с каждого домена
второго уровня.
Индексом цитирования сайта считается взвешенный индекс
цитирования страницы, самый высокий среди всех страниц сайта (в большинстве
случаев это бывает взвешенный индекс цитирования главной страницы сайта).
Мета-теги "keywords" и
description"
Ключевые слова
(meta keywords) учитываются Апортом даже в случае их отсутствия в тексте
документа. Индексируется не более 16 ключевых слов для каждого документа.
Мета-тег description также учитывается при ранжировании, однако, в большинстве
случаев, имеет очень небольшой вес.